V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
ethusdt
0.01D
V2EX  ›  程序员

常用的大模型 api 都用哪些模型?

  •  
  •   ethusdt ·
    FaiChou · 10 小时 16 分钟前 · 469 次点击
    对话类的(不考虑 tts/生图/语音识别),平时用 api 比如翻译/aicommit 这种简单场景,会使用 deepseekv3/mimo-v2-flash/gpt-4.1-mini/qwen3-32b 等,这些模型访问快,消耗低。

    另外是代码模型,会使用 gpt-5.2-pro/claude-opus-4.5/glm-4.7/minimax-2.1/gemini-3-pro 等。

    再者在 cherry-stuido 中用的对话类的,基本就是 deepseekv3 了。

    再如果想让 ai 联网搜索做对比推荐,会直接使用网页版 gpt/gemini/grok 等,不会使用 api 。

    所以我好奇使用 api 推理模型的人多吗?比如 gpt 那些 o1/o3 等模型,我一次也没用过。
    4 条回复    2026-01-12 23:33:11 +08:00
    sworld233
        1
    sworld233  
       9 小时 45 分钟前
    有点没搞明白你的问题,我尝试回答一下:

    1. 常用的大模型 api 都用哪些模型
    一般来说各家都不错,看你喜好和消费意愿吧,不在意开销的话我会购买 openrouter 上面的额度,从而使用各家的模型,在近期主要使用 gemini-3-flash 和 gpt-5.2

    2. 对话类的日常使用均根据速度(g3f)、难度(gpt)和识图(g3f)进行选择

    3. 翻译模型比较随意,一般购买官方 deepseek api (在外),或本地部署 qwen 4b (在家)

    4. 代码模型:后端、复杂任务使用 gpt-5.2 high ,前端任务使用 gemini 3 pro ,简单任务选用 claude 系列

    5. 联网搜索你说的非常正确,使用网页版这三家都还可以,其中 gemini 表现较差

    6. 使用 API 推理模型的人多吗?我也不知道,我自己经常使用,我使用的 5.2 和 g3f 始终开启 high 的推理等级,以前 o3 降价的时候基本上只使用 o3. 另外,在写代码时也应该有很多人使用 API 调用推理模型,因此最后这个问题让我有些疑惑
    ethusdt
        2
    ethusdt  
    OP
       9 小时 24 分钟前 via iPhone
    @sworld233 就是感觉普通问答完全不需要推理,需要推理的都是写代码场景,但写代码主要用那几个顶端的,最主要就是 opus4.5 ,所以感觉 o3 这些模型应该很少人使用,毕竟 o3 价格也不菲,真有需要 o3 的场景选择去官方网页上更合适。

    所以好奇是不是真有人用 o1/o3 这些模型,场景又是什么。
    sworld233
        3
    sworld233  
       8 小时 51 分钟前
    @ethusdt #2 那我可能回答不了你,因为除去代码工具中的使用,其余时候我处理的也是类似的工作,类似架构设计、产品文档这类,我的主要场景基本上只使用推理模型,也因此在本地客户端( CherryStudio 和 Kelivo )里面使用它们,当时主要是高智力的模型太少了。
    我认识一些生物领域的朋友,他们基本上只使用我提供的 Gemini3Pro (通过 openwebui ),不过我认为这个效果应当不如官方网页。
    syferie
        4
    syferie  
    PRO
       8 小时 6 分钟前
    现在用 Gemini 比较多,日常简单点的 Gemini3Flash ,复杂点的 Gemini3Pro 。虽然两个都是推理,但是 3Flash 一般只需要两三秒。跟其他非思考模型相差不大。3Pro 推理开最大也只是二三十秒,并不用等很久。

    GPT 科研能力比较强,读论文搞科研的话就是 GPT 官网用 5.2 Thinking 。

    写代码就直接上 ClaudeCode 了。

    其实现在哪家的旗舰模型都是推理模型。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1214 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 23:39 · PVG 07:39 · LAX 15:39 · JFK 18:39
    ♥ Do have faith in what you're doing.