常用的大模型 api 都用哪些模型？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

对话类的（不考虑 tts/生图/语音识别），平时用 api 比如翻译/aicommit 这种简单场景，会使用 deepseekv3/mimo-v2-flash/gpt-4.1-mini/qwen3-32b 等，这些模型访问快，消耗低。

另外是代码模型，会使用 gpt-5.2-pro/claude-opus-4.5/glm-4.7/minimax-2.1/gemini-3-pro 等。

再者在 cherry-stuido 中用的对话类的，基本就是 deepseekv3 了。

再如果想让 ai 联网搜索做对比推荐，会直接使用网页版 gpt/gemini/grok 等，不会使用 api 。

所以我好奇使用 api 推理模型的人多吗？比如 gpt 那些 o1/o3 等模型，我一次也没用过。

DeepSeekV3

gpt-4.1-mini

qwen3-32b

4 条回复 • 2026-01-12 23:33:11 +08:00

sworld233

9 小时 45 分钟前

有点没搞明白你的问题，我尝试回答一下：

1. 常用的大模型 api 都用哪些模型
一般来说各家都不错，看你喜好和消费意愿吧，不在意开销的话我会购买 openrouter 上面的额度，从而使用各家的模型，在近期主要使用 gemini-3-flash 和 gpt-5.2

2. 对话类的日常使用均根据速度(g3f)、难度(gpt)和识图(g3f)进行选择

3. 翻译模型比较随意，一般购买官方 deepseek api （在外），或本地部署 qwen 4b （在家）

4. 代码模型：后端、复杂任务使用 gpt-5.2 high ，前端任务使用 gemini 3 pro ，简单任务选用 claude 系列

5. 联网搜索你说的非常正确，使用网页版这三家都还可以，其中 gemini 表现较差

6. 使用 API 推理模型的人多吗？我也不知道，我自己经常使用，我使用的 5.2 和 g3f 始终开启 high 的推理等级，以前 o3 降价的时候基本上只使用 o3. 另外，在写代码时也应该有很多人使用 API 调用推理模型，因此最后这个问题让我有些疑惑

ethusdt

9 小时 24 分钟前 via iPhone

@sworld233 就是感觉普通问答完全不需要推理，需要推理的都是写代码场景，但写代码主要用那几个顶端的，最主要就是 opus4.5 ，所以感觉 o3 这些模型应该很少人使用，毕竟 o3 价格也不菲，真有需要 o3 的场景选择去官方网页上更合适。

所以好奇是不是真有人用 o1/o3 这些模型，场景又是什么。

sworld233

8 小时 51 分钟前

@ethusdt #2 那我可能回答不了你，因为除去代码工具中的使用，其余时候我处理的也是类似的工作，类似架构设计、产品文档这类，我的主要场景基本上只使用推理模型，也因此在本地客户端（ CherryStudio 和 Kelivo ）里面使用它们，当时主要是高智力的模型太少了。
我认识一些生物领域的朋友，他们基本上只使用我提供的 Gemini3Pro （通过 openwebui ），不过我认为这个效果应当不如官方网页。

syferie

PRO

8 小时 6 分钟前

现在用 Gemini 比较多，日常简单点的 Gemini3Flash ，复杂点的 Gemini3Pro 。虽然两个都是推理，但是 3Flash 一般只需要两三秒。跟其他非思考模型相差不大。3Pro 推理开最大也只是二三十秒，并不用等很久。

GPT 科研能力比较强，读论文搞科研的话就是 GPT 官网用 5.2 Thinking 。

写代码就直接上 ClaudeCode 了。

其实现在哪家的旗舰模型都是推理模型。