V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
longxinglink

讲讲家里云新人部署求职项目用的大模型 API 供应商:主力 NVIDIA NIM + 备用 Ollama + OpenAI Codex 调试,含 glm-5.1、gemma4:31b、minimax-m2.7,零成本不爆账单

  •  
  •   longxinglink · 8 天前 · 3478 次点击

    1. NVIDIA NIM API (包含网页调用,API )

    项目 详情
    注册地址 https://build.nvidia.com/settings/api-keys
    Base URL https://integrate.api.nvidia.com/v1
    模型数量 约 187 个开源模型(含 gemma-4-31b 、GLM5 等)
    并发限制 支持 40 并发,几乎无限量
    注册门槛 域名邮箱即可,无需验证手机号、无需绑卡,gmail 邮箱需要验证手机号

    作为我的大模型主要供应商,SLA 一直很稳定,高并发但是模型比较老旧,支持境内访问


    2. Ollama Cloud API ( Free 不包含网页调用,仅 API )

    项目 详情
    地址 https://ollama.com/
    Base URL https://ollama.com/v1
    模型数量 36 个开源模型(含 glm-5.1 、gemma4:31b 、minimax-m2.7 )
    注册门槛 gmail 注册无需手机号、无需支付方式
    主要限制 Free 计划同一时间每个 API Key 只能请求同一个模型

    作为我的大模型备用供应商,SLA 一直很稳定,可惜量少不支持高并发,支持境内访问


    openclaw 我用的这个,用于家里云调试非常好用( Claude 不要用于 openclaw ,会封号) 美/新/英等国家,新注册账户送一个月 Plus 或者 Business ,但是需要绑定支付方式

    OpenAI Codex ( Free 计划包含网页调用 cli ,API 需额外付费)

    项目 详情
    地址 https://openai.com/codex/
    可用模型 gpt-5.4 等(含 xhigh 思考级别)
    Free 计划额度 限制2.2 美元 / 5 小时(约为 Plus 计划的一半)
    注册门槛 临时域名邮箱或者 gmail 即可,风控很友好,这个无需多言
    第 1 条附言  ·  4 天前
    NVIDIA API 新增包括 z-ai/glm-5.1 、minimaxai/minimax-m2.7 等四款模型
    minimaxai/minimax-m2.7
    nvidia/ising-calibration-1-35b-a3b
    nvidia/nemotron-3-content-safety
    z-ai/glm-5.1
    33 条回复    2026-04-21 12:52:21 +08:00
    irvinghua
        1
    irvinghua  
       8 天前
    nvidia 是不是改了规则,我按照你的链接点进去注册,提示没有权限使用 API KEY ,提示文字:“Please verify your account to get API access.” 输入国内手机号验证,在输入栏校验死活不通过。而且看了下模型列表,只查到有 glm-5 ,没有 glm-5.1 啊
    irvinghua
        2
    irvinghua  
       8 天前
    @irvinghua 终于通过了,那个手机号校验输入栏设计得很智障,要先选国家和地区,再输入手机号。选定了国家,国家区号前缀居然不会跟着联动改变,比如选 China ,输入栏国家区号依然是+1 ,要手动改成+86 ,我刚刚手动改成+086 校验一直通不过,非得是+86 。
    cvbnt
        3
    cvbnt  
       8 天前
    NVIDIA NIM 最好补充一下,要搭配 CC SWITCH 里开启代理才能在 Claude code 里用
    rebnonu
        4
    rebnonu  
       8 天前
    用 opencode 。CC SWITCH 配置好了直接用
    CareiOS
        5
    CareiOS  
       8 天前
    免费使用?
    longxinglink
        6
    longxinglink  
    OP
       7 天前
    @irvinghua NVIDIA NIM API 使用域名邮箱不需要手机号验证,使用 gmail 邮箱需要手机号验证,ollama 才有 glm-5.1 和 minimax-m2.7 这在文中有写

    @cvbnt 开源模型性能有限,没有为 Claude code 工程编码场景优化设计,建议使用 Codex Free 计划( https://openai.com/codex/)或订阅 Claude.ai ,,第三方转接层风险请自行评估。

    @CareiOS 对,我用的都是三家的免费计划
    BD8NCF
        7
    BD8NCF  
       7 天前
    NIM 使用域名邮箱也要手机收短信验证,下午试了。
    之前看到有人说 gemma4 可以免费用,看了下,gemma4 要收费的
    longxinglink
        8
    longxinglink  
    OP
       7 天前
    @BD8NCF NVIDIA NIM API 注册获得的 API 里 /models 有 NVIDIA NIM API ,且全程没有绑定任何支付方式,NVIDIA NIM API 并没有付款通道,请问 V 友是在哪里看见 “gemma4 要收费的”
    NVIDIA NIM API 我使用的 xxx.ggff.net 二级域名邮箱和 xxx.de 域名邮箱 都没有复现 V 友说的 “NIM 使用域名邮箱也要手机收短信验证” ,V 友的说法可以复现吗?
    BD8NCF
        9
    BD8NCF  
       7 天前
    @longxinglink
    我用我自己的域名,通过 cf 转 gmail 的邮箱,类似 [email protected] 这样的,确定要手机短信验证,短信内容有“通达文”字样,似乎是国内一家公司代发的。我看手机上去年也收到这个号的短信,不知道是哪家发的验证码,肯定不是 nvidia ,大概他们用的同一家的短信服务。

    gemma4 要收费的意思,并不是说 nvidia 直接收费,是 nvidia 不免费提供,你在 free endpoint 里面找不到。应该是 nvidia 的几家合作商提供的收费主机。

    你看 google 家的模型,
    https://build.nvidia.com/models?filters=publisher%3Agoogle
    gemma-4 就没有 Free EndPoint 字样,只是 Downloadable

    gemma-4-31b-it 部署环节,你就可以看到费用了:
    https://build.nvidia.com/google/gemma-4-31b-it/deploy
    longxinglink
        10
    longxinglink  
    OP
       7 天前
    @BD8NCF
    是否需要手机号验证似乎有他们自己的一套风控逻辑?

    https://build.nvidia.com/settings/api-keys 里生成获得的 key 可以用 gemma-4-31b-it 以及其他模型,

    你说的 https://build.nvidia.com/google/gemma-4-31b-it/deploy 是托管在第三方服务商比如 Bitdeer AI 是需要额外收费
    BD8NCF
        11
    BD8NCF  
       7 天前
    @longxinglink 是我搞错了。他家提供的 api 可以使用 key 直接访问就 ok 了。我以为他家是提供 docker 给你部署然后再访问你自己部署的模型。
    MorningBOBO
        12
    MorningBOBO  
       7 天前
    ollama glm5.1 要收费了 model is experiencing high volume. while capacity is being added, a subscription is required for access: ollama
    liuxue
        13
    liuxue  
       6 天前 via iPhone
    ollama 我尝试了注册,发现用 gmail 也要手机号了
    longxinglink
        14
    longxinglink  
    OP
       4 天前
    @MorningBOBO NVIDIA API 新增包括 z-ai/glm-5.1 、minimaxai/minimax-m2.7 等四款模型,nvidia 免费了
    MorningBOBO
        15
    MorningBOBO  
       4 天前
    @longxinglink 好的,谢谢告知。
    imqiyue
        16
    imqiyue  
       2 天前
    感谢,nvidia 现在上 glm5.1 了
    okface
        17
    okface  
       2 天前
    nvidia 的手机号验证过不了,用的 CF 域名邮箱
    longxinglink
        18
    longxinglink  
    OP
       2 天前
    @okface 老老实实验证手机号吧,一个手机号可以多次验证,实测同一个+44 可以验证 5 次以上
    ycxzfforever
        19
    ycxzfforever  
       2 天前
    NVIDIA 验证的时候提示:
    This phone number has exceeded limits, please try a different phone number or try again later.
    longxinglink
        20
    longxinglink  
    OP
       2 天前
    @ycxzfforever 被验证太多次(几十上百)或者运营商在 nvidia 黑名单内
    Oo0
        21
    Oo0  
       2 天前
    用了下 glm5.1,就是有一丢丢慢,当然免费不能奢求太多
    tinola
        22
    tinola  
       2 天前
    @ycxzfforever 同样,换了几个都是这样。
    njmaojing
        23
    njmaojing  
       2 天前
    谢谢 OP ,不过 nvidia 的 glm5.1 目前是真慢....
    qf19910623
        24
    qf19910623  
       2 天前
    nvidia 要手机号验证,然后验证码又发不出去,一直显示手机号受限制
    yshan
        25
    yshan  
       2 天前
    手机号验证不了,换了几个号都不行
    https://forums.developer.nvidia.cn/t/86-exceeded-limits/28664/65

    官方论坛上也有人报同样的问题
    longxinglink
        26
    longxinglink  
    OP
       2 天前
    @yshan 好像被注册机撸羊毛党搞炸了,我也没法注册
    longxinglink
        27
    longxinglink  
    OP
       2 天前
    @yshan 好像又好了,美国 IP ,接码写+44 xxxx ,很卡但是勉强通过了一个,验证手机号验证了半天
    iorilu
        28
    iorilu  
       2 天前
    nvidia 是一分钟 40 次, 怎么可能 40 并发
    kingwang
        29
    kingwang  
       1 天前
    别浪费时间了,程序员拿那么高的工资这点钱不想出。NVIDIA 的 api 基本上是废的,响应都是分钟级的
    default996
        30
    default996  
       1 天前
    在 cc-switch 中配置了,各种问题……
    gzlock
        31
    gzlock  
       1 天前
    使用 google vioce 验证手机号时,出现以下错误
    The phone number you provided is invalid, please try again.
    yshan
        32
    yshan  
       1 天前
    @longxinglink 有好用的接码平台吗
    longxinglink
        33
    longxinglink  
    OP
       1 天前   ❤️ 1
    @yshan 这个论坛能讲吗 hh ?有一个 0.07 美元,最低充值 6.8 人刀的,搜 5sim
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3410 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 76ms · UTC 12:26 · PVG 20:26 · LAX 05:26 · JFK 08:26
    ♥ Do have faith in what you're doing.