V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
coconutwater
V2EX  ›  程序员

小米 mino v2 flash 套壳谷歌模型

  •  
  •   coconutwater · 4 小时 36 分钟前 · 3881 次点击

    https://i.imgur.com/F4y0Bsk.png

    所以应该是套壳吧,提示词都没写好

    第 1 条附言  ·  4 小时 5 分钟前
    经过 v 友提醒,重新查了相关资料,确实是数据清洗的时候出问题的概率比较大,不能直接说是套壳:
    "目前的开源或自研模型,为了提升逻辑和对话能力,通常会使用“蒸馏法”——即使用更强的模型( Gemini 、OpenAI )生成的优质对话数据来训练自己的小模型。小米在训练 MiMo v2 时,可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"
    第 2 条附言  ·  3 小时 40 分钟前
    确实是 op 的问题,标题党了,新进来的建议直接退出,实在看不顺眼的点个 block 吧,实在抱歉。
    60 条回复    2025-12-25 13:55:37 +08:00
    orrinex
        1
    orrinex  
       4 小时 33 分钟前
    大模型本来就是这样的吧......
    Kale
        2
    Kale  
       4 小时 33 分钟前
    蒸馏。。
    Hilong
        3
    Hilong  
       4 小时 32 分钟前
    大模型都出来多久了还能问出这种问题.他们俩是一个东西吗,那个推理速度也不是一个层级的啊
    coconutwater
        4
    coconutwater  
    OP
       4 小时 32 分钟前
    @orrinex #1 试了其他几家的,都没有出现这种问题。并且目前依然可以复现"你爸爸是谁"
    si1enceneo
        5
    si1enceneo  
       4 小时 29 分钟前   ❤️ 11
    快 2026 年了还在问这种问题,挺无语的
    coconutwater
        6
    coconutwater  
    OP
       4 小时 29 分钟前
    smallparking
        7
    smallparking  
       4 小时 29 分钟前 via Android   ❤️ 3
    闭源也能套壳吗?我们小米太牛逼了
    miniliuke
        8
    miniliuke  
       4 小时 28 分钟前   ❤️ 11
    谷歌又没开源,怎么套
    tsja
        9
    tsja  
       4 小时 27 分钟前
    和 DeepSeek 一样是基于主流大模型训练和蒸馏的,DeepSeek 刚出来的时候也一堆人问你是不是 openai ,也能得到肯定的回答。不管技术路径如何,小米赶紧基于此把弱智的小爱提升一下 AI 能力吧
    Yjhenan
        10
    Yjhenan  
       4 小时 26 分钟前
    数据不都是蒸馏出来吗还是怎么着,反正各大模型都有这毛病
    cryptovae
        11
    cryptovae  
       4 小时 25 分钟前
    小米罗福莉前 DeepSeek 研究员,加上上面说的,还不懂吗
    yhxx
        12
    yhxx  
       4 小时 25 分钟前   ❤️ 1
    @miniliuke 哈哈哈哈 iframe
    keethebest
        13
    keethebest  
       4 小时 24 分钟前
    很正常啊 训练数据问题 以前 gimini 还说自己是百度的模型呢
    brazz
        14
    brazz  
       4 小时 24 分钟前
    好像没复现出来 https://aistudio.xiaomimimo.com/
    iorilu
        15
    iorilu  
       4 小时 24 分钟前
    小米要能有 flash 水平, 早吹起来了
    coconutwater
        16
    coconutwater  
    OP
       4 小时 23 分钟前
    @brazz #14 我是直接接入的 api 调用
    dhb233
        17
    dhb233  
       4 小时 20 分钟前
    哪怕看你的图,也说明不了是谷歌的模型啊,transformer 本来就是所有 AI 的基础啊。
    coconutwater
        18
    coconutwater  
    OP
       4 小时 18 分钟前
    经过 v 友提醒,重新查了相关资料,确实是数据清洗的时候出问题的概率比较大,不能直接说是套壳:
    "目前的开源或自研模型,为了提升逻辑和对话能力,通常会使用“蒸馏法”——即使用更强的模型(如 Google 的 Gemini 、OpenAI 的 GPT-4 )生成的优质对话数据来训练自己的小模型。小米在训练 MiMo v2 时,可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"
    Gondolier
        19
    Gondolier  
       4 小时 15 分钟前
    @tsja 这倒是真的。同样的苹果的 Apple Intelligence 也很弱智
    tanranran
        20
    tanranran  
       4 小时 9 分钟前   ❤️ 1
    开源的东西,以小米的风评,要是真套壳,早就全网讨伐了
    Lisa9527
        21
    Lisa9527  
       4 小时 3 分钟前
    还没训练彻底,半成品吧
    MartinYANG06
        22
    MartinYANG06  
       4 小时 2 分钟前
    开始的时候谷歌的模型也说自己是千问、llama 、chatgpt , 说明小米模型的训练数据里用过其他模型的蒸馏数据,然后模型自我认知没有矫正,一开始 Gemini 也是这样的, 兄弟发帖之前最好先百度或者谷歌一下好吧。
    imokkkk
        23
    imokkkk  
       4 小时 2 分钟前
    怎么还有人问这种问题,人家上市公司,小米又自带流量 buff ,你觉得可能吗
    fkdtz
        24
    fkdtz  
       3 小时 59 分钟前
    @yhxx 真就字面意思
    majiajia
        25
    majiajia  
       3 小时 56 分钟前
    @coconutwater #6 这不是你一直在提雷军吗
    cyp0633
        26
    cyp0633  
       3 小时 55 分钟前
    有这么好的事?小米套出来 Gemini 的 API 给大家免费用?那赶紧冲啊
    xFrye
        27
    xFrye  
       3 小时 53 分钟前   ❤️ 1
    实在搞不懂为啥有些人看到个新模型,第一时间是问他 ai 的爸爸是谁之类的无聊问题
    boringwheat
        28
    boringwheat  
       3 小时 52 分钟前   ❤️ 10
    建议拉黑这类标题党,如果你不确定,你可以问“为什么 mino v2 flash 会自称来自 Gemini ?”而不是一开始起一个耸人听闻的标题,再假模假样的解释,因为这种行为在我眼里只有引战的效果
    issakchill
        29
    issakchill  
       3 小时 44 分钟前   ❤️ 1
    不止见过一次这样的言论了。。都快 2026 了 还用“你是谁”来让模型回答自己是啥模型。。
    MIUIOS
        30
    MIUIOS  
       3 小时 28 分钟前
    v2ex 已经不是技术论坛了,纯水论坛,搬屎大论坛🤭,啥人都可以搬屎上来
    MIUIOS
        31
    MIUIOS  
       3 小时 26 分钟前
    现在的模型基本都做蒸馏,甚至有可能还共用一套数据集,我每次看到小白去问 ai 你是谁你是什么模型这种问题就觉得好笑。

    LLM 模型根本没有自己的思维,他只是一个生成式的 AI ,讲大白话就是组词器,前词组后词,词哪里来,不也是训练的数据集。
    zhengluqing13
        32
    zhengluqing13  
       3 小时 24 分钟前 via Android
    评论区一堆神人懂王
    MIUIOS
        33
    MIUIOS  
       3 小时 15 分钟前
    @zhengluqing13 讲讲你的见解
    coconutwater
        34
    coconutwater  
    OP
       3 小时 12 分钟前
    IlIl
        35
    IlIl  
       2 小时 59 分钟前   ❤️ 1
    雷子大善人 免费给我们用 Gemini 的 api 雷门🙌
    xeneizes
        36
    xeneizes  
       2 小时 57 分钟前
    真套壳的只有盘古套壳 qwen 吧,毕竟这个是内部人员爆料的
    lijintapx
        37
    lijintapx  
       2 小时 54 分钟前   ❤️ 2
    你的求知精神值得肯定,但是探索过程有些低能(客观描述
    argentea
        38
    argentea  
       2 小时 51 分钟前   ❤️ 2
    蒸馏其它大模型的数据没啥好喷的,也算是一种节约资源,大家都从头开始训练大模型的话先不说显卡和储存要涨价多少,光电就不知道要多耗费多少
    lijintapx
        39
    lijintapx  
       2 小时 50 分钟前
    @miniliuke 雷子一个心灵控制抓出 Google 老总的脑子强制他们交出代码完成套壳。
    ninja543
        40
    ninja543  
       2 小时 45 分钟前
    套不套不知道,但是论坛里面米粉蛮多的
    izToDo
        41
    izToDo  
       2 小时 44 分钟前   ❤️ 2
    @ninja543 你和之前帖子里说果粉多的打一架吧,话都被你们说完了 😋
    DeYiAo
        42
    DeYiAo  
       2 小时 43 分钟前   ❤️ 1
    v 站上 v 友还算是有头脑可以反思的,看到好几个黑小米的帖子了,最后 lz 都能承认表示论据确实有问题。 很多年龄大的社区里,天天转发各种无脑黑的信息,解释了还不听,反而是:就算我转的是谣言,小米就没问题吗?
    nrtEBH
        43
    nrtEBH  
       2 小时 38 分钟前
    结婚 3 个月就生娃 能正常吗
    talk is cheap , show me your arXiv link
    brookegas
        44
    brookegas  
       2 小时 38 分钟前
    看到现在 Mi 被围殴得狼狈不堪,拍马赶来踩一脚蹭下热度,没想到翻车了 😏
    jonty
        45
    jonty  
       2 小时 30 分钟前
    我不会 b 你,但是我会给你加个 tag 。
    horizon
        46
    horizon  
       2 小时 11 分钟前
    2023 年你有这个疑问还情有可原
    但是现在 2025 了。。。
    dabinDev
        47
    dabinDev  
       2 小时 11 分钟前
    mdzz
    1351161572
        48
    1351161572  
       2 小时 1 分钟前
    大模型月经贴
    javapythongo
        49
    javapythongo  
       2 小时 0 分钟前
    是不是被某家的千亿营销洗脑了
    cheese
        50
    cheese  
       1 小时 43 分钟前
    技术论坛,就算不做大模型,也好歹跟上技术认知。2025 年了,连蒸馏都没听过,还在问你爸爸是谁。
    在小米 AI 出来前你真的用过 AI 吗?
    离奇的好笑
    ShadowPower
        51
    ShadowPower  
       1 小时 17 分钟前
    2023 年那会还说谷歌模型抄袭百度文心一言呢

    一些小知识:
    LLM 模型训练出来之后并不知道自己是谁训练的,自己叫什么名字
    通过系统提示词,或者监督微调,可以让模型知道自己是谁训练的,叫什么名字
    上面那一步操作,会影响模型在其他方面的性能
    dragondove
        52
    dragondove  
       1 小时 5 分钟前
    怀疑楼主是不是程序员了,怎么感觉连开源都没接触过,难绷
    skiy
        53
    skiy  
       59 分钟前
    估计 op 也没啥有用的知识分享了。已 block 。
    ccpp132
        54
    ccpp132  
       54 分钟前
    这甚至都不能说明他用了 gemini 做蒸馏。因为训练大模型也不会特意说训练材料里加入你是谁,是谁训练的。你问大模型,他不知道自己是谁,他只会从语料里找一个会训练大模型的来编回答
    kylesean
        55
    kylesean  
       51 分钟前
    这个模型很烂,工具调用都调用不明白,在我的 agent 里,会把 skills 解析成工具调用,导致输出错误的 xml 格式。其他模型都测试了国产的,gpt 的,都没有,就它有。
    shine1996
        56
    shine1996  
       37 分钟前
    v2 人均大模型开发专家
    maomaosang
        57
    maomaosang  
       33 分钟前   ❤️ 1
    「实在抱歉」
    给楼主点赞,楼主讲究人儿,知错能道歉。
    royzxq
        58
    royzxq  
       11 分钟前
    小米要是真套壳你猜第二天千亿营销费用是不是已经上了
    JYii
        59
    JYii  
       6 分钟前   ❤️ 1
    你对这个问题认知不足,这是小问题。你能道歉,这根本不是问题了。
    tinydancer
        60
    tinydancer  
       5 分钟前
    @shine1996 这种问题属于大模型入门级问题,并不需要大模型专家才能理解和回答,能问出这种问题说明连大模型的门都没有摸到
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5174 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 06:01 · PVG 14:01 · LAX 22:01 · JFK 01:01
    ♥ Do have faith in what you're doing.