
1
imik 3 月 25 日
幸亏没手贱花几十块钱试一下
|
2
weixiaoyun 3 月 25 日
op 图中是什么软件统计的?
|
3
onedge 3 月 25 日
实测不如 m2.5 的智力,我感觉 2.7 路子走偏了,太往工具链方向了,计划,复盘,疑难杂症攻坚能力真的不如 m2.5 我已经用回 2.5 (做执行和日常非编程任务)了
|
4
mogutouer OP @weixiaoyun #2 ccusage 统计的数据,写了个 chrome 插件方便自己看
|
5
onedge 3 月 25 日
可以试试我自己 vibe 的工具,实时对话 review ,没办法消除但可以降低一定的幻觉,总体上对输出是有提升的
https://github.com/timwuhaotian/the-pair 欢迎 contribute |
6
wengjin456123 3 月 25 日
我基本全用 codex + copilot pro+的 claude 模型,kimi2.5 + GLM 用来打辅助任务,国产执行力 kimi 和 glm 好一点,minimax 模型太小
|
7
ktyang 3 月 25 日
vps 固定 ip 搭梯子么?还是什么其他的防风操作?
|
9
KisekiRemi 3 月 25 日
确实如此,刚好你说的都用过,体感一致(笑)
|
10
Tzu 3 月 25 日
@wengjin456123 能细说下怎么个操作流程吗
|
11
cokey 3 月 25 日 MiniMax 2.5 就是蒸馏版 Claude 4.5 sonnet ,本来就更弱
MiniMax 2.7 就是 2.5 的基础上加了点 工具链 的训练数据搞出来的,智商没有提升 |
12
mogutouer OP |
13
leegradyllljjjj 3 月 25 日
有没有便宜量大的
|
14
JoeDH 3 月 25 日
国产最强的就是 kimi k2.5 ,但是经过 cursor 用大量的用户数据 RL 训练出来的 composer 2 比 claude opus 4.6 还弱一点,国产模型提升空间还很大
|
15
ProphetN 3 月 25 日
230B 的总参数,10B 的激活参数。这模型有尝试的必要?
|
16
gosidealone 3 月 25 日
@JoeDH kimi2.5 比 glm5 强吗
|
17
yanguangs 3 月 25 日
用了 3 天, 实际效果明显不如 minimax m2.5
轴的厉害, 已经到我都知道原因, 只是懒得写代码,直接知道模型去写 笨到累心的程度. |
18
Sezxy 3 月 25 日
你就说它快不快吧
|
19
qxmqh 3 月 25 日
请用真 AI 。 国内这帮没有一个能打的,kimi2.5 也是个半吊子。国内这帮 各种分数排名高高的,真实使用起来简直无语。全是假的。
|
20
maoqiucute 3 月 25 日
信国产模型的这辈子有了
|
21
jeeyong 3 月 25 日
我是冲着 100t/s 去的. 极速 plus 版, 199 那个.
实际后半夜,大约在 80-90t/s 晚上 6-8 点在 60t/s 我发现全网没有测试他速度的人啊...就是是否真的能到 100t/s |
23
ggBalloon 3 月 25 日
固定是什么 IP ?机房 IP ?
|
24
nabanbaba 3 月 25 日
想着跑 openclaw ,弄个国产模型 codingplan 去跑。有推荐的吗。。。
|
27
106npo 3 月 25 日 via Android
@jeeyong 这个速度是从首 token 开始算的,但它不保证首 token 啥时候出来 🤣 只要不返回首 token 就没开始算速度
|
28
tlerbao 3 月 26 日
国产都是狗屎,我在另外一个帖子说国产不行,几个人还 tm 不乐意,天天就 tm 知道赢麻了,又 tm 赢麻了
|
31
MorningBOBO 3 月 26 日
@yanguangs 非常同意你的说法
|
33
lxsasmadaocn 3 天前
2.7 老是鬼打墙,自顾自钻牛角尖,还会自作主张,和国外模型差多了,唯一优点就是快
|
34
dobelee 21 小时 51 分钟前
MiniMax 你看他便宜,实际智商堪忧,解决很多简单问题都要循环几遍,消耗更多 token 。
|