用开源模型折腾个知识库（RAG)有必要没？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

写代码。现在都是闭源模型一把梭。。遇到错误了总结个 skill 。反正也挺好用。
但是写鸿蒙这种就错误多一些，需要手动查文档之类的（虽然闭源也会差，但总感觉查准确率差一些），修起来费点时间。
有必要折腾个这种玩意嘛？
需求就是配合闭源的去完成工作。还是说继续闭源一把梭算了。。

9 条回复 • 2026-04-09 14:51:12 +08:00

whiteshh

3 小时 22 分钟前

没必要

cryptovae

3 小时 4 分钟前

没必要，
我是直接弄个 skill ，让模型帮总结成 md ，review 好后弄成博客
这些 md 直接弄给给模型当做知识库
目录加文件名就是天然的 RAG

frantic

1 小时 52 分钟前

参考下这个: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f 核心思路是文档数量不是特别多的场景下，用 LLM 来做

murmur

1 小时 47 分钟前

骗你的，鸿蒙文档也一堆坑，我遇到过，异步方法不说明，害得我调了好久才发现是文档没写明白

metaquant

1 小时 24 分钟前

知识库方面，感觉 ima 已经完全可以覆盖需求了，这篇文章挺有道理：

https://mp.weixin.qq.com/s/gjf5m6F_I6jI9mPvnm0SGg

hqgdyf

1 小时 10 分钟前

@metaquant 就是云端存储，后面如果有很合适的工具，迁移成本非常高。用过很多，目前是 obsidian+git 仓。就是需要自己整理，但是数据主权在自己手里。

YanSeven

1 小时 7 分钟前

@metaquant 云端的适合工作，公司的数据爱存哪存哪，私人的还是数据在自己这里好一点，obsidian+codex/cc 的组合也挺好的。

kuhung

1 小时 7 分钟前

没必要，这就跟写博客先折腾框架一样，本末倒置。折腾知识库不如倒逼自己输出，把自己搞成检索强人。

unco020511

1 小时 7 分钟前

如果是公开文档,一般使用 context7 就足矣,如果是自己私有的,那 notion 就天然支持支持库,为啥还要自己做