V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
afkool
V2EX  ›  程序员

用开源模型折腾个知识库(RAG)有必要没?

  •  
  •   afkool · 3 小时 29 分钟前 · 654 次点击
    写代码。现在都是闭源模型一把梭。。遇到错误了总结个 skill 。反正也挺好用。
    但是写鸿蒙这种就错误多一些,需要手动查文档之类的(虽然闭源也会差,但总感觉查准确率差一些),修起来费点时间。
    有必要折腾个这种玩意嘛?
    需求就是配合闭源的去完成工作。还是说继续闭源一把梭算了。。
    9 条回复    2026-04-09 14:51:12 +08:00
    whiteshh
        1
    whiteshh  
       3 小时 22 分钟前
    没必要
    cryptovae
        2
    cryptovae  
       3 小时 4 分钟前
    没必要,
    我是直接弄个 skill ,让模型帮总结成 md ,review 好后弄成博客
    这些 md 直接弄给给模型当做知识库
    目录加文件名就是天然的 RAG
    frantic
        3
    frantic  
       1 小时 52 分钟前
    参考下这个: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f 核心思路是文档数量不是特别多的场景下,用 LLM 来做
    murmur
        4
    murmur  
       1 小时 47 分钟前
    骗你的,鸿蒙文档也一堆坑,我遇到过,异步方法不说明,害得我调了好久才发现是文档没写明白
    metaquant
        5
    metaquant  
       1 小时 24 分钟前
    知识库方面,感觉 ima 已经完全可以覆盖需求了,这篇文章挺有道理:

    https://mp.weixin.qq.com/s/gjf5m6F_I6jI9mPvnm0SGg
    hqgdyf
        6
    hqgdyf  
       1 小时 10 分钟前
    @metaquant 就是云端存储,后面如果有很合适的工具,迁移成本非常高。用过很多,目前是 obsidian+git 仓。就是需要自己整理,但是数据主权在自己手里。
    YanSeven
        7
    YanSeven  
       1 小时 7 分钟前
    @metaquant 云端的适合工作,公司的数据爱存哪存哪,私人的还是数据在自己这里好一点,obsidian+codex/cc 的组合也挺好的。
    kuhung
        8
    kuhung  
       1 小时 7 分钟前
    没必要,这就跟写博客先折腾框架一样,本末倒置。折腾知识库不如倒逼自己输出,把自己搞成检索强人。
    unco020511
        9
    unco020511  
       1 小时 7 分钟前
    如果是公开文档,一般使用 context7 就足矣,如果是自己私有的,那 notion 就天然支持支持库,为啥还要自己做
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5547 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 07:58 · PVG 15:58 · LAX 00:58 · JFK 03:58
    ♥ Do have faith in what you're doing.