V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
InkXPath
V2EX  ›  分享创造

[分享] ClaudeChrome - 在浏览器中启动 Claude/Codex,实现通用智能交互体验

  •  1
     
  •   InkXPath · 10 小时 46 分钟前 · 293 次点击

    ClaudeChrome 介绍

    ClaudeChrome_logo

    最近在做一个自己工作流需要的工具,随便起了个名叫 ClaudeChrome (也是蹭蹭热度哈哈)。图标也是暴力结合了几家 logo 的主要设计元素,反正权当项目 logo 先用着了。

    众所周知 Anthropic 其实已经实现了一个官方的 Claude for Chrome 插件,但是并没有开源,而且之前也只能给 MAX 订阅用户使用(最近因为 CC 的开源风波,听说政策上有调整),所以就打算自己做一个。而且现在很多时候也会用 Codex ,所以不如先 build 这样的一个基础实现,后面做定制化,以及支持更多浏览器或者 Agent CLI 都很方便。

    项目 idea 很简单:把 Claude / Codex / Shell 放进 Chrome 侧边栏( Shell 其实现在还没啥用,因为主要靠自行实现的 MCP Server 实现自动页面交互,主要是给未来一些插件脚本手动调用浏览器接口留空),并把每个 session 绑定到一个真实标签页(使用过程中也可以 rebind 标签页)。这样 Agent 看到的就不再只是你手动贴过去的一点信息,而是当前标签页的页面文本、HTML 、请求、console 等浏览器上下文。

    项目特性如下:

    • 在 Chrome side panel 中直接运行 Claude / Codex / Shell
    • 每个 pane 绑定一个真实标签页,支持切换和 rebind
    • 读取页面内容、HTML 、网络请求、控制台、执行 JS 代码、运行 click, scroll 等交互
    • 多 workspace / 多 pane 组织视图

    还有一个比较重要的点,各个 Agent 都是绑定到本地环境的,所以可以直接让它保存页面信息到本地,或者结合本地的上下文做操作,Agent 的 session 和交互记录之类也都是和正常启动一样保存到本地的。除了 LLM 的 API 调用和浏览器访问,整个链路都是完全在本地运行的,所以比较安全。

    如下是一些我录制的应用场景演示,基本上都是一遍过。演示用的是 CC+Opus4.6 ,Codex 也是能跑的。现在 backbone 模型能力真的很强。

    2048 游戏操作:这个演示聚焦 ClaudeChrome 在 2048 游戏环境中的持续交互能力:它不会停在一次性读取,而是能围绕视觉元素持续进行长链路操作。

    2048 demo

    Amazon 商品详情收集:这个演示主要展示 ClaudeChrome 的网页爬取能力,包括处理页面跳转和滚动交互的能力,同时会话始终保持绑定在当前浏览器标签页上。

    Amazon 页面 demo

    V2EX 论坛话题总结:这个演示展示了 ClaudeChrome 在 V2EX 页面中爬取论坛内容,并根据用户要求执行 JavaScript 命令的能力。

    V2EX 页面 demo

    OpenClaw 展示页风格拟合:这个演示突出 ClaudeChrome 的浏览器扩展能力:它可以模仿现有网站来原生设计相似风格,比传统的手动拷贝样式表更方便,也更准确。

    OpenClaw 页面 demo

    知识摄取与文本选中:这个演示聚焦于与之前 Tapestry 项目的集成:不调用 Tapestry 自带爬虫,也能把页面内容直接写入知识库,同时展示基于页面选中文本触发动作的能力。

    Tapestry 文本选择 demo

    更清晰的录制请见项目主页和仓库:

    项目主页: https://natsufox.github.io/ClaudeChrome/index-zh.html

    仓库: https://github.com/NatsuFox/ClaudeChrome

    README: https://github.com/NatsuFox/ClaudeChrome/blob/main/README.md

    目前我在功能和实现上做了比较多的工作,在跨平台上还没有做太多测试,暂时只在 Chrome ,以及 MacOS 和 Linux (指在本地启动的 MCP Server ) 上跑过,不过常理上说应该都支持的。

    下一步打算优化下 Agent 对 MCP tools 调用的体验,现在如果不显式说 “标签页” 等表达,Agent 经常不会主动意识到是要在浏览器内操作,在上面的 demo 中也能看到这样的问题。后面我加一些 System Prompt 的预设,告诉 Agent 目前它已经进入了浏览器的领域内。

    最后,大家如果因为平台不支持,或者跑起来以后有任何大大小小的问题,随便+强烈欢迎提 issue 和 PR ,没有格式之类的要求,只要和项目相关,纯灌水也行。大家能真正用起来,就是项目最大的价值,我会一直维护下去。如果有实际帮助,欢迎大家点点 Star 🌟,这对我来说非常重要 :)


    Tapestry 更新发布

    Tapestry_logo

    顺便也宣传一下之前的 Tapestry 。最近 Karpathy 也发表了关于 LLM Wiki 的讨论,其实最初 Tapestry 的定位几乎就是一个简便的 Agent powered 个人知识库,但看起来并没有产生太大的 impact :)

    似乎插入外部链接有些限制,加了个 emoji

    卡帕西解锁大模型新玩法!构建个人知识库,“大部分 Token 已经不跑代码了

    https://mp.w🤔eixin.qq.com/s/UjaVCyw3lxp4e9zn5b8KQA

    显然 ClaudeChrome 可以和 Tapestry 有机结合,将当前在浏览器看的内容直接整合到本地知识库,绕开了对于内置爬虫的需要。我觉得这是一个很不错的组合(自己用着很爽哈哈)。

    在首次发布后的一段时间里,已经在细节上做了不少优化,知识库前端效果和实际使用体验上都有了比较大的提升,也专门做了项目主页。后续打算仔细研究一下 Karpathy 提出的架构和范式,将一些有用的 idea 落实到 Tapestry 中。

    相关的项目特性更新,基本情况等都写在主页里了,也附上先前在 V2EX 的发帖链接,欢迎大家再来关照一下:

    V2EX 帖子链接: https://www.0.51bbc.workers.dev/t/1198796

    项目主页: https://natsufox.github.io/Tapestry

    仓库: https://github.com/NatsuFox/Tapestry

    README: https://github.com/NatsuFox/Tapestry/blob/main/README.md

    目前尚无回复
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   851 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 22:18 · PVG 06:18 · LAX 15:18 · JFK 18:18
    ♥ Do have faith in what you're doing.