V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
plane
V2EX  ›  分享创造

我做了一个,可能是全世界第一个真正能用不是玩具的浏览器 agent

  •  
  •   plane · 7 小时 23 分钟前 · 1169 次点击

    介绍

    原谅我有一点点标题党,但我确实迫不及待想先简单介绍一下:browserwing 。他能做什么呢?目前浏览器上普通流程范围能做的事情他就能做,比如:

    注意了,下面只是随便举例子,不是说他只能做这些,理论上任何网站他都可以。

    获取信息类:

    • 获取小红书、知乎、即刻、v2ex 等等等 feed 内容
    • 获取 github trending
    • 获取某个帖子的回复数
    • 获取马斯克今天在推特说了什么
    • 获取我的域名还有多少天过期
    • 获取我的 github 项目有多少 star 了
    • 等等

    执行操作类:

    • 发表知乎/csdn/v2ex/reddit/公众号等等各个平台文章
    • 帮我执行个项目部署
    • 帮我填写某个表单提交
    • 帮我订外卖订机票
    • 等等

    而且可以规划和自动执行不同操作,比如:帮我看看各个平台关于 gpt5.2 的讨论,总结一下,然后通过微信发给我。

    你是不是觉得完成上述事情,像市面上所有的 AI 浏览器或者 AI Agent 一样要:

    1. 肯定要耗费很久去执行吧,执行效率肯定低
    2. 这些要耗费很多 token 吧,很费钱
    3. 执行的成功率肯定不高
    4. 还要我自己写代码吧,不然他咋完成
    5. 安装很麻烦吧

    browserwing 解决的就是这些问题,那些困住你的不能真正实现 AI 浏览器自动化的问题。

    1. 很少的 token
    2. 效率很高
    3. 成功率非常高
    4. 几乎不用写代码
    5. 一个二进制启动+简单配置,马上上手

    而且,现在已经开源了,完全开源免费。

    github 地址:https://github.com/browserwing/browserwing

    如果你喜欢或觉得有用的话恳请帮忙 star 一个呀。晚点我会开文章更具体介绍场景,背景,还有具体的实现方案和未来规划。

    微信图片_20251212012211_40_2683.jpg

    关于我

    我是 Glenn ,一个有编程基础的 vibe 工程师。希望做出大家喜欢好用的产品。

    我还有另外一个产品:Modern Mermaid ,一个很好看好用的 mermaid 流程图设计网站,喜欢的也可以点点赞收藏起来。

    github: https://github.com/gotoailab/modern_mermaid

    网站:https://modern-mermaid.live

    screenshot-brutalist.png

    更多信息,请关注我的社交媒体:

    16 条回复    2025-12-17 12:20:11 +08:00
    xiao3vv
        1
    xiao3vv  
    PRO
       7 小时 1 分钟前
    看起来不错,我先试用一下
    plane
        2
    plane  
    OP
       6 小时 56 分钟前
    @xiao3vv 好的!因为刚放出来,还在不断迭代,有问题可以留言呀,看到马上给你解决
    kamilic
        3
    kamilic  
       6 小时 54 分钟前
    如何解决 captcha ?
    plane
        4
    plane  
    OP
       6 小时 44 分钟前
    @kamilic 如果只是登录认证,目前用的方案是导入导出 cookie 绕过。如果是关键操作的 mfa ,这个还在看怎么弄,目前没办法直接解决。
    dawee2y
        5
    dawee2y  
       6 小时 19 分钟前
    标题党必____!
    chenzw2
        6
    chenzw2  
       6 小时 9 分钟前
    这个不就是自动化测试中的录制和重放功能吗?
    plane
        7
    plane  
    OP
       6 小时 0 分钟前
    @dawee2y 这年头太卷,不标题党都没人关注了...
    plane
        8
    plane  
    OP
       5 小时 58 分钟前
    @chenzw2 重放这个交给大模型调度了。当前还只是支持简单录制,但后续可以做更复杂的编排,还可以参考 claude skill 。可以理解为一个概念就是每个平台都有一个 skill 来帮你执行更复杂的任务,比如 github skill ,bilibili skill 。
    FFM
        9
    FFM  
       5 小时 52 分钟前
    小红书 web 版的反爬非常狠,很难有一个长期稳定的方案。而且大部分内容网站未来都会快速升级这类防御,不然都给 AI 免费做嫁衣了。
    FFM
        10
    FFM  
       5 小时 51 分钟前
    我感觉这类浏览器 agent 的最终解决方案是 OCR 搞定一切,而不是现在跟那么多网页元素斗智斗勇。OP 可以关注下 OCR 领域的进展。
    plane
        11
    plane  
    OP
       5 小时 50 分钟前
    @FFM 是吗。听说 https://github.com/xpzouying/xiaohongshu-mcp 这个稳定运行一年了。我实践下来暂时也没有遇到封号或者别的问题。可能只是简单用,不要大规模爬还好吧。我这个不是为了做大规模爬虫的。
    plane
        12
    plane  
    OP
       5 小时 48 分钟前
    @FFM 那是肯定的,只是要等模型能力增强和算力成本下降,ocr 或者这些方案从能用到能便宜好用还要一段时间。目前也能做,但都是:慢 + 贵。如果有好用能用的,我也不用自己做了。
    ga9
        13
    ga9  
       5 小时 46 分钟前
    请问下,有没有专门的开源工具,是专门做发表知乎/csdn/v2ex/reddit/公众号等等各个平台文章...
    plane
        14
    plane  
    OP
       5 小时 45 分钟前
    @ga9 我自己有做了一个,但目前没有开源
    datiewang
        15
    datiewang  
       5 小时 17 分钟前
    别的不说,“真正能用不是玩具”这句话已经把我的 AI PTSD 给看出来了。
    plane
        16
    plane  
    OP
       4 小时 50 分钟前
    @datiewang 哈哈 dddd
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5125 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 09:10 · PVG 17:10 · LAX 01:10 · JFK 04:10
    ♥ Do have faith in what you're doing.