原谅我有一点点标题党,但我确实迫不及待想先简单介绍一下:browserwing 。他能做什么呢?目前浏览器上普通流程范围能做的事情他就能做,比如:
注意了,下面只是随便举例子,不是说他只能做这些,理论上任何网站他都可以。
获取信息类:
执行操作类:
而且可以规划和自动执行不同操作,比如:帮我看看各个平台关于 gpt5.2 的讨论,总结一下,然后通过微信发给我。
你是不是觉得完成上述事情,像市面上所有的 AI 浏览器或者 AI Agent 一样要:
browserwing 解决的就是这些问题,那些困住你的不能真正实现 AI 浏览器自动化的问题。
而且,现在已经开源了,完全开源免费。
github 地址:https://github.com/browserwing/browserwing
如果你喜欢或觉得有用的话恳请帮忙 star 一个呀。晚点我会开文章更具体介绍场景,背景,还有具体的实现方案和未来规划。

我是 Glenn ,一个有编程基础的 vibe 工程师。希望做出大家喜欢好用的产品。
我还有另外一个产品:Modern Mermaid ,一个很好看好用的 mermaid 流程图设计网站,喜欢的也可以点点赞收藏起来。
github: https://github.com/gotoailab/modern_mermaid
网站:https://modern-mermaid.live

更多信息,请关注我的社交媒体:
1
xiao3vv PRO 看起来不错,我先试用一下
|
3
kamilic 6 小时 54 分钟前
如何解决 captcha ?
|
5
dawee2y 6 小时 19 分钟前
标题党必____!
|
6
chenzw2 6 小时 9 分钟前
这个不就是自动化测试中的录制和重放功能吗?
|
8
plane OP @chenzw2 重放这个交给大模型调度了。当前还只是支持简单录制,但后续可以做更复杂的编排,还可以参考 claude skill 。可以理解为一个概念就是每个平台都有一个 skill 来帮你执行更复杂的任务,比如 github skill ,bilibili skill 。
|
9
FFM 5 小时 52 分钟前
小红书 web 版的反爬非常狠,很难有一个长期稳定的方案。而且大部分内容网站未来都会快速升级这类防御,不然都给 AI 免费做嫁衣了。
|
10
FFM 5 小时 51 分钟前
我感觉这类浏览器 agent 的最终解决方案是 OCR 搞定一切,而不是现在跟那么多网页元素斗智斗勇。OP 可以关注下 OCR 领域的进展。
|
11
plane OP @FFM 是吗。听说 https://github.com/xpzouying/xiaohongshu-mcp 这个稳定运行一年了。我实践下来暂时也没有遇到封号或者别的问题。可能只是简单用,不要大规模爬还好吧。我这个不是为了做大规模爬虫的。
|
12
plane OP @FFM 那是肯定的,只是要等模型能力增强和算力成本下降,ocr 或者这些方案从能用到能便宜好用还要一段时间。目前也能做,但都是:慢 + 贵。如果有好用能用的,我也不用自己做了。
|
13
ga9 5 小时 46 分钟前
请问下,有没有专门的开源工具,是专门做发表知乎/csdn/v2ex/reddit/公众号等等各个平台文章...
|
15
datiewang 5 小时 17 分钟前
别的不说,“真正能用不是玩具”这句话已经把我的 AI PTSD 给看出来了。
|