browser-use 踩坑记录
browser-use 是啥
一个命令行操作浏览器的工具,号称ai使用浏览器的最佳方式,提供一整套的python库,也提供了一个cli命令和tui的终端。
服务分为云服务和开源,云服务是使用他云上的大模型去调用云上chrome来处理,开源是你提供相关的api key来使用本地的浏览器,同时也支持直接连接云服务。
- 官网: https://browser-use.com
- 开源文档:https://docs.browser-use.com/open-source/introduction
- github仓库:https://github.com/browser-use/browser-use
能干啥
- 帮你自动操作页面
- 帮你自动操作页面
- 帮你自动操作页面
我目前用来解决的主要问题也就是自动操作页面,但是场景上却有很多可能性
坑在哪
- 配置坑:开源的仅支持几个知名的provider,而且不支持自定义baseUrl,想用deepseek-v4-pro,只能用openrouter的
- 文档坑:文档里很多命令说明的很有迷惑性,比如profile命令需要profile-use,还说第一次使用会自动下载,但是用的时候提示404, 所有子命令都是没带前缀
browser-use的。
怎么搞
下面我就用hermes + browser-use来说明一下自动上传抖音视频的步骤和注意点
前置条件
- 安装,就几个命令很简单
获取抖音登录cookies
手动获取
1# --head 是有头模式,用来你扫码登录的
2browser-use --head open "https://creator.douyin.com/creator-micro/content/upload"
3
4# 在打开的浏览器里扫码登录后就可以开始导出cookies了
5# 过滤 douyin.com cookies
6browser-use cookies get --url "douyin.com"
7# 导出cookies
8browser-use cookies export ~/tmp/dy_cookies.json
9
10# 这时候就获得正确的cookies了,记得关闭
11browser-use close
手动验证
1browser-use open "https://creator.douyin.com/creator-micro/content/upload"
2
3# 导入cookies
4browser-use import ~/tmp/dy_cookies.json
5
6# 刷新
7browser-use eval "windows.location.reload()"
8
9# 获得页面元素
10browser-use state
11
12# 输出页面元素,能看到上传视频等信息,说明可以了
13
14# 关闭
15browser-use close
教hermes
跟他对话
使用browser-use上传视频~/Downloads/videos/temp.mp4到抖音
browser-use的文档: https://docs.browser-use.com/open-source/browser-use-cli
browser-use 已安装,安装目录(这里换成你自己的): ~/.browser-use-env/bin/browser-use
不使用connect, 直接使用browser-use open “https://creator.douyin.com/creator-micro/content/upload"
导入cookies, 文件在 ~/temp/dy_cookies.json
刷新页面, browser-use eval “window.location.reload()”
自动填入标题和内容,并选择适合的话题
他可能还会确认几个问题,但是要注意,不要让hermes使用connect模式,使用之后会卡browser-use state,如果看他开始说连接你当前的浏览器/chrome什么的,直接让他停止并纠正问题。
然后就能看到他正确的上传并发布视频了,这个好处呢就是不会出发平台的机器人检测,全都是默认操作,坏处呢,可能cookies到期,需要重新登录,应该可以让hermes每天刷新cookies