agent-browser 使用 ¶
Agent-browser 是一款宣称对大模型友好的命令行工具,该工具支持将网页内容转化为对LLM更为友好的JSON或者YAML格式,从而降低TOKEN消耗,当然除了大模型使用,实际上我们也可以在命令行中直接连接Chrome Devtools Protocol 实例,并对浏览器进行操作,比如点击,执行JS,下载文件,填充表单等。
项目地址 ¶
https://github.com/vercel-labs/agent-browser
基本使用 ¶
** 需要 NODE.JS **
npx agent-browser install
npx agent-browser open https://www.bing.com
npx agent-browser snapshot -i #获取可交互元素
npx agent-browser click @e1 #点击参考号为 e1 的元素,snapshot可以列出参考号
npx agent-browser upload @e2 /path/to/file.ext
npx agent-browser download @e3 /path/to/file.ext
npx agent-browser [subcommand] --help
npx agent-browser --help
Windows 下的特定问题 ¶
在 Windows 下 运行 npx agent-browser open xxx 时,可能会遇到 daemone start failed 错误,在这种情况下,可以使用 NODE 命令手动启动 daemon,在运行agent-browser
# 启动一个CDP实例
chrome --remote-debugging-port=9222 --headless --user-data-dir=%userprofile%\chrome-debug
# 启动 Agent-browser daemon
node -e "require('agent-browser/dist/daemon.js').startDaemon()"
# 运行后程序会在前台卡住,代表在监听链接
# 启动 agent-browser 进行网页抓取
npx agent-browser --auto-connect open https://www.bing.com
# --auto-connect 指示系统去连接本机 CDP 实例,当然,如果不指定,系统将启动一个新的CDP链接
评论
请登录后发表评论。
暂无评论。成为第一个评论者!