browser-use/browser-use

GitHub: browser-use/browser-use

让大语言模型自主操控浏览器执行网页任务的 Python 自动化框架。

Stars: 80730 | Forks: 9542

Shows a black Browser Use Logo in light color mode and a white one in dark color mode.
The AI browser agent.
Browser-Use Package Download Statistics
Demos Docs Blog Merch Github Stars Twitter Discord Browser-Use Cloud

# 🤖 LLM 快速入门 1. 将你最喜欢的 coding agent(Cursor、Claude Code 等)指向 [Agents.md](https://docs.browser-use.com/llms-full.txt) 2. 开始写 Prompt!
# 👋 人类快速入门 **1. 创建环境并使用 [uv](https://docs.astral.sh/uv/) 安装 Browser-Use (Python>=3.11):** ``` uv init && uv add browser-use && uv sync # uvx browser-use install # 如果未安装 Chromium 请运行 ``` **2. [可选] 从 [Browser Use Cloud](https://cloud.browser-use.com/new-api-key) 获取你的 API key:** ``` # .env BROWSER_USE_API_KEY=your-key # GOOGLE_API_KEY=your-key # ANTHROPIC_API_KEY=your-key ``` **3. 运行你的第一个 agent:** ``` from browser_use import Agent, Browser, ChatBrowserUse # from browser_use import ChatGoogle # ChatGoogle(model='gemini-3-flash-preview') # from browser_use import ChatAnthropic # ChatAnthropic(model='claude-sonnet-4-6') import asyncio async def main(): browser = Browser( # use_cloud=True, # Use a stealth browser on Browser Use Cloud ) agent = Agent( task="Find the number of stars of the browser-use repo", llm=ChatBrowserUse(), # llm=ChatGoogle(model='gemini-3-flash-preview'), # llm=ChatAnthropic(model='claude-sonnet-4-6'), browser=browser, ) await agent.run() if __name__ == "__main__": asyncio.run(main()) ``` 查看 [库文档](https://docs.browser-use.com/open-source/introduction) 和 [云文档](https://docs.cloud.browser-use.com) 了解更多!
# 演示 ### 📋 表单填写 #### 任务 = "用我的简历和信息填写这份工作申请。" ![Job Application Demo](https://github.com/user-attachments/assets/57865ee6-6004-49d5-b2c2-6dff39ec2ba9) [示例代码 ↗](https://github.com/browser-use/browser-use/blob/main/examples/use-cases/apply_to_job.py) ### 🍎 杂货购物 #### 任务 = "将这个物品清单放入我的 instacart。" https://github.com/user-attachments/assets/a6813fa7-4a7c-40a6-b4aa-382bf88b1850 [示例代码 ↗](https://github.com/browser-use/browser-use/blob/main/examples/use-cases/buy_groceries.py) ### 💻 个人助理 #### 任务 = "帮我找组装 custom PC 的配件。" https://github.com/user-attachments/assets/ac34f75c-057a-43ef-ad06-5b2c9d42bf06 [示例代码 ↗](https://github.com/browser-use/browser-use/blob/main/examples/use-cases/pcpartpicker.py) # 🚀 模板快速入门 **想要更快开始?** 生成一个可直接运行的模板: ``` uvx browser-use init --template default ``` 这将创建一个包含工作示例的 `browser_use_default.py` 文件。可用模板: - `default` - 最小化配置,快速上手 - `advanced` - 所有配置选项及详细注释 - `tools` - 自定义工具和扩展 agent 示例 你也可以指定自定义输出路径: ``` uvx browser-use init --template default --output my_agent.py ```
# 💻 CLI 从命令行进行快速、持久化的浏览器自动化: ``` browser-use open https://example.com # Navigate to URL browser-use state # See clickable elements browser-use click 5 # Click element by index browser-use type "Hello" # Type text browser-use screenshot page.png # Take screenshot browser-use close # Close browser ``` CLI 在命令之间保持浏览器运行,以便快速迭代。查看 [CLI 文档](browser_use/skill_cli/README.md) 了解所有命令。 ### Claude Code Skill 对于 [Claude Code](https://claude.ai/code),安装该 skill 以启用 AI 辅助的浏览器自动化: ``` mkdir -p ~/.claude/skills/browser-use curl -o ~/.claude/skills/browser-use/SKILL.md \ https://raw.githubusercontent.com/browser-use/browser-use/main/skills/browser-use/SKILL.md ```
## 集成、托管、自定义工具、MCP 及更多内容,请查看我们的 [文档 ↗](https://docs.browser-use.com)
# 常见问题
最好使用哪个模型? 我们专门针对浏览器自动化任务优化了 **ChatBrowserUse()**。平均而言,它完成任务的速度比其他模型快 3-5 倍,且具有 SOTA 准确率。 **定价(每 1M tokens):** - Input tokens: $0.20 - Cached input tokens: $0.02 - Output tokens: $2.00 对于其他 LLM 提供商,请参阅我们的 [支持的模型文档](https://docs.browser-use.com/supported-models)。
我应该在开源预览模型中使用 Browser Use 系统 Prompt 吗? 是的。如果你在普通的 `Agent(...)` 中使用 `ChatBrowserUse(model='browser-use/bu-30b-a3b-preview')`,Browser Use 仍然会为你发送其默认的 agent 系统 Prompt。 你**不需要**仅仅因为切换到了开源预览模型就添加单独的自定义“Browser Use system message”。只有当你有意为你的任务自定义默认行为时,才使用 `extend_system_message` 或 `override_system_message`。 如果你想要最佳的默认速度/准确率,我们仍然推荐较新的托管 `bu-*` 模型。如果你想要开源预览模型,除了 `model=` 的值之外,设置保持不变。
我可以配合 agent 使用自定义工具吗? 可以!你可以添加自定义工具来扩展 agent 的能力: ``` from browser_use import Tools tools = Tools() @tools.action(description='Description of what this tool does.') def custom_tool(param: str) -> str: return f"Result: {param}" agent = Agent( task="Your task", llm=llm, browser=browser, tools=tools, ) ```
我可以免费使用吗? 可以!Browser-Use 是开源且免费使用的。你只需要选择一个 LLM 提供商(如 OpenAI、Google、ChatBrowserUse,或使用 Ollama 运行本地模型)。
服务条款 此开源库根据 MIT 许可证授权。关于 Browser Use 服务和数据政策,请参阅我们的 [服务条款](https://browser-use.com/legal/terms-of-service) 和 [隐私政策](https://browser-use.com/privacy/)。
如何处理身份验证? 查看我们的身份验证示例: - [使用真实浏览器配置文件](https://github.com/browser-use/browser-use/blob/main/examples/browser/real_browser.py) - 重用你现有的 Chrome 配置文件及已保存的登录信息 - 如果你想使用带有收件箱的临时帐户,请选择 AgentMail - 要将你的身份验证配置文件同步到远程浏览器,请运行 `curl -fsSL https://browser-use.com/profile.sh | BROWSER_USE_API_KEY=XXXX sh`(将 XXXX 替换为你的 API key) 这些示例展示了如何维护 session 并无缝处理身份验证。
如何解决 CAPTCHA? 对于 CAPTCHA 处理,你需要更好的浏览器指纹和代理。使用 [Browser Use Cloud](https://cloud.browser-use.com),它提供旨在避免被检测和 CAPTCHA 挑战的隐身浏览器。
如何投入生产? Chrome 会消耗大量内存,并行运行许多 agent 在管理上可能很棘手。 对于生产用例,请使用我们的 [Browser Use Cloud API](https://cloud.browser-use.com),它负责处理: - 可扩展的浏览器基础设施 - 内存管理 - 代理轮换 - 隐身浏览器指纹 - 高性能并行执行

**告诉你的计算机要做什么,它就会搞定。** [![Twitter Follow](https://img.shields.io/twitter/follow/Magnus?style=social)](https://x.com/intent/user?screen_name=mamagnus00)     [![Twitter Follow](https://img.shields.io/twitter/follow/Gregor?style=social)](https://x.com/intent/user?screen_name=gregpr07)
Made with ❤️ in Zurich and San Francisco
标签:Browser Use, DNS解析, DOM解析, IP 地址批量处理, LangChain, Petitpotam, Playwright, Python, RPA, Selenium, Web Scraping, 人工智能, 反调试, 威胁情报, 开发者工具, 开源项目, 效率工具, 无后门, 机器人流程自动化, 浏览器控制, 浏览器自动化, 特征检测, 用户模式Hook绕过, 自动任务执行, 轻量级, 逆向工具