microsoft/agent-lightning
GitHub: microsoft/agent-lightning
微软开源的 AI 智能体训练框架,以近乎零代码改造的方式让任何智能体接入强化学习与 Prompt 优化等训练流程。
Stars: 16287 | Forks: 1403
# Agent Lightning⚡
[](https://github.com/microsoft/agent-lightning/actions/workflows/badge-unit.yml)
[](https://microsoft.github.io/agent-lightning/)
[](https://badge.fury.io/py/agentlightning)
[](LICENSE)
[](https://deepwiki.com/microsoft/agent-lightning)
[](https://discord.gg/RYk7CdvDR7)
**点亮 AI 智能体的终极训练器。**
加入我们的 [Discord 社区](https://discord.gg/RYk7CdvDR7),与其他用户和贡献者交流。
## ⚡ 核心特性
- **零代码修改**(几乎)即可将您的智能体变成可优化的猛兽!💤
- 使用**任何**智能体框架(LangChain, OpenAI Agent SDK, AutoGen, CrewAI, Microsoft Agent Framework 等)构建;甚至可以在**无**智能体框架(Python OpenAI)的情况下构建。只要你敢想!🤖
- **选择性地**优化多智能体系统中的一个或多个智能体。🎯
- 拥抱**算法**,如强化学习、自动 Prompt 优化、监督微调等。🤗
在我们的[文档网站](https://microsoft.github.io/agent-lightning/)上阅读更多信息。
## ⚡ 安装
```
pip install agentlightning
```
如需最新的每日构建版(包含前沿功能),你可以从 Test PyPI 安装:
```
pip install --upgrade --index-url https://test.pypi.org/simple/ --extra-index-url https://pypi.org/simple/ --pre agentlightning
```
请参阅我们的[安装指南](https://microsoft.github.io/agent-lightning/stable/tutorials/installation/)以获取更多详细信息。
要开始使用 Agent-lightning,请查阅我们的[文档](https://microsoft.github.io/agent-lightning/)和[示例](./examples)。
## ⚡ 文章
- 2025/12/17 [采用轨迹级别聚合以加速训练](https://agent-lightning.github.io/posts/trajectory_level_aggregation/) Agent-lightning 博客。
- 2025/11/4 [使用 Tinker ✕ Agent-lightning 调优任何 AI 智能体](https://medium.com/@yugez/tuning-any-ai-agent-with-tinker-agent-lightning-part-1-1d8c9a397f0e) Medium。另见[第二部分](https://medium.com/@yugez/tuning-any-ai-agent-with-tinker-agent-lightning-part-2-332c5437f0dc)。
- 2025/10/22 [不再有重标记化漂移:通过 OpenAI 兼容 API 返回 Token ID 在智能体 RL 中至关重要](https://blog.vllm.ai/2025/10/22/agent-lightning.html) vLLM 博客。另见[知乎文章](https://zhuanlan.zhihu.com/p/1965067274642785725)。
- 2025/8/11 [通过强化学习训练 AI 智能体编写和自我纠正 SQL](https://medium.com/@yugez/training-ai-agents-to-write-and-self-correct-sql-with-reinforcement-learning-571ed31281ad) Medium。
- 2025/8/5 [Agent Lightning:使用强化学习训练任何 AI 智能体](https://arxiv.org/abs/2508.03680) arXiv 论文。
- 2025/7/26 [我们发现了一种使用 RL 训练任何 AI 智能体的方法,(几乎)零代码修改。](https://www.reddit.com/r/LocalLLaMA/comments/1m9m670/we_discovered_an_approach_to_train_any_ai_agent/) Reddit。
- 2025/6/6 [Agent Lightning - 微软研究院](https://www.microsoft.com/en-us/research/project/agent-lightning/) 项目主页。
## ⚡ 社区项目
- [DeepWerewolf](https://github.com/af-74413592/DeepWerewolf) — 一个使用 AgentScope 和 Agent Lightning 构建的中文狼人杀游戏智能体 RL 训练案例研究。
- [AgentFlow](https://agentflow.stanford.edu/) — 一个模块化的多智能体框架,结合了规划器、执行器、验证器和生成器智能体,并使用 Flow-GRPO 算法来解决长周期、稀疏奖励任务。
- [Youtu-Agent](https://github.com/TencentCloudADP/Youtu-agent) — Youtu-Agent 让你能够轻松构建和训练你的智能体。Youtu-Agent 基于 Agent Lightning 的[一个修改分支](https://github.com/microsoft/agent-lightning/tree/contrib/youtu-agent-lightning)构建,已在多达 128 个 GPU 上验证了针对数学/代码和搜索能力的 RL 训练,并保持稳定收敛。另请查看[配方](https://github.com/TencentCloudADP/youtu-agent/tree/rl/agl)以及他们的博客[*别再为你的智能体 RL 苦恼:Youtu-Agent 如何毫不费力地实现稳定的 128-GPU 扩展*](https://spotted-coconut-df8.notion.site/Stop-Wrestling-with-Your-Agent-RL-How-Youtu-Agent-Achieved-Stable-128-GPU-Scaling-Without-Breaking-2ca5e8f089ba80539a98c582b65e0233)。
## ⚡ 架构
Agent Lightning 将动态组件降至最低,让你可以专注于你的想法,而不是底层管道。你的智能体像往常一样继续运行;你仍然可以使用你喜欢的任何智能体框架;你只需加入轻量级的 `agl.emit_xxx()` 辅助函数,或者让 tracer 收集每个 prompt、工具调用和 reward。这些事件成为结构化的 span,流入 LightningStore——一个保持任务、资源和 trace 同步的中央集线器。
在 store 的另一端是你选择或自己编写的算法。算法读取 span,从中学习,并发布更新的资源,例如精炼的 prompt 模板或新的策略权重。Trainer 将这一切联系在一起:它将数据集流式传输给 runner,在 store 和算法之间传输资源,并在有改进时更新推理引擎。你可以就此打住,或者干脆让同一个循环继续转动。
无需重写,没有锁定,只需一条从首次展开到稳步改进的清晰路径。
## ⚡ CI 状态
| 工作流 | 状态 |
|----------|--------|
| CPU 测试 | [](https://github.com/microsoft/agent-lightning/actions/workflows/tests.yml) |
| 完整测试 | [](https://github.com/microsoft/agent-lightning/actions/workflows/badge-unit.yml) |
| UI 测试 | [](https://github.com/microsoft/agent-lightning/actions/workflows/dashboard.yml) |
| 示例集成 | [](https://github.com/microsoft/agent-lightning/actions/workflows/badge-examples.yml) |
| 最新依赖兼容性 | [](https://github.com/microsoft/agent-lightning/actions/workflows/badge-latest.yml) |
| 旧版示例兼容性 | [](https://github.com/microsoft/agent-lightning/actions/workflows/badge-compat.yml) |
## ⚡ 引用
如果你在研究或项目中觉得 Agent Lightning 有用,请引用我们的论文:
```
@misc{luo2025agentlightningtrainai,
title={Agent Lightning: Train ANY AI Agents with Reinforcement Learning},
author={Xufang Luo and Yuge Zhang and Zhiyuan He and Zilong Wang and Siyun Zhao and Dongsheng Li and Luna K. Qiu and Yuqing Yang},
year={2025},
eprint={2508.03680},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2508.03680},
}
```
## ⚡ 贡献
本项目欢迎贡献和建议。请先阅读[贡献指南](docs/community/contributing.md),了解推荐的贡献点、环境设置、分支约定和 Pull Request 要求。大多数贡献要求你同意一份贡献者许可协议 (CLA),声明你有权并且确实授予我们使用你的贡献的权利。有关详细信息,请访问 https://cla.opensource.microsoft.com。
当你提交 Pull Request 时,CLA 机器人将自动确定你是否需要提供 CLA,并相应地装饰该 PR(例如,状态检查、评论)。只需按照机器人提供的说明操作即可。对于所有使用我们 CLA 的仓库,你只需执行一次此操作。
本项目已采用 [Microsoft 开源行为准则](https://opensource.microsoft.com/codeofconduct/)。有关更多信息,请参阅[行为准则 FAQ](https://opensource.microsoft.com/codeofconduct/faq/),或联系 [opencode@microsoft.com](mailto:opencode@microsoft.com) 提出任何其他问题或意见。
## ⚡ 商标
本项目可能包含项目、产品或服务的商标或标志。授权使用微软商标或标志受[微软商标与品牌指南](https://www.microsoft.com/en-us/legal/intellectualproperty/trademarks/usage/general)的约束并必须遵守该指南。在本项目的修改版本中使用微软商标或标志不得引起混淆或暗示微软的赞助。任何第三方商标或标志的使用均受制于这些第三方的政策。
## ⚡ 负责任的 AI
本项目已经过评估并证明符合微软负责任 AI 标准。团队将继续监控和维护该仓库,并在出现任何严重问题(包括潜在的伤害)时予以解决。
## ⚡ 许可证
本项目基于 MIT 许可证授权。有关详细信息,请参阅 [LICENSE](LICENSE) 文件。
标签:AI优化算法, AI开发工具, AI算法, Apex, AutoGen, CrewAI, LangChain, Microsoft, Microsoft Agent Framework, OpenAI SDK, PyPI, PyRIT, Python, RL, SFT, 人工智能, 多智能体系统, 大模型智能体, 开源, 强化学习, 微软, 无后门, 智能体训练, 机器学习, 用户模式Hook绕过, 监督微调, 自动提示词优化, 轻量级, 逆向工具, 零代码改动