microsoft/RD-Agent

GitHub: microsoft/RD-Agent

微软开源的 AI 研发自动化智能体框架，通过「提出假设—实现验证」的迭代闭环驱动数据与模型的自动化开发。

Stars: 13495 | Forks: 1684

🖥️ 实时演示 | 🎥 演示视频 ▶️YouTube | 📖 文档 | 📄 技术报告 | 📃 论文

[![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/08b1ede5b1201336.svg)](https://github.com/microsoft/RD-Agent/actions/workflows/ci.yml) [![CodeQL](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/c149870f31201341.svg)](https://github.com/microsoft/RD-Agent/actions/workflows/github-code-scanning/codeql) [![Dependabot Updates](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/9790109d20201346.svg)](https://github.com/microsoft/RD-Agent/actions/workflows/dependabot/dependabot-updates) [![Lint PR Title](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/b44d88f24b201351.svg)](https://github.com/microsoft/RD-Agent/actions/workflows/pr.yml) [![Release.yml](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/759f593273201356.svg)](https://github.com/microsoft/RD-Agent/actions/workflows/release.yml) [![Platform](https://img.shields.io/badge/platform-Linux-blue)](https://pypi.org/project/rdagent/#files) [![PyPI](https://img.shields.io/pypi/v/rdagent)](https://pypi.org/project/rdagent/) [![PyPI - Python Version](https://img.shields.io/pypi/pyversions/rdagent)](https://pypi.org/project/rdagent/) [![Release](https://img.shields.io/github/v/release/microsoft/RD-Agent)](https://github.com/microsoft/RD-Agent/releases) [![GitHub](https://img.shields.io/github/license/microsoft/RD-Agent)](https://github.com/microsoft/RD-Agent/blob/main/LICENSE) [![pre-commit](https://img.shields.io/badge/pre--commit-enabled-brightgreen?logo=pre-commit)](https://github.com/pre-commit/pre-commit) [![Checked with mypy](https://www.mypy-lang.org/static/mypy_badge.svg)](http://mypy-lang.org/) [![Ruff](https://img.shields.io/endpoint?url=https://raw.githubusercontent.com/astral-sh/ruff/main/assets/badge/v2.json)](https://github.com/astral-sh/ruff) [![Chat](https://img.shields.io/badge/chat-discord-blue)](https://discord.gg/ybQ97B6Jjy) [![Documentation Status](https://readthedocs.org/projects/rdagent/badge/?version=latest)](https://rdagent.readthedocs.io/en/latest/?badge=latest) [![Readthedocs Preview](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/15900e1ee2201401.svg)](https://github.com/microsoft/RD-Agent/actions/workflows/readthedocs-preview.yml) [![arXiv](https://img.shields.io/badge/arXiv-2505.14738-00ff00.svg)](https://arxiv.org/abs/2505.14738) # 📰 新闻 | 🗞️ 新闻 | 📝 描述 | | -- | ------ | | ICML 2026 录用 | 我们非常高兴地宣布，我们的论文 [FT-Dojo: Towards Autonomous LLM Fine-Tuning with Language Agents](https://arxiv.org/abs/2603.01712) 已被 ICML 2026 录用。FT-Agent 的实现可在 [LLM fine-tuning 指南](rdagent/app/finetune/llm/README.md)中查看。 | | ACL 2026 Findings 录用 | 我们非常高兴地宣布，我们的论文 [Reasoning as Gradient](https://arxiv.org/abs/2603.01692) 已被 ACL 2026 Findings 录用。执行轨迹可在 [Gome GPT-5 Traces](https://huggingface.co/datasets/amstrongzyf/Gome-GPT5-Traces) 中查看 | | Web UI 发布 | 我们发布了新的前端，可以通过 `rdagent server_ui` 构建和提供服务，用于实时交互和轨迹查看，目前暂不支持 `data_science` 场景。 | | NeurIPS 2025 录用 | 我们非常高兴地宣布，我们的论文 [R&D-Agent-Quant](https://arxiv.org/abs/2505.15155) 已被 NeurIPS 2025 录用 | | [技术报告发布](#overall-technical-report) | 整体框架描述及在 MLE-bench 上的结果 | | [R&D-Agent-Quant 发布](#deep-application-in-diverse-scenarios) | 将 R&D-Agent 应用于量化交易 | | MLE-Bench 结果发布 | R&D-Agent 目前在 MLE-bench 上领跑，成为[表现最佳的机器学习工程智能体](#-the-best-machine-learning-engineering-agent) | | 支持 LiteLLM 后端 | 我们现在完全支持 **[LiteLLM](https://github.com/BerriAI/litellm)** 作为我们的默认后端，以便与多个 LLM 提供商进行集成。 | | 通用数据科学智能体 | [数据科学智能体](https://rdagent.readthedocs.io/en/latest/scens/data_science.html) | | Kaggle 场景发布 | 我们发布了 **[Kaggle Agent](https://rdagent.readthedocs.io/en/latest/scens/data_science.html)**，快来体验新功能吧！ | | 官方微信群发布 | 我们建立了一个微信群，欢迎加入！(🗪[二维码](https://github.com/microsoft/RD-Agent/issues/880)) | | 官方 Discord 发布 | 我们在 Discord 上推出了第一个聊天频道 (🗪[![Chat](https://img.shields.io/badge/chat-discord-blue)](https://discord.gg/ybQ97B6Jjy)) | | 首次发布 | **R&D-Agent** 已在 GitHub 上发布 | # 🏆 最佳的机器学习工程智能体！ [MLE-bench](https://github.com/openai/mle-bench) 是一个全面的基准测试，用于评估 AI 智能体在机器学习工程任务上的性能。MLE-bench 利用来自 75 个 Kaggle 竞赛的数据集，对 AI 系统在真实世界 ML 工程场景中的能力提供了可靠的评估。 R&D-Agent 目前在 MLE-bench 上领跑，成为表现最佳的机器学习工程智能体： | Agent | Low == Lite (%) | Medium (%) | High (%) | All (%) | |---------|--------|-----------|---------|----------| | R&D-Agent o3(R)+GPT-4.1(D) | 51.52 ± 6.9 | 19.3 ± 5.5 | 26.67 ± 0 | 30.22 ± 1.5 | | R&D-Agent o1-preview | 48.18 ± 2.49 | 8.95 ± 2.36 | 18.67 ± 2.98 | 22.4 ± 1.1 | | AIDE o1-preview | 34.3 ± 2.4 | 8.8 ± 1.1 | 10.0 ± 1.9 | 16.9 ± 1.1 | **注意：** - **O3(R)+GPT-4.1(D)**：此版本旨在通过将 Research Agent (o3) 与 Development Agent (GPT-4.1) 无缝结合，减少每个循环的平均时间并利用高性价比的后端 LLM 组合。 - **AIDE o1-preview**：代表了原 MLE-bench 论文中报告的此前在 MLE-bench 上的最佳公开结果。 - R&D-Agent o1-preview 的平均值和标准差结果基于 5 个独立的随机种子计算，而 R&D-Agent o3(R)+GPT-4.1(D) 的结果基于 6 个随机种子计算。 - 根据 MLE-Bench，75 项竞赛被分为三个复杂度级别：**Low==Lite** 指我们估计一名经验丰富的 ML 工程师可以在 2 小时内（不包括训练任何模型的时间）提出合理的解决方案；**Medium** 指需要 2 到 10 小时；**High** 指需要超过 10 小时。您可以在线检查上述结果的详细运行记录。 - [R&D-Agent o1-preview 详细运行记录](https://aka.ms/RD-Agent_MLE-Bench_O1-preview) - [R&D-Agent o3(R)+GPT-4.1(D) 详细运行记录](https://aka.ms/RD-Agent_MLE-Bench_O3_GPT41) 有关在 MLE-bench 上运行 R&D-Agent 的信息，请参阅 **[MLE-bench 指南：通过 MLE-bench 运行 ML 工程](https://rdagent.readthedocs.io/en/latest/scens/data_science.html)** # 🥇 首个以数据为中心的量化多智能体框架！ R&D-Agent for Quantitative Finance，简称 **RD-Agent(Q)**，是首个以数据为中心的多智能体框架，旨在通过协调因子与模型协同优化，自动化量化策略的全栈研发过程。 ![image](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/5f3be88345201413.png) 在真实股票市场中进行的广泛实验表明，在成本低于 10 美元的情况下，RD-Agent(Q) 的 ARR 比基准因子库高出约 2 倍，同时使用的因子减少了 70% 以上。它还在更小的资源预算下超越了最先进的深度时间序列模型。其交替的因子与模型优化进一步在预测准确性和策略稳健性之间实现了出色的权衡。您可以通过[论文](https://arxiv.org/abs/2505.15155)了解更多关于 **RD-Agent(Q)** 的细节，并通过[文档](https://rdagent.readthedocs.io/en/latest/scens/quant_agent_fin.html)进行复现。 # 数据科学智能体预览请查看我们的演示视频，展示正在开发的数据科学智能体的当前进展： https://github.com/user-attachments/assets/3eccbecb-34a4-4c81-bce4-d3f8862f7305 # 🌟 介绍

R&D-Agent 旨在自动化工业 R&D 流程中最关键和最有价值的部分，我们首先专注于数据驱动的场景，以简化模型和数据的开发。在方法论上，我们确定了一个包含两个关键组件的框架：“R”负责提出新想法，而“D”负责实现它们。我们相信，R&D 的自动化演进将带来具有巨大工业价值的解决方案。 R&D 是一个非常普遍的场景。R&D-Agent 的出现可以成为您的： - 💰 **自动化量化工厂** ([🎥演示视频](https://rdagent.azurewebsites.net/factor_loop)|[▶️YouTube](https://www.youtube.com/watch?v=X4DK2QZKaKY&t=6s)) - 🤖 **数据挖掘智能体：** 迭代提出数据与模型 ([🎥演示视频 1](https://rdagent.azurewebsites.net/model_loop)|[▶️YouTube](https://www.youtube.com/watch?v=dm0dWL49Bc0&t=104s)) ([🎥演示视频 2](https://rdagent.azurewebsites.net/dmm)|[▶️YouTube](https://www.youtube.com/watch?v=VIaSTZuoZg4)) 并通过从数据中获取知识来实现它们。 - 🦾 **研究 Copilot：** 自动阅读研究论文 ([🎥演示视频](https://rdagent.azurewebsites.net/report_model)|[▶️YouTube](https://www.youtube.com/watch?v=BiA2SfdKQ7o)) / 财务报告 ([🎥演示视频](https://rdagent.azurewebsites.net/report_factor)|[▶️YouTube](https://www.youtube.com/watch?v=ECLTXVcSx-c)) 并实现模型结构或构建数据集。 - 🤖 **Kaggle Agent：** 自动模型调优和特征工程 ([🎥演示视频即将推出...]()) 并将其应用于在竞赛中取得更好成绩。 - 🧪 **FT-Agent：** 面向基准驱动领域适配的自主 LLM fine-tuning。请参阅 [LLM fine-tuning 指南](rdagent/app/finetune/llm/README.md)。 - ... 您可以点击上面的链接查看演示。我们正在不断为项目添加更多方法和场景，以优化您的 R&D 流程并提高生产力。此外，您可以在我们的 **[🖥️ 实时演示](https://rdagent.azurewebsites.net/)** 中查看更多示例。

# ⚡ 快速开始 ### RD-Agent 目前仅支持 Linux。您可以通过运行以下命令来尝试上述演示： ### 🐳 Docker 安装。在尝试大多数场景之前，用户必须确保已安装 Docker。安装说明请参阅 [官方 🐳Docker 页面](https://docs.docker.com/engine/install/)。确保当前用户可以在**不使用 sudo** 的情况下运行 Docker 命令。您可以通过执行 `docker run hello-world` 来验证这一点。 ### 🐍 创建 Conda 环境 - 使用 Python 创建一个新的 conda 环境（在我们的 CI 中对 3.10 和 3.11 进行了充分测试）： conda create -n rdagent python=3.10 - 激活环境： conda activate rdagent ### 🛠️ 安装 R&D-Agent #### 面向用户 - 您可以直接从 PyPI 安装 R&D-Agent 包： pip install rdagent #### 面向开发者 - 如果您想尝试最新版本或为 RD-Agent 做贡献，您可以从源码安装并按照开发设置进行操作： git clone https://github.com/microsoft/RD-Agent cd RD-Agent make dev 更多详情请参阅[开发设置](https://rdagent.readthedocs.io/en/latest/development.html)。 ### 💊 健康检查 - rdagent 提供了一项健康检查功能，目前主要检查两件事。 - Docker 是否安装成功。 - [rdagent ui](https://github.com/microsoft/RD-Agent?tab=readme-ov-file#%EF%B8%8F-monitor-the-application-results) 使用的默认端口是否被占用。 rdagent health_check --no-check-env ### ⚙️ 配置 - 演示需要以下能力： - ChatCompletion - json_mode - embedding 查询您可以通过以下方式设置您的 Chat 模型和 Embedding 模型： - **使用 LiteLLM（默认）**：我们现在支持将 LiteLLM 作为后端，以与多个 LLM 提供商集成。您可以通过多种方式进行配置： **选项 1：两个模型使用 API base** *配置示例：`OpenAI` 设置：* cat << EOF > .env # 设置为 LiteLLM 支持的任何模型。 CHAT_MODEL=gpt-4o EMBEDDING_MODEL=text-embedding-3-small # 配置统一的 API base OPENAI_API_BASE= OPENAI_API_KEY= *配置示例：`Azure OpenAI` 设置：* cat << EOF > .env EMBEDDING_MODEL=azure/ CHAT_MODEL=azure/ AZURE_API_KEY= AZURE_API_BASE= AZURE_API_VERSION= **选项 2：Chat 和 Embedding 模型使用独立的 API base** cat << EOF > .env # 设置为 LiteLLM 支持的任何模型。 # 为 chat 和 embedding 配置独立的 API base # CHAT 模型： CHAT_MODEL=gpt-4o OPENAI_API_BASE= OPENAI_API_KEY= # EMBEDDING 模型： # 以 siliconflow 为例，您可以使用其他提供商。 # 注意：embedding 需要 litellm_proxy 前缀 EMBEDDING_MODEL=litellm_proxy/BAAI/bge-large-en-v1.5 LITELLM_PROXY_API_KEY= LITELLM_PROXY_API_BASE=https://api.siliconflow.cn/v1 *配置示例：`DeepSeek` 设置：* cat << EOF > .env # CHAT 模型：使用 DeepSeek 官方 API CHAT_MODEL=deepseek/deepseek-chat DEEPSEEK_API_KEY= # EMBEDDING 模型：由于 DeepSeek 没有 embedding 模型，使用 SiliconFlow 进行 embedding。 # 注意：embedding 需要 litellm_proxy 前缀 EMBEDDING_MODEL=litellm_proxy/BAAI/bge-m3 LITELLM_PROXY_API_KEY= LITELLM_PROXY_API_BASE=https://api.siliconflow.cn/v1 注意：如果您使用的推理模型在响应中包含思考过程（例如 \ 标签），您需要设置以下环境变量： REASONING_THINK_RM=True 如果您直接使用 `OpenAI API` 或 `Azure OpenAI`，您也可以使用已弃用的后端。有关此弃用的设置和更多配置信息，请参阅[文档](https://rdagent.readthedocs.io/en/latest/installation_and_configuration.html)。 - 如果您的环境配置已完成，请执行以下命令以检查配置是否有效。此步骤是必须的。 rdagent health_check ### 🚀 运行应用程序 **[🖥️ 实时演示](https://rdagent.azurewebsites.net/)** 由以下命令实现（每一项代表一个演示，您可以选择您喜欢的一个）： - 运行 **自动化量化交易与迭代因子模型联合进化**： [Qlib](http://github.com/microsoft/qlib) 自循环因子与模型提出及实现应用程序 rdagent fin_quant - 运行 **自动化量化交易与迭代因子进化**： [Qlib](http://github.com/microsoft/qlib) 自循环因子提出与实现应用程序 rdagent fin_factor - 运行 **自动化量化交易与迭代模型进化**： [Qlib](http://github.com/microsoft/qlib) 自循环模型提出与实现应用程序 rdagent fin_model - 运行 **自动化量化交易与从财报中提取因子**：运行基于财务报告的 [Qlib](http://github.com/microsoft/qlib) 因子提取与实现应用程序 # 1. 通常，您可以使用以下命令运行此场景： rdagent fin_factor_report --report-folder= # 2. 特别地，您需要先准备一些财务报告。您可以参考这个具体示例： wget https://github.com/SunsetWolf/rdagent_resource/releases/download/reports/all_reports.zip unzip all_reports.zip -d git_ignore_folder/reports rdagent fin_factor_report --report-folder=git_ignore_folder/reports - 运行 **自动化模型研究与发展 Copilot**：模型提取与实现应用程序 # 1. 通常，您可以使用以下命令运行您自己的论文/报告： rdagent general_model # 2. 具体来说，您可以像这样做。有关更多细节和其他论文示例，请使用 `rdagent general_model -h`： rdagent general_model "https://arxiv.org/pdf/2210.09789" - 运行 **自动化医疗预测模型进化**：医疗自循环模型提出与实现应用程序 # 通常，您可以使用以下命令运行数据科学程序： rdagent data_science --competition # 特别地，您需要创建一个文件夹来存储竞赛文件（例如，竞赛描述文件、竞赛数据集等），并在您的环境中配置指向该文件夹的路径。此外，在下载竞赛描述符时需要使用 chromedriver，您可以参考以下具体示例： # 1. 下载数据集，并将其解压到目标文件夹。 wget https://github.com/SunsetWolf/rdagent_resource/releases/download/ds_data/arf-12-hours-prediction-task.zip unzip arf-12-hours-prediction-task.zip -d ./git_ignore_folder/ds_data/ # 2. 在 `.env` 文件中配置环境变量 dotenv set DS_LOCAL_DATA_PATH "$(pwd)/git_ignore_folder/ds_data" dotenv set DS_CODER_ON_WHOLE_PIPELINE True dotenv set DS_IF_USING_MLE_DATA False dotenv set DS_SAMPLE_DATA_BY_LLM False dotenv set DS_SCEN rdagent.scenarios.data_science.scen.DataScienceScen # 3. 运行应用程序 rdagent data_science --competition arf-12-hours-prediction-task **注意：** 有关数据集的更多信息，请参阅[文档](https://rdagent.readthedocs.io/en/latest/scens/data_science.html)。 - 运行 **自动化 Kaggle 模型调优与特征工程**：自循环模型提出与特征工程实现应用程序
# 通常，您可以使用以下命令运行 Kaggle 竞赛程序： rdagent data_science --competition # 1. 在 `.env` 文件中配置环境变量 mkdir -p ./git_ignore_folder/ds_data dotenv set DS_LOCAL_DATA_PATH "$(pwd)/git_ignore_folder/ds_data" dotenv set DS_CODER_ON_WHOLE_PIPELINE True dotenv set DS_IF_USING_MLE_DATA True dotenv set DS_SAMPLE_DATA_BY_LLM True dotenv set DS_SCEN rdagent.scenarios.data_science.scen.KaggleScen # 2. 运行应用程序 rdagent data_science --competition tabular-playground-series-dec-2021 - 运行 **用于自主 LLM fine-tuning 的 FT-Agent**：一个 ICML 2026 LLM fine-tuning 场景，用于基准驱动的数据处理、训练、评估和反馈引导的优化。 # 查看完整的设置、基准说明、数据集注释和示例： # rdagent/app/finetune/llm/README.md # 在运行前配置 FT_TARGET_BENCHMARK 和 FT_BENCHMARK_DESCRIPTION。 rdagent llm_finetune --base-model Qwen/Qwen2.5-7B-Instruct ### 🖥️ 监控应用程序结果 #### Streamlit UI 使用 Streamlit UI 查看运行日志，特别是对于 `data_science` 场景。 ``` rdagent ui --port 19899 --log-dir --data-science ``` 关于 `data_science` 参数：如果您想查看数据科学场景的日志，请将 `data_science` 参数设置为 `True`；否则将其设置为 `False`。 #### Web UI 我们还为 `server_ui` 启动的 Flask 后端提供了一个独立的 Web 前端，位于 `web/` 目录中。 **注意：** 此 Web UI 与 `rdagent ui` 不同。当前的 Web UI 暂不支持 `data_science` 场景。对于 `data_science` 场景，请继续使用 `rdagent ui --data-science`。 ``` cd web npm install ``` 要为 Flask 后端构建前端，请将静态资源生成到 `server_ui` 使用的默认目录中： ``` cd web npm run build:flask ``` 默认情况下，`server_ui` 从 `./git_ignore_folder/static` 提供静态文件。如果您需要使用其他位置，请在启动后端之前设置 `UI_STATIC_PATH` 环境变量。启动 Flask 后端，并连同实时 API 一起提供构建好的前端： ``` rdagent server_ui --port 19899 ``` 之后，在浏览器中打开 `http://127.0.0.1:19899`。 #### 常见注意事项上述示例中使用了端口 `19899`。在启动任一 UI 之前，请检查此端口是否已被占用。如果已被占用，请将其更改为其他可用端口。您可以通过运行以下命令来检查端口是否被占用： ``` rdagent health_check --no-check-env --no-check-docker ``` # 🏭 场景我们已将 R&D-Agent 应用于多个有价值的数据驱动工业场景。 ## 🎯 目标：用于数据驱动 R&D 的智能体在这个项目中，我们旨在构建一个自动化数据驱动 R&D 的智能体，它可以： + 📄 阅读真实世界的材料（报告、论文等）并 **提取** 关键公式、感兴趣的 **特征** 和 **模型** 描述，这些是数据驱动 R&D 的关键组成部分。 + 🛠️ **实现** 将提取的公式（如特征、因子和模型）转换为可运行的代码。 + 由于 LLM 一次性实现的能力有限，为智能体建立一个演进过程，通过从反馈和知识中学习来提高性能。 + 💡 基于当前的知识和观察 **提出新想法**。 ## 📈 场景/演示在数据驱动场景的两个关键领域（模型实现和数据构建）中，我们的系统旨在充当两个主要角色：🦾Copilot 和 🤖Agent。 - 🦾Copilot 遵循人类的指示以自动化重复性的任务。 - 🤖Agent 更加自主，为了在未来取得更好的结果而主动提出想法。支持的场景如下所示： | 场景/目标 | 模型实现 | 数据构建 | | -- | -- | -- | | **💹 金融** | 🤖 [迭代提出想法与进化](https://rdagent.azurewebsites.net/model_loop)[▶️YouTube](https://www.youtube.com/watch?v=dm0dWL49Bc0&t=104s) | 🤖 [迭代提出想法与进化](https://rdagent.azurewebsites.net/factor_loop) [▶️YouTube](https://www.youtube.com/watch?v=X4DK2QZKaKY&t=6s)
🦾 [自动财报阅读与实现](https://rdagent.azurewebsites.net/report_factor)[▶️YouTube](https://www.youtube.com/watch?v=ECLTXVcSx-c) | | **🩺 医疗** | 🤖 [迭代提出想法与进化](https://rdagent.azurewebsites.net/dmm)[▶️YouTube](https://www.youtube.com/watch?v=VIaSTZuoZg4) | - | | **🏭 通用** | 🦾 [自动论文阅读与实现](https://rdagent.azurewebsites.net/report_model)[▶️YouTube](https://www.youtube.com/watch?v=BiA2SfdKQ7o)
🤖 自动 Kaggle 模型调优 | 🤖自动 Kaggle 特征工程 | - **[路线图](https://rdagent.readthedocs.io/en/latest/scens/data_science.html#roadmap)**：目前，我们正致力于为 Kaggle 场景添加新功能。不同场景在入口和配置上有所不同。请在场景文档中查看详细的设置教程。这里是[成功探索](https://github.com/SunsetWolf/rdagent_resource/releases/download/demo_traces/demo_traces.zip)的展示（在 **[🖥️ 实时演示](https://rdagent.azurewebsites.net/)** 中展示了 5 条轨迹）。您可以从文档中使用[此命令](https://github.com/microsoft/RD-Agent?tab=readme-ov-file#%EF%B8%8F-monitor-the-application-results)下载并查看执行轨迹。有关场景的更多详细信息，请参阅 **[📖readthedocs_scen](https://rdagent.readthedocs.io/en/latest/scens/catalog.html)**。 # ⚙️ 框架

在数据科学中自动化 R&D 流程是工业界极具价值但尚未得到充分探索的领域。我们提出了一个框架，以推动这一重要研究领域的发展。该框架内的研究问题可划分为三个主要类别： | 研究领域 | 论文/工作列表 | |--------------------|-----------------| | **对 R&D 能力进行基准测试** | [Benchmark](#benchmark) | | **想法提出：** 探索新想法或完善现有想法 | [Research](#research) | | **实现想法的能力：** 实现并执行想法 | [Development](#development) | 我们相信，提供高质量解决方案的关键在于不断演进 R&D 能力。智能体应该像人类专家一样学习，不断提高他们的 R&D 技能。更多文档可在 **[📖 readthedocs](https://rdagent.readthedocs.io/)** 中找到。 # 📃 论文/工作列表 ## 总体技术报告 - [R&D-Agent: An LLM-Agent Framework Towards Autonomous Data Science](https://arxiv.org/abs/2505.14738) ``` @misc{yang2025rdagentllmagentframeworkautonomous, title={R&D-Agent: An LLM-Agent Framework Towards Autonomous Data Science}, author={Xu Yang and Xiao Yang and Shikai Fang and Yifei Zhang and Jian Wang and Bowen Xian and Qizheng Li and Jingyuan Li and Minrui Xu and Yuante Li and Haoran Pan and Yuge Zhang and Weiqing Liu and Yelong Shen and Weizhu Chen and Jiang Bian}, year={2025}, eprint={2505.14738}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2505.14738}, } ``` ![image](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/6dced959bd201430.png) ## 📊 基准测试 - [Towards Data-Centric Automatic R&D](https://arxiv.org/abs/2404.11276) ``` @misc{chen2024datacentric, title={Towards Data-Centric Automatic R&D}, author={Haotian Chen and Xinjie Shen and Zeqi Ye and Wenjun Feng and Haoxue Wang and Xiao Yang and Xu Yang and Weiqing Liu and Jiang Bian}, year={2024}, eprint={2404.11276}, archivePrefix={arXiv}, primaryClass={cs.AI} } ``` ![image](https://github.com/user-attachments/assets/494f55d3-de9e-4e73-ba3-a787e8f9e841) ## 🔍 研究在数据挖掘专家的日常研发过程中，他们会提出一个假设（例如，像 RNN 这样的模型结构可以捕捉时间序列数据中的模式），设计实验（例如，金融数据包含时间序列，我们可以在这个场景中验证该假设），将实验实现为代码（例如，Pytorch 模型结构），然后执行代码以获得反馈（例如，指标、损失曲线等）。专家们从反馈中学习，并在下一次迭代中不断改进。基于上述原则，我们建立了一个基本的方法框架，能够不断提出假设，验证它们，并从真实世界的实践中获得反馈。这是第一个支持与真实世界验证相连接的科研自动化框架。有关更多详细信息，请参阅我们的 **[🖥️ 实时演示页面](https://rdagent.azurewebsites.net)**。 ## 🛠️ 开发 - [Collaborative Evolving Strategy for Automatic Data-Centric Development](https://arxiv.org/abs/2407.18690) ``` @misc{yang2024collaborative, title={Collaborative Evolving Strategy for Automatic Data-Centric Development}, author={Xu Yang and Haotian Chen and Wenjun Feng and Haoxue Wang and Zeqi Ye and Xinjie Shen and Xiao Yang and Shizhao Sun and Weiqing Liu and Jiang Bian}, year={2024}, eprint={2407.18690}, archivePrefix={arXiv}, primaryClass={cs.AI} } ``` ![image](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/d95272573e201447.png) ## 在多种场景中的深度应用 - [FT-Dojo: Towards Autonomous LLM Fine-Tuning with Language Agents](https://arxiv.org/abs/2603.01712) ``` @misc{li2026ftdojo, title={FT-Dojo: Towards Autonomous LLM Fine-Tuning with Language Agents}, author={Qizheng Li and Yifei Zhang and Xiao Yang and Xu Yang and Zhuo Wang and Weiqing Liu and Jiang Bian}, year={2026}, eprint={2603.01712}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2603.01712} } ``` FT-Agent 是本文提出的自主 LLM fine-tuning 场景，可通过 [LLM fine-tuning 指南](rdagent/app/finetune/llm/README.md) 获取。 - [R&D-Agent-Quant: A Multi-Agent Framework for Data-Centric Factors and Model Joint Optimization](https://arxiv.org/abs/2505.15155) ``` @misc{li2025rdagentquantmultiagentframeworkdatacentric, title={R&D-Agent-Quant: A Multi-Agent Framework for Data-Centric Factors and Model Joint Optimization}, author={Yuante Li and Xu Yang and Xiao Yang and Minrui Xu and Xisen Wang and Weiqing Liu and Jiang Bian}, year={2025}, eprint={2505.15155}, archivePrefix={arXiv}, primaryClass={q-fin.CP}, url={https://arxiv.org/abs/2505.15155}, } ``` ![image](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/642ba735f0201458.png) - [Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search](https://arxiv.org/abs/2603.01692) ``` @article{zhang2026reasoning, title={Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search}, author={Zhang, Yifei and Yang, Xu and Yang, Xiao and Xian, Bowen and Li, Qizheng and Fang, Shikai and Li, Jingyuan and Wang, Jian and Xu, Mingrui and Liu, Weiqing and others}, journal={arXiv preprint arXiv:2603.01692}, year={2026} } ``` 您可以在 [Gome GPT-5 Traces](https://huggingface.co/datasets/amstrongzyf/Gome-GPT5-Traces) 在线查看详细的执行轨迹。 # 🤝 贡献我们欢迎各种贡献和建议来改进 R&D-Agent。有关如何贡献的更多详细信息，请参阅[贡献指南](CONTRIBUTING.md)。在提交 pull request 之前，请确保您的代码通过了自动 CI 检查。 ## 📝 指南本项目欢迎各种贡献和建议。为这个项目做贡献既简单又有回报。无论是解决问题、修复 bug、完善文档，甚至是纠正一个拼写错误，每一份贡献都是有价值的，都能帮助改进 R&D-Agent。要开始贡献，您可以浏览 issues 列表，或者通过运行命令 `grep -r "TODO:"` 在代码库中搜索 `TODO:` 注释。

在我们将 R&D-Agent 作为开源项目发布到 GitHub 之前，它是我们小组内的一个内部项目。遗憾的是，我们在移除一些机密代码时未能保留内部的提交历史。因此，我们团队成员（包括 Haotian Chen、Wenjun Feng、Haoxue Wang、Zeqi Ye、Xinjie Shen 和 Jinhui Li）的部分贡献未能包含在公开的提交中。 # ⚖️ 法律免责声明

RD-agent 按“原样”提供，不提供任何形式的明示或暗示的保证，包括但不限于适销性、特定用途适用性和不侵权的保证。RD-agent 旨在促进金融行业的研发流程，并未准备好用于任何金融投资或建议。用户应独立评估和测试 RD-agent 在特定使用场景中的风险，确保负责任地使用 AI 技术，包括但不限于开发和整合风险缓解措施，并遵守所有适用司法管辖区的所有适用法律和法规。RD-agent 不提供财务意见，也不反映微软的观点，其目的亦非取代合格的金融专业人员在制定、评估和批准金融产品中的作用。RD-agent 的输入和输出归用户所有，用户应根据任何责任理论（无论是合同、侵权、监管、过失、产品责任还是其他方面）承担与使用 RD-agent 及其任何输入和输出相关的所有责任。

标签：Python, 人工智能, 数据驱动, 无后门, 模型优化, 用户模式Hook绕过, 自动化研发, 请求拦截, 逆向工具