LLMQuant/quant-mind

GitHub: LLMQuant/quant-mind

QuantMind 是一个量化金融智能知识框架，通过将非结构化金融内容转化为语义知识图谱来实现高效的 AI 驱动研究与检索。

Stars: 2149 | Forks: 372

Transform Financial Knowledge into Actionable Intelligence

Why QuantMind • Architecture • Quick Start • Usage • Roadmap • Vision • Contributing

**QuantMind** 是一个面向量化金融的智能知识提取与检索框架。它将非结构化的金融内容（论文、新闻、博客、报告）转化为可查询的知识库，从而实现大规模的 AI 驱动研究。 ### 📰 新闻 | 🗞️ 新闻 | 📝 描述 | |----------------|-------------------------------------------------------------------------------| | 🎉 被 NeurIPS 2025 Workshop 接收 | 我们的论文 **[Quant-Mind](#)** 已被 **[NeurIPS 2025 GenAI in Finance Workshop](https://sites.google.com/view/neurips-25-gen-ai-in-finance/home)** 接收！🚀 | | 📢 在 GitHub 首次发布 | **Quant-Mind** 现已在 GitHub 上线——请查看并加入我们！🤗 | ### 🧐 概览 QuantMind 是一个新一代的 AI 平台，能够摄取、处理并结构化**每一份**全新的量化金融研究内容（包括论文、新闻、博客和 SEC 文件），并将其整合为**语义知识图谱**。机构投资者、对冲基金和研究团队现在可以在**几秒钟内**探索因子策略、风险模型和市场洞察的前沿，解锁原本会被埋没的 alpha。 ### ✨ 为什么选择 QuantMind？金融研究领域的信息量令人应接不暇。每天都会发表数百篇论文、文章和报告。 #### 🌐 机遇 - **信息过载**：每天发布 500 篇新的研究报告和论文。人工查阅需要数周时间——成本高昂、容易出错且不可扩展 - **庞大的市场**：金融数据与分析市场 ≫ 预计到 2032 年将增长至 9618.9 亿美元，复合年增长率为 13.5%。成千上万的量化团队和资产管理者都在渴求速度 - **高投资回报率**：研究效率提升 1% 就能转化为交易表现中数百万美元的节省或收益 #### 💡 **QuantMind** 的解决方案 - 🔍 从任何来源（PDF、网页、API）**提取**结构化知识 - 🧠 使用针对金融领域微调的特定领域 LLM 来**理解**内容 - 💾 将信息**存储**在语义知识图谱中 - 🚀 通过自然语言查询**检索**洞察 ### 系统架构 ![quantmind-outline](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/a3bcd6d791132609.png) QuantMind 构建于解耦的双阶段架构之上。这种设计将数据摄取与智能检索的关注点分离开来，从而确保了系统的鲁棒性和灵活性。 #### **阶段 1：知识提取** 该层负责收集、解析原始信息，并将其结构化为标准的知识单元。 ``` Source APIs (arXiv, News, Blogs) → Intelligent Parser → Workflow/Agent → Structured Knowledge Base ``` - **Source**：连接到各种来源（学术 API、新闻源、金融博客、perplexity 搜索源）以拉取内容 - **Parser**：从 PDF、HTML 和其他格式中提取文本、表格和图表 - **Tagger**：自动将内容分类到不同的研究领域和主题 - **Workflow/Agent**：通过质量控制和去重来编排提取 pipeline #### **阶段 2：智能检索** 该层通过各种检索机制将结构化知识转化为可操作的洞察。 ``` Knowledge Base → Embeddings → Solution Scenarios (DeepResearch, RAG, Data MCP, ...) ``` - **Embedding Generation**：将知识单元转换为高维向量，用于语义搜索 - 解决方案场景：包括多种检索模式： - **DeepResearch**：跨文档的复杂多跳推理 - **RAG**：用于问答的检索增强生成 - **Data MCP**：结构化数据访问协议 - 基于用例的定制化检索模式 ### 🚀 快速开始我们使用 [uv](https://github.com/astral-sh/uv) 进行快速且可靠的 Python 包管理。 **前置条件：** - Python 3.8+ - Git **安装说明：** 1. **安装 uv（如果尚未安装）：** # 在 macOS 和 Linux 上 curl -LsSf https://astral.sh/uv/install.sh | sh # 在 Windows 上 powershell -c "irm https://astral.sh/uv/install.ps1 | iex" # 或使用 pip pip install uv 2. **克隆代码仓库：** git clone https://github.com/LLMQuant/quant-mind.git cd quant-mind 3. **创建并激活虚拟环境：** # 创建虚拟环境 uv venv # 激活它 # 在 macOS/Linux 上： source .venv/bin/activate # 在 Windows 上： .venv\Scripts\activate 4. **安装依赖：** uv pip install -e . ### 📚 使用示例 #### 通过 `paper_flow` 运行单篇论文 ``` import asyncio from quantmind.configs import PaperFlowCfg from quantmind.configs.paper import ArxivIdentifier from quantmind.flows import paper_flow async def main() -> None: paper = await paper_flow( ArxivIdentifier(id="2401.12345"), cfg=PaperFlowCfg(model="gpt-4o-mini"), ) print(paper.model_dump_json(indent=2)) asyncio.run(main()) ``` #### 通过 `batch_run` 批量处理 ``` import asyncio from quantmind.configs import PaperFlowCfg from quantmind.configs.paper import ArxivIdentifier from quantmind.flows import batch_run, paper_flow async def main() -> None: inputs = [ArxivIdentifier(id=aid) for aid in ( "2401.12345", "2401.12346", "2401.12347", )] result = await batch_run( paper_flow, inputs, cfg=PaperFlowCfg(model="gpt-4o-mini"), concurrency=3, on_error="skip", on_progress=lambda done, total: print(f"{done}/{total}"), ) print(f"ok={result.success_count} failed={result.failure_count}") asyncio.run(main()) ``` #### 通过 `magic` 解析自由格式的意图 ``` import asyncio from quantmind.flows import paper_flow from quantmind.magic import resolve_magic_input async def main() -> None: inp, cfg = await resolve_magic_input( "Pull arXiv 2401.12345 about cross-sectional momentum; use gpt-4o-mini.", target_flow=paper_flow, ) paper = await paper_flow(inp, cfg=cfg) print(paper.model_dump_json(indent=2)) asyncio.run(main()) ``` ### 🗺️ 路线图 - [x] 更好的 `flow` 设计以提升用户体验 - [x] 首个生产级示例（Quant Paper Agent） - [ ] 将 Agent 层迁移至 OpenAI Agents SDK - [ ] 使用 `knowledge/`（基于 Pydantic）标准化知识格式 - [ ] 增加更多内容来源（金融新闻、博客、报告） - [ ] 用于批量文档处理的跨步骤工作记忆（`mind/memory`） ### 愿景：智能研究框架 QuantMind 的设计基于一个更宏大的愿景：成为所有金融知识的综合智能层。我们正在构建一个系统，该系统能够理解学术研究、市场新闻、分析师报告和社交情绪之间的相互联系，从而创建一个支持更好的财务决策的统一知识库。我们今天打下的基础——从论文开始——将扩展到涵盖整个金融信息生态系统。这一未来状态代表了我们的承诺：超越简单的数据聚合，迈向金融领域中真正的机器智能。 ### License QuantMind 采用 MIT License 发布——详情请参阅 `LICENSE`。 ### ❤️ 致谢 - **arXiv** 提供了通往海量研究的开放访问权限。 - **开源社区** 提供了促成此项目的各种工具和库。

标签：DLL 劫持, Petitpotam, 人工智能, 代码示例, 信息检索, 大语言模型, 数据分析, 用户模式Hook绕过, 知识提取, 逆向工具, 量化金融