LLMQuant/quant-mind

GitHub: LLMQuant/quant-mind

QuantMind 是一个量化金融智能知识框架,通过将非结构化金融内容转化为语义知识图谱来实现高效的 AI 驱动研究与检索。

Stars: 1397 | Forks: 227

Transform Financial Knowledge into Actionable Intelligence

License Python Version

Why QuantMindArchitectureQuick StartUsageRoadmapVisionContributing

**QuantMind** 是一个面向量化金融的智能知识提取与检索框架。它将非结构化的金融内容(论文、新闻、博客、报告)转化为可查询的知识库,从而实现大规模的 AI 驱动研究。 ### 📰 新闻 | 🗞️ 新闻 | 📝 描述 | |----------------|-------------------------------------------------------------------------------| | 🎉 被 NeurIPS 2025 Workshop 接收 | 我们的论文 **[Quant-Mind](#)** 已被 **[NeurIPS 2025 GenAI in Finance Workshop](https://sites.google.com/view/neurips-25-gen-ai-in-finance/home)** 接收!🚀 | | 📢 在 GitHub 首次发布 | **Quant-Mind** 现已在 GitHub 上线——请查看并加入我们!🤗 | ### 🧐 概览 QuantMind 是一个新一代的 AI 平台,能够摄取、处理并结构化**每一份**全新的量化金融研究内容(包括论文、新闻、博客和 SEC 文件),并将其整合为**语义知识图谱**。机构投资者、对冲基金和研究团队现在可以在**几秒钟内**探索因子策略、风险模型和市场洞察的前沿,解锁原本会被埋没的 alpha。 ### ✨ 为什么选择 QuantMind? 金融研究领域的信息量令人应接不暇。每天都会发表数百篇论文、文章和报告。 #### 🌐 机遇 - **信息过载**:每天发布 500 篇新的研究报告和论文。人工查阅需要数周时间——成本高昂、容易出错且不可扩展 - **庞大的市场**:金融数据与分析市场 ≫ 预计到 2032 年将增长至 9618.9 亿美元,复合年增长率为 13.5%。成千上万的量化团队和资产管理者都在渴求速度 - **高投资回报率**:研究效率提升 1% 就能转化为交易表现中数百万美元的节省或收益 #### 💡 **QuantMind** 的解决方案 - 🔍 从任何来源(PDF、网页、API)**提取**结构化知识 - 🧠 使用针对金融领域微调的特定领域 LLM 来**理解**内容 - 💾 将信息**存储**在语义知识图谱中 - 🚀 通过自然语言查询**检索**洞察 ### 系统架构 ![quantmind-outline](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/a3bcd6d791132609.png) QuantMind 构建于解耦的双阶段架构之上。这种设计将数据摄取与智能检索的关注点分离开来,从而确保了系统的鲁棒性和灵活性。 #### **阶段 1:知识提取** 该层负责收集、解析原始信息,并将其结构化为标准的知识单元。 ``` Source APIs (arXiv, News, Blogs) → Intelligent Parser → Workflow/Agent → Structured Knowledge Base ``` - **Source**:连接到各种来源(学术 API、新闻源、金融博客、perplexity 搜索源)以拉取内容 - **Parser**:从 PDF、HTML 和其他格式中提取文本、表格和图表 - **Tagger**:自动将内容分类到不同的研究领域和主题 - **Workflow/Agent**:通过质量控制和去重来编排提取 pipeline #### **阶段 2:智能检索** 该层通过各种检索机制将结构化知识转化为可操作的洞察。 ``` Knowledge Base → Embeddings → Solution Scenarios (DeepResearch, RAG, Data MCP, ...) ``` - **Embedding Generation**:将知识单元转换为高维向量,用于语义搜索 - 解决方案场景:包括多种检索模式: - **DeepResearch**:跨文档的复杂多跳推理 - **RAG**:用于问答的检索增强生成 - **Data MCP**:结构化数据访问协议 - 基于用例的定制化检索模式 ### 🚀 快速开始 我们使用 [uv](https://github.com/astral-sh/uv) 进行快速且可靠的 Python 包管理。 **前置条件:** - Python 3.8+ - Git **安装说明:** 1. **安装 uv(如果尚未安装):** # 在 macOS 和 Linux 上 curl -LsSf https://astral.sh/uv/install.sh | sh # 在 Windows 上 powershell -c "irm https://astral.sh/uv/install.ps1 | iex" # 或使用 pip pip install uv 2. **克隆代码仓库:** git clone https://github.com/LLMQuant/quant-mind.git cd quant-mind 3. **创建并激活虚拟环境:** # 创建虚拟环境 uv venv # 激活它 # 在 macOS/Linux 上: source .venv/bin/activate # 在 Windows 上: .venv\Scripts\activate 4. **安装依赖:** uv pip install -e . ### 📚 使用示例 #### 通过 `paper_flow` 运行单篇论文 ``` import asyncio from quantmind.configs import PaperFlowCfg from quantmind.configs.paper import ArxivIdentifier from quantmind.flows import paper_flow async def main() -> None: paper = await paper_flow( ArxivIdentifier(id="2401.12345"), cfg=PaperFlowCfg(model="gpt-4o-mini"), ) print(paper.model_dump_json(indent=2)) asyncio.run(main()) ``` #### 通过 `batch_run` 批量处理 ``` import asyncio from quantmind.configs import PaperFlowCfg from quantmind.configs.paper import ArxivIdentifier from quantmind.flows import batch_run, paper_flow async def main() -> None: inputs = [ArxivIdentifier(id=aid) for aid in ( "2401.12345", "2401.12346", "2401.12347", )] result = await batch_run( paper_flow, inputs, cfg=PaperFlowCfg(model="gpt-4o-mini"), concurrency=3, on_error="skip", on_progress=lambda done, total: print(f"{done}/{total}"), ) print(f"ok={result.success_count} failed={result.failure_count}") asyncio.run(main()) ``` #### 通过 `magic` 解析自由格式的意图 ``` import asyncio from quantmind.flows import paper_flow from quantmind.magic import resolve_magic_input async def main() -> None: inp, cfg = await resolve_magic_input( "Pull arXiv 2401.12345 about cross-sectional momentum; use gpt-4o-mini.", target_flow=paper_flow, ) paper = await paper_flow(inp, cfg=cfg) print(paper.model_dump_json(indent=2)) asyncio.run(main()) ``` ### 🗺️ 路线图 - [x] 更好的 `flow` 设计以提升用户体验 - [x] 首个生产级示例(Quant Paper Agent) - [ ] 将 Agent 层迁移至 OpenAI Agents SDK - [ ] 使用 `knowledge/`(基于 Pydantic)标准化知识格式 - [ ] 增加更多内容来源(金融新闻、博客、报告) - [ ] 用于批量文档处理的跨步骤工作记忆(`mind/memory`) ### 愿景:智能研究框架 QuantMind 的设计基于一个更宏大的愿景:成为所有金融知识的综合智能层。我们正在构建一个系统,该系统能够理解学术研究、市场新闻、分析师报告和社交情绪之间的相互联系,从而创建一个支持更好的财务决策的统一知识库。 我们今天打下的基础——从论文开始——将扩展到涵盖整个金融信息生态系统。 这一未来状态代表了我们的承诺:超越简单的数据聚合,迈向金融领域中真正的机器智能。 ### License QuantMind 采用 MIT License 发布——详情请参阅 `LICENSE`。 ### ❤️ 致谢 - **arXiv** 提供了通往海量研究的开放访问权限。 - **开源社区** 提供了促成此项目的各种工具和库。
标签:DLL 劫持, Petitpotam, 人工智能, 代码示例, 信息检索, 大语言模型, 数据分析, 用户模式Hook绕过, 知识提取, 逆向工具, 量化金融