AI-Security-Internships-2026/04-secure-rag-cyber-threat-intelligence

GitHub: AI-Security-Internships-2026/04-secure-rag-cyber-threat-intelligence

一个隐私保护型 RAG 研究项目，旨在让组织在不暴露明文敏感指标的情况下共享和查询 STIX/TAXII 格式的结构化网络威胁情报。

Stars: 0 | Forks: 0

# 用于网络威胁情报共享的安全 RAG Pipeline ## 研究问题开发一个保护隐私的 RAG 系统，使组织能够共享和查询结构化威胁情报（STIX/TAXII），而不会以明文形式暴露敏感指标。 ## 目标 1. 针对该主题进行系统的文献综述。 2. 设计并实现一个概念验证原型。 3. 在真实或基准数据集上评估原型。 4. 将研究发现记录在最终的技术报告中。 5. 向研究小组展示结果。 ## 预期交付物 | 交付物 | 截止日期 | |---|---| | 文献综述 (`docs/literature-review.md`) | 第 2 周 | | 架构设计文档 (`docs/proposal.md`) | 第 3 周 | | 可运行的原型 (`src/`) | 第 6 周 | | 评估结果 (`experiments/results/`) | 第 7 周 | | 最终报告 (`docs/final-report.md`) | 第 8 周 | ## 推荐技术栈 ``` Python, LangChain, STIX2, TAXII2, ChromaDB, FastAPI ``` 有关锁定的依赖项，请参见 `requirements.txt`。 ## 每周工作流程 ``` Monday – Review weekly tasks in tasks/week-XX.md Tue–Thu – Implementation / experiments Friday – Document progress in docs/weekly-progress.md Friday – Open weekly Pull Request from your branch → dev ``` ## 分支策略 | 分支 | 用途 | |---|---| | `main` | 仅限稳定的、经过导师审查的代码 | | `dev` | 集成分支 — 在此合并每周的 PR | | `-week-XX` | 你每周的工作分支 | **学生严禁直接推送到 `main`。** ## Pull Request 策略 - 每周一个 PR，目标分支为 `dev`。 - PR 标题格式：`[Week XX] 简短描述` - PR 描述必须引用每周的任务文件并总结所做的工作。 - 合并前必须由导师或同学进行审查。 ## 新手入门 ``` # 1. Clone the repository git clone https://github.com/AI-Security-Internships-2026/04-secure-rag-cyber-threat-intelligence.git cd 04-secure-rag-cyber-threat-intelligence # 2. 创建并激活 virtual environment python -m venv .venv source .venv/bin/activate # Windows: .venv\Scripts\activate # 3. 安装依赖 pip install -r requirements.txt # 4. 创建你的 weekly branch git checkout dev git pull origin dev git checkout -b your-name-week-01 # 5. 运行 starter script python src/main.py ``` ## 导师备注此代码库由 **CNIT/PNTLab Pisa, TECIP, Scuola Superiore Sant'Anna** 管理。在进行架构更改之前，请联系你的导师。所有代码必须是原创的或已正确注明出处。请**不要**提交 API 密钥、密码或大型数据集 — 参见 `.gitignore`。

标签：Python, RAG, 威胁情报, 开发者工具, 无后门, 网络安全, 网络安全, 逆向工具, 隐私保护, 隐私保护