AI-Security-Internships-2026/04-secure-rag-cyber-threat-intelligence
GitHub: AI-Security-Internships-2026/04-secure-rag-cyber-threat-intelligence
一个隐私保护型 RAG 研究项目,旨在让组织在不暴露明文敏感指标的情况下共享和查询 STIX/TAXII 格式的结构化网络威胁情报。
Stars: 0 | Forks: 0
# 用于网络威胁情报共享的安全 RAG Pipeline
## 研究问题
开发一个保护隐私的 RAG 系统,使组织能够共享和查询结构化威胁情报(STIX/TAXII),而不会以明文形式暴露敏感指标。
## 目标
1. 针对该主题进行系统的文献综述。
2. 设计并实现一个概念验证原型。
3. 在真实或基准数据集上评估原型。
4. 将研究发现记录在最终的技术报告中。
5. 向研究小组展示结果。
## 预期交付物
| 交付物 | 截止日期 |
|---|---|
| 文献综述 (`docs/literature-review.md`) | 第 2 周 |
| 架构设计文档 (`docs/proposal.md`) | 第 3 周 |
| 可运行的原型 (`src/`) | 第 6 周 |
| 评估结果 (`experiments/results/`) | 第 7 周 |
| 最终报告 (`docs/final-report.md`) | 第 8 周 |
## 推荐技术栈
```
Python, LangChain, STIX2, TAXII2, ChromaDB, FastAPI
```
有关锁定的依赖项,请参见 `requirements.txt`。
## 每周工作流程
```
Monday – Review weekly tasks in tasks/week-XX.md
Tue–Thu – Implementation / experiments
Friday – Document progress in docs/weekly-progress.md
Friday – Open weekly Pull Request from your branch → dev
```
## 分支策略
| 分支 | 用途 |
|---|---|
| `main` | 仅限稳定的、经过导师审查的代码 |
| `dev` | 集成分支 — 在此合并每周的 PR |
| `-week-XX` | 你每周的工作分支 |
**学生严禁直接推送到 `main`。**
## Pull Request 策略
- 每周一个 PR,目标分支为 `dev`。
- PR 标题格式:`[Week XX] 简短描述`
- PR 描述必须引用每周的任务文件并总结所做的工作。
- 合并前必须由导师或同学进行审查。
## 新手入门
```
# 1. Clone the repository
git clone https://github.com/AI-Security-Internships-2026/04-secure-rag-cyber-threat-intelligence.git
cd 04-secure-rag-cyber-threat-intelligence
# 2. 创建并激活 virtual environment
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
# 3. 安装依赖
pip install -r requirements.txt
# 4. 创建你的 weekly branch
git checkout dev
git pull origin dev
git checkout -b your-name-week-01
# 5. 运行 starter script
python src/main.py
```
## 导师备注
此代码库由 **CNIT/PNTLab Pisa, TECIP, Scuola Superiore Sant'Anna** 管理。
在进行架构更改之前,请联系你的导师。
所有代码必须是原创的或已正确注明出处。
请**不要**提交 API 密钥、密码或大型数据集 — 参见 `.gitignore`。
标签:Python, RAG, 威胁情报, 开发者工具, 无后门, 网络安全, 网络安全, 逆向工具, 隐私保护, 隐私保护