JoeW00/llm_security_term_project

GitHub: JoeW00/llm_security_term_project

基于 LLM 的自主式 SOC Tier-1 事件响应代理，自动化完成告警研判、ATT&CK 对应、剧本生成与人工核准闭环。

Stars: 0 | Forks: 0

# 自主式 SOC Tier-1 事件回應代理 ## 這是什麼 SOC（Security Operations Center，資安監控中心）每天收到大量告警，多數是誤報。本專案是一個自動化的 **Tier-1（第一線）事件回應代理**：告警進來後，它先分輕重、查威脅情資、用 LLM 研判真偽、對應 MITRE ATT&CK 攻擊手法、生成處置劇本並自我檢查，最後**交由人類核准才算數**——機器本身不執行任何破壞性處置。核心設計理念：**「讓 LLM 讀告警內容」是一把雙面刃**——它讓研判更準（verdict 準確率 0.5 → 0.833），但也使提示注入（prompt injection）成為可能。因此系統以**縱深防禦**收尾：prompt 層的信任邊界降低被騙率，`human_approval` 人工閘門阻斷「被騙輸出被自動採用」的後果。 ## 流程 flowchart LR A[ingest 收件] --> B[triage 分流] B -->|低風險旁路| H[human_approval 人工核准] B -->|中/高風險| C[enrich 情資增強] C --> D[investigate 研判] D --> E[attack_mapping ATT&CK 對應] E --> F[playbook 劇本生成] F --> G[critique 自我檢查] G -->|不合格,回頭重生 ≤3 次| F G -->|合格或達上限| H H --> I[report 報告] 文字版：`ingest → triage → [route] → enrich → investigate → attack_mapping → playbook → [critique 迴圈] → human_approval → report` - **`[route]`**：低風險告警直接旁路到 `human_approval`，不浪費後續算力（`routing.py`）。 - **`[critique 迴圈]`**：劇本不合格就把缺點回饋給 `playbook` 重生，由 `MAX_CRITIQUE_ITERATIONS=3` 保證終止。 ## 快速開始需要 [uv](https://github.com/astral-sh/uv)（Python 3.12）。 uv sync # 同步核心依賴（langgraph, pydantic） uv run pytest -q # 跑測試（應 167 passed，離線、確定性、免金鑰） # 跑單筆告警走完整流程（確定性離線預設，無需任何金鑰） uv run python -m soc_agent run data/sample_alerts/ssh_bruteforce.json # 高風險：完整路徑 uv run python -m soc_agent run data/sample_alerts/info_heartbeat.json # 低風險：旁路預設一切走**確定性離線實作**，不連網、不需金鑰，適合測試與展示。要接真實能力再選下面的選用群組。 ## 選用能力（依需求開啟）每個對外/LLM 邊界都有「離線確定性預設」＋「可注入的真實後端」，按需安裝對應依賴群組即可。 ### 互動式 Demo UI（Streamlit） uv run --group demo streamlit run demo/app.py 可視覺化跑流程、在人工核准關卡暫停/核准/駁回、執行注入測試套件。 ### 地端 LLM 研判（ollama，無金鑰、告警不出企業邊界）研判/劇本/反思可全本地跑（符合自託管 SOC 威脅模型）。需 [ollama](https://ollama.com) 並備妥模型，評估腳本示範： ollama serve & ollama pull qwen2.5:7b uv run --group eval python scripts/eval/run_local_cd_eval.py # 確定性 vs 地端 LLM 研判/注入對照 ### 雲端 LLM 研判（Anthropic，需金鑰） ANTHROPIC_API_KEY=... uv run --group llm python -m soc_agent run data/sample_alerts/ssh_bruteforce.json --llm ### 真實威脅情資（abuse.ch ThreatFox） abuse.ch 自 2024 起需[免費 Auth-Key](https://auth.abuse.ch)。把金鑰放進專案 `.env`（已被 gitignore）： echo 'ABUSE_CH_AUTH_KEY=你的金鑰' >> .env # 範本見 .env.example uv run --group intel python -m soc_agent run --live-intel data/sample_alerts/ssh_bruteforce.json `--live-intel` 啟用時 `enrich` 改查真實 abuse.ch；缺金鑰會收到 HTTP 401 並**安全降級為中性**（不謊稱惡意、不崩潰）。CLI 透過 `python-dotenv` 自動載入 `.env`。 ## 設計：可注入邊界每個會碰 LLM、網路、外部工具或人工關卡的節點，都遵循同一模式（讓系統可離線測試、供應商無關、故障安全）： `build_graph()` 以 `functools.partial` 注入協作者，預設全為確定性實作： build_graph( classifier=..., # 計畫 A：triage 分類器（RuleBased / Ollama 微調） enricher=..., # 計畫 B：情資（Static / AbuseCh） attack_mapper=..., # 計畫 B：ATT&CK 對應（Keyword / BM25 檢索） investigator=..., # 計畫 C：研判（RuleBased / LLM） playbook_gen=..., # 計畫 D：劇本（Template / LLM） critic=..., # 計畫 D：自我批判（Deterministic / LLM rubric） approval_policy=..., # 計畫 D：核准（AutoApprove / Interrupt 人工關卡） checkpointer=..., ) **信任邊界**：告警欄位（`message` / `raw` / `indicators`）視為**不可信輸入**——絕不直接塞進 system prompt；LLM 輸出在進入 `IncidentState` 前一律經 Pydantic 驗證，驗不過就退回確定性預設。 ## 四個子系統（計畫 A–D）九個節點中，核心研判/處置節點由四個計畫接上真實能力；`ingest`/`route`/`human_approval`/`report` 負責資料整理、分流、把關與輸出，本就是確定性的。 | 計畫 | 節點 | 內容 | 代表結果 | |---|---|---|---| | **A** | `triage` | LoRA 微調本地分類器（GUIDE 資料集）＋四臂消融 | 誠實負面結果：三臂皆近乎坍縮，瓶頸**指向匿名特徵資料集**而非模型容量；類別平衡重訓把 TP 召回 0 → 0.429 | | **B** | `enrich` / `attack_mapping` | abuse.ch ThreatFox 查 IOC（含外送過濾）/ 對 MITRE STIX 做手刻 BM25 檢索 | ATT&CK 對應 top-3 覆蓋 **0.750 vs 規則式 0.250**（12 筆） | | **C** | `investigate` | LLM 讀告警內容判真偽 | verdict 準確率 **0.500 → 0.833**、precision 1.000（6 筆地端評估） | | **D** | `playbook` / `critique` | LLM 生成 NIST 三階段劇本＋ rubric 評分反思迴圈 | 收斂 100% 在 cap=3 內；注入測試 0/3（確定性）vs 3/3（LLM）→ 凸顯人工閘門必要性 | ## 程式結構 soc_agent/ state.py # IncidentState（TypedDict 契約）+ Alert（Pydantic）+ MAX_CRITIQUE_ITERATIONS=3 nodes.py # 9 個節點（皆回傳「部分狀態更新」，不原地改 state） routing.py # route_after_triage（低風險旁路）+ route_after_critique（反思迴圈） graph.py # build_graph()：組裝 StateGraph、注入各邊界 __main__.py # CLI：python -m soc_agent run [--llm --model --live-intel] classifier.py / classifiers/ # 計畫 A：Classifier 邊界 + OllamaClassifier + prompts enrichment.py / enrichers/ # 計畫 B：Enricher 邊界 + AbuseChEnricher + factory（讀 .env 金鑰） attack.py / attack_mappers/ # 計畫 B：AttackMapper 邊界 + 手刻 BM25 檢索 reasoning.py / reasoners/ # 計畫 C/D：LLMClient/Investigator/Playbook/Critic + Anthropic/Ollama 後端 approval.py / reporting.py # 計畫 D：ApprovalPolicy（含真 LangGraph interrupt）+ Markdown/JSON 報告 data/sample_alerts/ # ssh_bruteforce.json（高風險）、info_heartbeat.json（低風險） data/enterprise-attack.json # MITRE ATT&CK STIX（BM25 檢索語料） eval/ , scripts/eval/ # 離線評估與消融腳本 demo/ # Streamlit Demo UI（controller 不依賴 streamlit、可單元測試） tests/ # 167 個測試（全離線、確定性） results/ # 跑出的真實評估數字（消融、注入、研判等） docs/ # 設計 spec、計畫、W16 團隊報告與證據圖 ## 核心契約 - **`IncidentState`（`state.py`）是共用資料契約**——改它會波及所有節點與測試，視為高風險變更。 - **每個節點只回傳「部分狀態更新」**（它更新的鍵的 `dict`），絕不回傳整個 state、不原地修改；LangGraph 自動合併。 - **反思迴圈保證終止**：`critique_iterations` 遞增，達 `MAX_CRITIQUE_ITERATIONS`（3）或合格時離開。 - **`human_approval` 是處置前的安全閘門**——不讓代理在核准前行動。 ## 開發慣例 - Python 3.12、`uv` 管理依賴、Pydantic v2、LangGraph。 - 每個 `.py` 檔頂端 `from __future__ import annotations`；型別註記必填。 - 測試必須**離線、確定性**（LLM/網路呼叫可注入或 patch）。 - ruff：`line-length=100`、`select=E/F/I/UP`。 uv run ruff format . # 格式化 uv run ruff check --fix . # lint（含 import 排序） uv run pytest -q # 測試 ## 授權與致謝國立清華大學 114 學年度第 2 學期「LLM 資安系統」課程期末專題，第 34 組四人團隊共同完成（A 告警分流、B 情資增強與 ATT&CK 對應、C 研判與劇本、D 編排與安全）。私有學術用途，未授權公開散布。

标签：安全运营, 扫描框架, 提示注入防御, 源代码安全, 自动化代理, 逆向工具