SRKRZ23/ibm-bob-forge

GitHub: SRKRZ23/ibm-bob-forge

FORGE是一个基于IBM Bob的大语言模型代码库安全策略自动生成工具,解决LLM应用中的安全漏洞检测与治理策略部署问题。

Stars: 0 | Forks: 0

# FORGE — 基于 IBM Bob 的 LLM 治理策略生成器 FORGE 利用 IBM Bob 深入理解仓库上下文,检测每一个 LLM 调用点和治理漏洞,然后自动生成针对特定代码库的 SOUF AI / Lobster Trap YAML 策略。 ## 🚀 提交(IBM Bob 黑客马拉松,2026年5月) | 资源 | 链接 | |----------|------| | 🎯 lablab.ai 项目页面 | [lablab.ai/.../forge-ai-security-policy-generator-for-llms](https://lablab.ai/ai-hackathons/ibm-bob-hackathon/forge/forge-ai-security-policy-generator-for-llms) | | 🎥 演示视频(3:53,未列出) | [youtu.be/_9PXGN_nxn8](https://youtu.be/_9PXGN_nxn8) | | 💼 LinkedIn 公告 | [linkedin.com/feed/update/...](https://www.linkedin.com/feed/update/urn:li:activity:7461775548038459392/) | | 🐦 X 公告 | [@SardorRazi99093](https://x.com/SardorRazi99093) (搜索 `#ibm-bob-hackathon`) | | 📺 YouTube 频道 | [@FORGE-LLM_SECURITY_SCANNER](https://www.youtube.com/@FORGE-LLM_SECURITY_SCANNER) | **提交时间:** 2026年5月17日 18:46 UZT(截止日期前1小时14分钟) · **状态:** 已接受,评审进行中 **📣 入选“公开构建”系列帖子(黑客马拉松周5篇中的4篇,奖金资格 $242K+):** [LinkedIn 长文](https://www.linkedin.com/posts/sardor-razikov-569a5327b_atlas-enterprise-multi-agent-system-ai-activity-7462457002317975552-ADGR) · [X 5条推文串](https://x.com/SardorRazi99093/status/2056690128613970060) · [Facebook](https://www.facebook.com/share/p/1Nr4M2WhUG/) — 完整生态系统故事(FORGE + CITADEL + SOUF AI + ATLAS) ## FORGE 的功能 ``` GitHub URL / local path → Bob: full codebase context scan → OWASP LLM Top 10 vulnerability detection → SOUF AI governance policy generation (YAML) → BobShell: tamper-evident audit trail of every action → Ready-to-deploy policy for Lobster Trap / SOUF AI ``` **一条命令。从仓库到受保护。** ## 架构 ``` ┌─────────────────────────────────────────────────────────────────┐ │ FORGE Pipeline │ │ │ │ Repo Path ──► Scanner ──► Findings ──► Generator ──► Policy │ │ │ │ │ │ OWASP LLM SOUF AI YAML │ │ Top 10 map for Lobster Trap │ │ │ │ │ │ BobShell ◄─────────────────────► │ │ (tamper-evident audit trail) │ └─────────────────────────────────────────────────────────────────┘ ``` ### 扫描器:它能检测什么 | 类别 | 示例 | |----------|----------| | LLM 调用点 | `openai.chat.completions.create`, `LLMChain`, `genai.GenerativeModel` | | 提示注入风险 | 包含 `{user_input}` 的 f-strings,`.format(query=...)` | | 缺失输出验证 | 原始 `.content` 使用,`response["choices"][0]` 未验证 | | 凭证暴露 | 硬编码的 `sk-` 密钥,`api_key = "..."` | | 代理过限 | 代理循环中的 `subprocess.run`,`os.system` | | 供应链漏洞 | 未固定的 `langchain`,`llama_index` 导入 | 直接映射到 **OWASP LLM Top 10**(LLM01–LLM10)。 ### 策略生成器:它产生什么 生成的策略是有效的 SOUF AI / Lobster Trap YAML,可直接用于: ``` lobstertrap serve --policy forge_output/my_repo/forge_my_repo.yaml --listen :8080 ``` 每个策略包含: - **入站规则**:阻止/审查提示注入、PII 请求、危险命令 - **出站规则**:阻止凭证泄露、模型输出中的 PII - **速率限制**:根据检测到的 DoS 风险进行校准(LLM04) - **OWASP 元数据**:哪些漏洞触发了哪些规则 ### BobShell:IBM Bob 审计跟踪 FORGE 的每个操作都被记录为一个 BobShell 条目: ``` { "seq": 2, "timestamp": "2026-05-13T16:14:12", "action": "forge_policy_generated", "params": {"policy_name": "forge_atlas", "owasp_findings": ["LLM01", "LLM02"]}, "output_hash": "a3f1b2c4d5e6f7a8", "prev_hash": "c9d8e7f6a5b4c3d2", "entry_hash": "1234567890abcdef", "bob_session_id": "bob_a1b2c3d4e5f6" } ``` 链式结构:`entry_hash = sha256(seq + ts + action + params + output_hash + prev_hash)` — 篡改任一条目 → 链条断裂。 ## 快速开始 ``` # 扫描您的仓库并生成 policy python src/cli/__main__.py scan --repo /path/to/your/llm-app --out ./forge_output # 验证生成的 policy 结构 python src/cli/__main__.py verify --policy forge_output/your-app/forge_your-app.yaml # 在 3 个仓库(ATLAS、CITADEL、FORGE 本身)上运行演示 python src/cli/__main__.py demo # 验证 BobShell 防篡改 SHA-256 审计链 python3 verify_bobshell.py demo/output/forge_sample_vulnerable_repo_bobshell.jsonl # → BobShell 链已验证:4 条目,SHA-256 防篡改 ``` ## 文档 ### 📚 综合指南 - **[USAGE.md](docs/USAGE.md)** — 完整使用指南,包括安装、首次扫描、结果解读和 CI/CD 集成 - **[API.md](docs/API.md)** — Python API 参考,含代码示例,用于编程式使用 - **[OWASP_MAPPING.md](docs/OWASP_MAPPING.md)** — OWASP LLM Top 10 与 FORGE 检测模式和策略的详细映射 - **[SECURITY.md](SECURITY.md)** — 安全考虑、威胁模型和漏洞披露政策 - **[ARCHITECTURE.md](ARCHITECTURE.md)** — 系统架构和设计决策 - **[ROADMAP.md](ROADMAP.md)** — v1.1 / v2 / v3 计划,包含多动作置信度评分 + Plan/Task DAG 架构 - **[CHANGELOG.md](CHANGELOG.md)** — 完整发布历史,包括提交后的改进 ### 💡 工作示例 - **[examples/scan_openai_app/](examples/scan_openai_app/)** — 含漏洞的示例 OpenAI 应用、扫描输出和生成的策略 - **[examples/scan_langchain_app/](examples/scan_langchain_app/)** — LangChain 代理示例,含安全问题及修复方法 - **[examples/ci_integration/](examples/ci_integration/)** — CI/CD 流水线配置(GitHub Actions、GitLab CI、Jenkins、pre-commit 钩子) ### 🚀 入门指南 1. **新用户**:从 [USAGE.md](docs/USAGE.md) 开始,按步骤安装并进行首次扫描 2. **开发者**:查阅 [API.md](docs/API.md) 了解编程集成 3. **安全团队**:审阅 [OWASP_MAPPING.md](docs/OWASP_MAPPING.md) 了解漏洞详情 4. **DevOps**:查看 [examples/ci_integration/](examples/ci_integration/) 设置流水线 ## 演示结果 FORGE 扫描了 AI 可靠性生态系统中的 3 个仓库: | 仓库 | 文件数 | 发现数 | OWASP | BobShell | |------|-------|----------|-------|----------| | ATLAS | 15 | 7 | LLM01, LLM02 | ✅ 已验证(4个操作) | | CITADEL | 27 | 6 | LLM01, LLM08 | ✅ 已验证(4个操作) | | FORGE | 9 | 15 | LLM01, LLM02, LLM05, LLM06, LLM07, LLM08 | ✅ 已验证(4个操作) | 所有策略均成功导入 Lobster Trap: ``` lobstertrap serve --policy forge_output/atlas/forge_atlas.yaml # → 在 :8080 端口提供服务,包含 4 条 ingress 规则 + 2 条 egress 规则 ``` ## OWASP LLM Top 10 覆盖情况(2025 v2) | ID | 名称 | 检测方式 | |----|------|-------------| | LLM01 | 提示注入 | f-string、format()、concat 模式 | | LLM02 | 不安全输出处理 | 原始 `.content`、未验证的响应使用 | | LLM04 | 模型拒绝服务 | 无界 LLM 循环 | | LLM05 | 供应链漏洞 | 未固定的 LLM 框架导入 | | LLM06 | 敏感信息泄露 | 硬编码密钥、模板中的 PII | | LLM07 | 系统提示泄露 | 硬编码系统提示、提示日志、用户连接、f-string 模板 | | LLM08 | 过度授权 | subprocess + 代理模式 | ## IBM Bob 集成 FORGE 围绕 IBM Bob 的深度代码理解能力设计: 1. **Bob 读取整个仓库** — 不只是表面搜索;理解调用链 2. **Bob 分类意图** — 能区分“测试 mock”和“生产 LLM 调用” 3. **BobShell 记录每个操作** — 企业审计的合规产物 4. **Bob 会话 ID** 将每个策略链接到特定的 Bob 分析运行 在生产环境中:`WATSON_BOB_API_KEY` 环境变量激活完整的 Bob API 集成。 ## 文件结构 ``` forge/ ├── src/ │ ├── scanner/ │ │ └── repo_scanner.py # LLM call-site detection + OWASP mapping (LLM01-LLM10) │ ├── generator/ │ │ └── policy_generator.py # SOUF AI YAML policy generation │ ├── audit/ │ │ └── bobshell.py # Tamper-evident IBM Bob audit log │ ├── cli/ │ │ └── __main__.py # CLI: scan | verify | demo │ └── forge.py # Full pipeline orchestrator ├── tests/ # 95 tests (pytest) ├── bob_sessions/ # IBM Bob IDE markdown exports + screenshots (mandatory) ├── docs/ # USAGE.md, API.md, OWASP_MAPPING.md ├── examples/ # Sample apps + CI integrations ├── demo/ # sample_vulnerable_repo + benchmarks ├── forge_output/ # Generated policies (after running demo) ├── ONBOARDING.md # Contributor guide (Bob IDE Task 2 output) ├── RISK_REGISTER.md # Security self-audit (Bob IDE Task 3 output) ├── ARCHITECTURE.md ├── SECURITY.md ├── CHANGELOG.md └── README.md ``` ## 与 AI 可靠性生态系统的连接 ``` FORGE ──generates policies──► SOUF AI (ATLAS governance layer) │ └── YAML policies importable into Lobster Trap binary └── BobShell audit trail used in CITADEL L7 compliance reports └── Scans ATLAS + CITADEL repos for vulnerabilities ``` **该生态系统中的每个黑客马拉松项目都使用 FORGE 生成的策略作为其治理基础。** ## 科学验证 测试套件:**95/95 通过** — 所有断言均为数据驱动,无未经测试的声明。 ``` pytest tests/ -v # → 1.2 秒内通过 95 项测试 # → 覆盖率:整体 41%,policy_generator 100%,repo_scanner 84% ``` ## IBM Bob — 强制提交产物 针对 FORGE 代码库执行了三个生产性的 Bob IDE 任务。每个任务包括导出的 Markdown 记录**和** Bob IDE 任务会话消耗摘要面板的截图,符合官方 IBM Bob 黑客马拉松指南(2026年5月,第18-19页)。 | # | 任务 | Markdown 导出 | 截图 | |---|------|-----------------|--------------| | 1 | 添加 OWASP LLM07 系统提示泄露检测 | [`bob_sessions/task1_llm07.md`](bob_sessions/task1_llm07.md) | [`bob_sessions/task1_llm07_summary.png`](bob_sessions/task1_llm07_summary.png) | | 2 | 生成 `ONBOARDING.md` 贡献者指南(717行) | [`bob_sessions/task2_onboarding.md`](bob_sessions/task2_onboarding.md) | [`task2_onboarding_summary_1.png`](bob_sessions/task2_onboarding_summary_1.png)、[`task2_onboarding_summary_2.png`](bob_sessions/task2_onboarding_summary_2.png) | | 3 | 安全自审 → `RISK_REGISTER.md`(595行) | [`bob_sessions/task3_risk_register.md`](bob_sessions/task3_risk_register.md) | [`task3_risk_register_summary_1.png`](bob_sessions/task3_risk_register_summary_1.png)、[`task3_risk_register_summary_2.png`](bob_sessions/task3_risk_register_summary_2.png) | **Bobcoin 使用量:** ~27 / 40(约 68% 的分配量)。账户:`ibm-coding-challenge-uat`(企业计划)。 补充的 Bob Shell 会话 JSON 文件(可选的 CLI 变体)也保存在 `bob_sessions/` 下,作为早期构建冲刺的历史记录 — 详见 [`bob_sessions/README.md`](bob_sessions/README.md) 获取完整说明。 Bob 产出的产物现位于项目根目录: - [`ONBOARDING.md`](ONBOARDING.md) — 5分钟设置、首次扫描演练、“如何使用真实的 LLM07 示例添加检测模式” - [`RISK_REGISTER.md`](RISK_REGISTER.md) — 5+ 已识别风险,含严重程度、复现 PoC、缓解措施、OWASP ASVS 交叉引用 ## 作者 **Sardor Razikov** — 独立 ML 工程师 · 创始人 · 研究员 · 塔什干 🇺🇿 **研究与竞赛** - CVPR 2026 步态识别挑战赛:**第 2 名 / 56 支团队**(sub40 = 0.90271) - Kaggle SPR 2026 乳腺X线摄影:**第 7 名 / 371 支团队**(前 1.9%) — 葡萄牙语医学 NLP / BI-RADS - Kaggle S6E3 客户流失:第 23 名 / 4,142(前 1%) - 作者:[Epistemic Curie 基准测试](https://doi.org/10.5281/zenodo.19791329) — Zenodo DOI,CC BY 4.0 - AIMO3(XTX $2.2M 奥林匹克数学):使用定制的 SC-TIR 推理流水线在 gpt-oss-120B 上取得 39 / 50 分 **创始人履历** - UCAR(汽车服务市场,2023至今)— **2023 U-Start 演示日第一名**(85M UZS 补助 + 韩国实习) - **2024 首尔 KUSE** — 总排名第二,国际组第一(KOICA × 顺天乡大学) - **UJC PMP-43** 高管项目管理 — 有史以来录取的最年轻学生 - 掌握5种语言(乌兹别克语 / 俄语 / 英语 / 土耳其语 B1 / 中文)· 业务覆盖英国、中国、韩国、乌兹别克斯坦 **FORGE:由一人独立完成,经历 5 个 Bob Shell 会话 + 3 个 Bob IDE 任务(使用 ~27 / 40 Bobcoins)。** ## 团队 FORGE 由 Sardor Razikov 独立构建,获得了塔什干一个小型资深导师网络(技术、商业和运营领域)的非正式战略指导。寻求在融资后正式确定联合创始人并组建工程团队。 **欢迎大型战略合作伙伴咨询** — 任何对招聘、收购或合作感兴趣的人均可通过以下地址联系。 ## 联系方式 | 渠道 | 地址 | |---|---| | 电子邮件(主要) | razikovsardor1@gmail.com | | 电子邮件(备用) | razikovs777@gmail.com | | LinkedIn | [linkedin.com/in/sardor-razikov-569a5327b](https://linkedin.com/in/sardor-razikov-569a5327b) | | X | [@SardorRazi99093](https://x.com/SardorRazi99093) | | GitHub | [SRKRZ23](https://github.com/SRKRZ23) | | lablab | [lablab.ai/u/@Sardor_R](https://lablab.ai/u/@Sardor_R) | 为 [2026 年 IBM Bob 黑客马拉松](https://lablab.ai/ai-hackathons/ibm-bob-hackathon) 构建 · AI 可靠性生态系统的一部分:SOUF AI · CITADEL · ATLAS · FORGE
标签:AI安全, AI治理工具, Chat Copilot, DevSecOps, GitHub集成, IBM Bob, LLM安全扫描器, LLM治理, OWASP Top 10, YAML政策, 上游代理, 人工智能安全, 代码安全, 代码治理, 合规性, 大型语言模型, 安全扫描, 安全策略生成, 审计跟踪, 数据管道, 时序注入, 治理政策, 漏洞枚举, 结构化查询, 自动化安全, 自动合规, 软件工程, 逆向工具