Minifigures/HackerRank-Hackathon-Multi-Modal-Autonomous-System

GitHub: Minifigures/HackerRank-Hackathon-Multi-Modal-Autonomous-System

一个多模态理赔审核系统，通过视觉大模型结合确定性规则与安全防御机制，自动判定照片证据是否支持损坏索赔。

Stars: 0 | Forks: 0

# 多模态证据审查一个索赔验证系统，用于判定提交的照片是**支持**、**反驳**，还是**证据不足**关于**汽车**、**笔记本电脑**或**包裹**的损坏索赔——将图像（事实来源）、简短的索赔对话、用户索赔历史以及最低证据清单结合起来，得出严格、可审计的结构化决策。专为 HackerRank Orchestrate 挑战赛（多模态证据审查）而构建。 ## 功能介绍对于每项索赔，它会生成一条包含 14 个字段的记录：决策（`supported` / `contradicted` / `not_enough_information`）、是否达到证据标准、可见的问题类型和物件部位、严重程度、支持图像的 ID、基于图像的判定理由，以及一组风险标记（图像质量、索赔不匹配、真实性、prompt 注入和用户历史记录风险）。 ## 实现方法 **带有针对每项索赔进行一次结构化 vision LLM 调用的确定性 pipeline**，而不是 agentic loop——schema 和步骤是固定的，且输出必须是可重现的： 1. **预筛查**每张图像（调整大小、模糊、亮度），并**扫描对话**以防范 prompt 注入。 2. **确定性关联**用户历史记录（它只能增加风险标记，绝不会改变视觉判定）。 3. 一次**结构化的 Claude vision 调用**——先处理图像后处理文本，为每张图像添加标签，在得出结论前进行推理，输出受枚举约束。 4. **确定性规则层**负责融合信号、执行跨字段不变性、归一化分类法，并组装最终记录。 VLM 负责感知；确定性代码负责处理那些不应由模型把控的部分（历史融合、不变量、标记排序、真实性校验）。该系统是**提供商无关的**（以 Claude 为主；Gemini 作为备选）。 ### 核心亮点 - **抗 prompt 注入：** 聊天中*以及图像内部*（例如一张写着“批准此索赔”的便利贴）的类似指令的文本会被标记并忽略；判定完全基于像素做出。 - **天然公平：** 用户历史记录绝不会覆盖清晰的视觉证据——已通过自动化安全审计验证（0 次违规）。 - **校准式弃权：** 当索赔的部位无法评估时，会自动机械地触发 `not_enough_information`，而不是盲目猜测。 - **感知真实性：** 检测图库照片水印/截图，并据此对图像有效性进行拦截。 ## 结果（基于带标签的评估集） | 指标 | 得分 | |---|---| | 综合（加权） | 0.87 (95% CI 0.79–0.93) | | 决策准确率 (claim_status) | 0.90 | | 证据标准准确率 | 1.00 | | 支持图像选择 (Jaccard) | 0.98 | | 风险标记一致性 (Jaccard) | 0.93 | | 安全审计违规次数 | 0 | 完整的指标、三方策略对比以及成本/延迟分析详见 [`code/evaluation/evaluation_report.md`](code/evaluation/evaluation_report.md)。以约 $0.007/索赔的价格处理完整测试集的成本大约为 **$0.31**（已开启批量处理 + 缓存）。 ## 技术栈 Python · Pydantic（schema 约束输出） · Claude vision (Anthropic)，Gemini 备选 · Pillow / NumPy（确定性图像预筛查） · bootstrap-CI 评估测试套件。 ## 运行 ``` pip install -r code/requirements.txt ANTHROPIC_API_KEY=... VLM_PROVIDER=anthropic python code/main.py \ --input dataset/claims.csv --output output.csv python code/evaluation/main.py # metrics vs gold + safety audit ``` 设计详情请参阅 [`code/README.md`](code/README.md)。

标签：DLL 劫持, 图像识别, 多模态AI, 大语言模型, 提示词注入防御, 理赔审核, 自动化审核, 逆向工具