ruell6160-bit/SentinelX

GitHub: ruell6160-bit/SentinelX

一款面向 NGO 和保护型组织的负责任 AI 辅助威胁分诊平台，将碎片化安全信号转化为可解释的情境情报并保留人工决策权。

Stars: 0 | Forks: 0

# README_FIRST # SentinelX ### 负责任的 AI 辅助组织威胁分诊平台赛道：USAII Hackathon — Track A 项目名称：SentinelX 项目类型：AI 辅助组织安全与威胁情报平台 # 1. 项目概述 SentinelX 是一个负责任的 AI 辅助组织威胁分诊平台，专为 NGO、干预组织、安全团队和调查人员设计，支持面临以下情况的弱势个体： * 网络骚扰， * 胁迫， * 跟踪， * 诱导， * 性勒索， * 情境性虐待， * 以及人身安全威胁。该平台结合了： * 情境自然语言处理 (NLP)， * 可解释的 AI 综合， * 人工监督的威胁分析， * 以及结构化的组织工作流帮助组织将碎片化的安全信号转化为可操作的情境情报，同时在高风险干预环境中保留人类的问责制。 SentinelX 的设计初衷围绕一个核心原则：因此，该系统强制执行： * 明确由人工触发的分析， * 可解释的 AI 输出， * 非自主升级， * 以及由分析员控制的干预工作流。 # 2. 我们正在解决的问题保护弱势个体的组织经常收到通过不同渠道传来的碎片化安全信号： * 恐慌警报， * 不完整的叙述， * 语音报告， * 屏幕截图， * 证据上传， * 或对不断升级的虐待的情境描述。这些报告通常是： * 脱节的， * 难以优先处理的， * 具有时效性的， * 且在情感上复杂的。传统的报告系统严重依赖： * 人工解读， * 静态表单， * 或基于关键字的系统这些系统难以理解： * 升级模式， * 情境性胁迫， * 反复骚扰， * 诱导行为， * 或叙述的演变过程。这给 NGO 分析员和调查人员带来了重大的运营挑战，他们必须决定： * 哪些案件需要立即关注， * 哪些情况显示出升级模式， * 以及如何负责任地分配有限的组织资源。 SentinelX 专为以下人员构建： * NGO 分析员， * 干预 caseworker， * 数字安全组织， * 以及以保护为重点的机构他们需要结构化的情境情报，而无需将决策权交给自主系统。 # 3. 核心创新 SentinelX 的不同之处不仅在于使用了 AI，更在于如何控制 AI。与自主监控或全自动干预系统不同，SentinelX 强制执行严格的人工监督工作流，其中： * AI 从不自动升级案件， * AI 从不联系当局， * AI 从不执行自主干预， * 并且所有现实世界的决策都保持在人工控制之下。该平台引入了几项核心创新： ## 人工控制的 AI 分析传入的报告将保持非活动状态，直到授权分析员通过仪表板明确启动 AI 处理。 ## 结构化的安全聊天接收 SentinelX 没有使用冗长的表单让弱势用户感到不知所措，而是采用了引导式的 4 步情境接收系统，从而提升了： * 清晰度， * 情境一致性， * 以及可解释性。 ## 可解释的 AI 综合该平台生成： * 情境综合报告， * 升级推理， * 以及可解释的情报摘要而不是不透明的黑盒分类。 ## 多信号组织工作流 SentinelX 将以下内容统一整合： * SOS 警报， * 情境性语音威胁信号， * 以及安全聊天报告汇集到一个统一的分诊组织仪表板中。 ## 负责任的 AI 治理该架构在设计上有意减少： * 自动化偏见， * 对 AI 的过度依赖， * 不受控制的监控， * 以及非自愿的分析。 # 4. 系统工作流 SentinelX 通过三个不同的信号管道运行。 # A. SOS 流程（无 AI） SOS 系统在设计上简单直接。 ### 工作流 1. 用户长按 SOS 按钮 3 秒钟 2. 紧急警报立即发送 3. 警报路由至： * 紧急联系人 * NGO 仪表板 4. 仪表板接收： * 用户详情 * 时间戳 * 位置信息 5. 人工分析员决定后续步骤 ### 重要的设计选择 SOS 管道不使用 AI 分析。这是刻意为之的，因为紧急升级必须保持： * 即时， * 确定， * 以及受人工控制。 # B. 检测威胁流程（设备端 AI）检测威胁是一种可选的、由用户控制的监听模式。 ### 工作流 1. 用户手动启用检测威胁 2. 在设备端本地捕获音频 3. 将音频转录为文本 4. 原始音频立即被丢弃 5. 仅处理转录文本 6. 设备端的 Bi-LSTM 模型进行分类： * 威胁 * 或非威胁 7. 如果分类为威胁： * 向仪表板发送信号 8. 人工分析员审查信号 ### 重要的隐私设计 * 音频从不被存储 * 音频从不被上传 * 音频在转录后会立即被丢弃只有文本分类结果会离开设备。 # C. 安全聊天 + 证据流程安全聊天是一个引导式报告系统，专为面临以下情况的弱势用户设计： * 胁迫， * 跟踪， * 数字剥削， * 诱导， * 性勒索， * 或情境性虐待。该工作流在设计上有意减轻报告过程中的压力。 ## 步骤 1 — 类别选择用户选择： * 跟踪， * 骚扰， * 胁迫， * 物理追踪， * 剥削， * 或相关情境。 ## 步骤 2 — 情况描述用户以自由文本描述情况。 ## 步骤 3 — 时间背景用户选择： * 今天， * 本周， * 或几个月前。 ## 步骤 4 — 频率背景用户选择： * 第一次， * 几次， * 或反复升级。 ## 证据上传用户可选择上传： * 图片， * 语音备忘录， * 视频， * 或支持性文件。 ## 人工控制的 AI 处理提交后： * 报告存储为：系统不会自动进行任何 AI 处理。只有当分析员点击：系统才会： 1. 检索情境报告， 2. 准备证据 payload， 3. 启动情境 AI 分析， 4. 生成可解释的综合输出， 5. 并更新仪表板。 # 5. 组织仪表板 NGO 仪表板是 SentinelX 的运营中心。它是专门为以下人员设计的： * 分析员， * 调查人员， * 安全团队， * 以及干预组织。仪表板提供： * 实时警报， * 结构化的报告分诊， * 可解释的 AI 综合， * 情境升级摘要， * 证据审查， * 以及由分析员控制的案件管理。 # 仪表板功能 ## 实时警报队列显示： * SOS 警报， * 检测威胁信号， * 安全聊天报告， * 时间戳， * 优先级状态， * 以及情境类别。 ## 人工控制的分析每份报告都包含一个明确的：按钮。 AI 分析仅在此明确的分析员操作之后才会进行。 ## 可解释的 AI 面板分析后，仪表板会展示： * 情境综合报告， * 升级指标， * 风险观察， * 叙述性推理， * 以及可解释的情报输出。 ## 案件审查工作流分析员可以： * 审查， * 优先处理， * 确认接收， * 解决， * 或关闭案件。 # 6. 负责任的 AI 设计负责任的 AI 治理是 SentinelX 的核心架构优先级之一。该平台在设计上有意避免： * 自主干预， * 不透明的决策， * 不受控制的监控， * 以及对 AI 的过度依赖。 # 人工干预监督 SentinelX 有意不执行以下操作： * 自主联系当局， * 自动升级案件， * 触发强制执行行动， * 或做出最终的干预决定。人类依然对以下事项负责： * 情境解读， * 干预决策， * 升级审查， * 以及组织问责制。 # 可解释性该平台不使用黑盒输出，而是生成： * 可解释的综合报告， * 情境推理， * 升级观察， * 以及结构化摘要。这有助于分析员理解： * 为什么会浮现某个信号， * 检测到了哪些情境模式， * 以及 AI 推理过程如何为分析做出贡献。 # 隐私保护该系统在设计上以知情同意和最小化数据暴露为核心。 ### 检测威胁保障措施 * 音频在转录后被丢弃 * 音频从不被存储 * 音频从不被上传 * 分类在本地进行 ### 证据分析保障措施 * 不进行自动证据分析 * 仅限人工触发审查 * 需要明确的分析员授权 # 减少自动化偏见为了减少对 AI 的过度依赖： * 分析需要手动启动， * 输出仅作为参考， * 分析员依然是最终决策者。 AI 是支持组织的推理过程，而不是取代它。 # 7. AI 架构摘要 SentinelX 在人工监督的组织工作流中结合了多种 AI 系统。 # AI 组件 ## 情境 NLP 用于： * 威胁理解， * 情境解读， * 升级分析， * 以及叙述综合。 ## Bi-LSTM 威胁分类在检测威胁模式中用于： * 情境语言分类， * 设备端威胁预测， * 以及口头威胁识别。 ## Gemini API 情境综合用于： * 证据分析， * 生成情境综合， * 可解释的报告， * 以及组织情报工作流。 # 后端基础设施构建使用： * Python * Flask * MongoDB * WebSockets / Socket.IO * JWT 认证 # 前端与移动端构建使用： * React Native Expo 仪表板 UI 支持： * 分析员审查工作流， * 实时分诊， * 以及可解释情报的渲染。 # 8. 技术栈 | 层级 | 技术 | | ---------------- | ----------------- | | 移动应用 | React Native Expo | | 后端 | Flask | | 数据库 | MongoDB | | AI 模型 | Bi-LSTM | | AI APIs | Gemini API | | 身份验证 | JWT | | 实时事件 | Socket.IO | | 托管 | Railway | | 地图 | Mapbox | # 9. 原型状态当前阶段： * 功能原型 * 组织仪表板已上线运行 * 移动应用已上线运行 * AI 分析工作流已上线运行 * 实时警报已上线运行 * 试点测试阶段额外的优化和扩展正在进行中。 # 10. 团队信息 | 团队成员 | 角色 | | ----------- | -------------------------------------------------- | | Fredrick | 团队负责人，系统架构，AI 工作流设计 | | Tomna | AI 工程师与后端 AI 集成 | | Solomon | 移动应用开发人员 | | Habeeb | UI/UX 设计师 | # 11. 使用的 AI 工具开发过程中涉及： * Gemini API * TensorFlow * Keras * ChatGPT * GitHub Copilot * Claude * Google Gemini * Lovable Lovable 主要用于： * 仪表板工作流构思， * UI 灵感， * 以及组织界面探索。 # 12. 推荐的审查顺序 ## 1. 演示视频请先观看项目演示。位置： `/Demo/` ## 2. 演示文稿包含： * 架构， * 工作流， * 以及负责任的 AI 设计。位置： `/Pitch_Deck/` ## 3. APK / 移动原型演示： * SOS， * 检测威胁， * 以及安全聊天工作流。位置： `/Prototype/` ## 4. 仪表板截图展示： * 分诊队列， * XAI 综合， * 以及分析员工作流。位置： `/Dashboard_Screens/` # 13. 未来愿景 SentinelX 的长期愿景是成为一个可扩展的、负责任的 AI 基础设施，以支持： * NGO， * 干预组织， * 校园安全系统， * 以及以保护为重点的机构。未来目标包括： * 多语言情境分析， * 更强大的可解释 AI 工作流， * 协作式组织分诊系统， * 改进的情境风险建模， * 以及为低资源组织提供更广泛的可及性。 # 14. 最后说明 SentinelX 的构建基于这样一个信念：在敏感的干预环境中，AI 应该增强人类的判断力，而不是取代它。平台中的每一个主要架构决策在设计时都有意保留： * 问责制， * 可解释性， * 隐私， * 以及人工监督。我们的目标不是自主干预。我们的目标是帮助组织更早地检测到情境，同时确保人类对后续发生的事情保持完全控制。

标签：事件分诊系统, 人工智能, 可解释AI, 威胁评估, 用户模式Hook绕过, 社会工作干预, 组织安全, 网络暴力防护, 逆向工具