ruell6160-bit/SentinelX

GitHub: ruell6160-bit/SentinelX

一款面向 NGO 和保护型组织的负责任 AI 辅助威胁分诊平台,将碎片化安全信号转化为可解释的情境情报并保留人工决策权。

Stars: 0 | Forks: 0

# README_FIRST # SentinelX ### 负责任的 AI 辅助组织威胁分诊平台 赛道:USAII Hackathon — Track A 项目名称:SentinelX 项目类型:AI 辅助组织安全与威胁情报平台 # 1. 项目概述 SentinelX 是一个负责任的 AI 辅助组织威胁分诊平台,专为 NGO、干预组织、安全团队和调查人员设计,支持面临以下情况的弱势个体: * 网络骚扰, * 胁迫, * 跟踪, * 诱导, * 性勒索, * 情境性虐待, * 以及人身安全威胁。 该平台结合了: * 情境自然语言处理 (NLP), * 可解释的 AI 综合, * 人工监督的威胁分析, * 以及结构化的组织工作流 帮助组织将碎片化的安全信号转化为可操作的情境情报,同时在高风险干预环境中保留人类的问责制。 SentinelX 的设计初衷围绕一个核心原则: 因此,该系统强制执行: * 明确由人工触发的分析, * 可解释的 AI 输出, * 非自主升级, * 以及由分析员控制的干预工作流。 # 2. 我们正在解决的问题 保护弱势个体的组织经常收到通过不同渠道传来的碎片化安全信号: * 恐慌警报, * 不完整的叙述, * 语音报告, * 屏幕截图, * 证据上传, * 或对不断升级的虐待的情境描述。 这些报告通常是: * 脱节的, * 难以优先处理的, * 具有时效性的, * 且在情感上复杂的。 传统的报告系统严重依赖: * 人工解读, * 静态表单, * 或基于关键字的系统 这些系统难以理解: * 升级模式, * 情境性胁迫, * 反复骚扰, * 诱导行为, * 或叙述的演变过程。 这给 NGO 分析员和调查人员带来了重大的运营挑战,他们必须决定: * 哪些案件需要立即关注, * 哪些情况显示出升级模式, * 以及如何负责任地分配有限的组织资源。 SentinelX 专为以下人员构建: * NGO 分析员, * 干预 caseworker, * 数字安全组织, * 以及以保护为重点的机构 他们需要结构化的情境情报,而无需将决策权交给自主系统。 # 3. 核心创新 SentinelX 的不同之处不仅在于使用了 AI,更在于如何控制 AI。 与自主监控或全自动干预系统不同,SentinelX 强制执行严格的人工监督工作流,其中: * AI 从不自动升级案件, * AI 从不联系当局, * AI 从不执行自主干预, * 并且所有现实世界的决策都保持在人工控制之下。 该平台引入了几项核心创新: ## 人工控制的 AI 分析 传入的报告将保持非活动状态,直到授权分析员通过仪表板明确启动 AI 处理。 ## 结构化的安全聊天接收 SentinelX 没有使用冗长的表单让弱势用户感到不知所措,而是采用了引导式的 4 步情境接收系统,从而提升了: * 清晰度, * 情境一致性, * 以及可解释性。 ## 可解释的 AI 综合 该平台生成: * 情境综合报告, * 升级推理, * 以及可解释的情报摘要 而不是不透明的黑盒分类。 ## 多信号组织工作流 SentinelX 将以下内容统一整合: * SOS 警报, * 情境性语音威胁信号, * 以及安全聊天报告 汇集到一个统一的分诊组织仪表板中。 ## 负责任的 AI 治理 该架构在设计上有意减少: * 自动化偏见, * 对 AI 的过度依赖, * 不受控制的监控, * 以及非自愿的分析。 # 4. 系统工作流 SentinelX 通过三个不同的信号管道运行。 # A. SOS 流程(无 AI) SOS 系统在设计上简单直接。 ### 工作流 1. 用户长按 SOS 按钮 3 秒钟 2. 紧急警报立即发送 3. 警报路由至: * 紧急联系人 * NGO 仪表板 4. 仪表板接收: * 用户详情 * 时间戳 * 位置信息 5. 人工分析员决定后续步骤 ### 重要的设计选择 SOS 管道不使用 AI 分析。 这是刻意为之的,因为紧急升级必须保持: * 即时, * 确定, * 以及受人工控制。 # B. 检测威胁流程(设备端 AI) 检测威胁是一种可选的、由用户控制的监听模式。 ### 工作流 1. 用户手动启用检测威胁 2. 在设备端本地捕获音频 3. 将音频转录为文本 4. 原始音频立即被丢弃 5. 仅处理转录文本 6. 设备端的 Bi-LSTM 模型进行分类: * 威胁 * 或非威胁 7. 如果分类为威胁: * 向仪表板发送信号 8. 人工分析员审查信号 ### 重要的隐私设计 * 音频从不被存储 * 音频从不被上传 * 音频在转录后会立即被丢弃 只有文本分类结果会离开设备。 # C. 安全聊天 + 证据流程 安全聊天是一个引导式报告系统,专为面临以下情况的弱势用户设计: * 胁迫, * 跟踪, * 数字剥削, * 诱导, * 性勒索, * 或情境性虐待。 该工作流在设计上有意减轻报告过程中的压力。 ## 步骤 1 — 类别选择 用户选择: * 跟踪, * 骚扰, * 胁迫, * 物理追踪, * 剥削, * 或相关情境。 ## 步骤 2 — 情况描述 用户以自由文本描述情况。 ## 步骤 3 — 时间背景 用户选择: * 今天, * 本周, * 或几个月前。 ## 步骤 4 — 频率背景 用户选择: * 第一次, * 几次, * 或反复升级。 ## 证据上传 用户可选择上传: * 图片, * 语音备忘录, * 视频, * 或支持性文件。 ## 人工控制的 AI 处理 提交后: * 报告存储为: 系统不会自动进行任何 AI 处理。 只有当分析员点击: 系统才会: 1. 检索情境报告, 2. 准备证据 payload, 3. 启动情境 AI 分析, 4. 生成可解释的综合输出, 5. 并更新仪表板。 # 5. 组织仪表板 NGO 仪表板是 SentinelX 的运营中心。 它是专门为以下人员设计的: * 分析员, * 调查人员, * 安全团队, * 以及干预组织。 仪表板提供: * 实时警报, * 结构化的报告分诊, * 可解释的 AI 综合, * 情境升级摘要, * 证据审查, * 以及由分析员控制的案件管理。 # 仪表板功能 ## 实时警报队列 显示: * SOS 警报, * 检测威胁信号, * 安全聊天报告, * 时间戳, * 优先级状态, * 以及情境类别。 ## 人工控制的分析 每份报告都包含一个明确的: 按钮。 AI 分析仅在此明确的分析员操作之后才会进行。 ## 可解释的 AI 面板 分析后,仪表板会展示: * 情境综合报告, * 升级指标, * 风险观察, * 叙述性推理, * 以及可解释的情报输出。 ## 案件审查工作流 分析员可以: * 审查, * 优先处理, * 确认接收, * 解决, * 或关闭案件。 # 6. 负责任的 AI 设计 负责任的 AI 治理是 SentinelX 的核心架构优先级之一。 该平台在设计上有意避免: * 自主干预, * 不透明的决策, * 不受控制的监控, * 以及对 AI 的过度依赖。 # 人工干预监督 SentinelX 有意不执行以下操作: * 自主联系当局, * 自动升级案件, * 触发强制执行行动, * 或做出最终的干预决定。 人类依然对以下事项负责: * 情境解读, * 干预决策, * 升级审查, * 以及组织问责制。 # 可解释性 该平台不使用黑盒输出,而是生成: * 可解释的综合报告, * 情境推理, * 升级观察, * 以及结构化摘要。 这有助于分析员理解: * 为什么会浮现某个信号, * 检测到了哪些情境模式, * 以及 AI 推理过程如何为分析做出贡献。 # 隐私保护 该系统在设计上以知情同意和最小化数据暴露为核心。 ### 检测威胁保障措施 * 音频在转录后被丢弃 * 音频从不被存储 * 音频从不被上传 * 分类在本地进行 ### 证据分析保障措施 * 不进行自动证据分析 * 仅限人工触发审查 * 需要明确的分析员授权 # 减少自动化偏见 为了减少对 AI 的过度依赖: * 分析需要手动启动, * 输出仅作为参考, * 分析员依然是最终决策者。 AI 是支持组织的推理过程,而不是取代它。 # 7. AI 架构摘要 SentinelX 在人工监督的组织工作流中结合了多种 AI 系统。 # AI 组件 ## 情境 NLP 用于: * 威胁理解, * 情境解读, * 升级分析, * 以及叙述综合。 ## Bi-LSTM 威胁分类 在检测威胁模式中用于: * 情境语言分类, * 设备端威胁预测, * 以及口头威胁识别。 ## Gemini API 情境综合 用于: * 证据分析, * 生成情境综合, * 可解释的报告, * 以及组织情报工作流。 # 后端基础设施 构建使用: * Python * Flask * MongoDB * WebSockets / Socket.IO * JWT 认证 # 前端与移动端 构建使用: * React Native Expo 仪表板 UI 支持: * 分析员审查工作流, * 实时分诊, * 以及可解释情报的渲染。 # 8. 技术栈 | 层级 | 技术 | | ---------------- | ----------------- | | 移动应用 | React Native Expo | | 后端 | Flask | | 数据库 | MongoDB | | AI 模型 | Bi-LSTM | | AI APIs | Gemini API | | 身份验证 | JWT | | 实时事件 | Socket.IO | | 托管 | Railway | | 地图 | Mapbox | # 9. 原型状态 当前阶段: * 功能原型 * 组织仪表板已上线运行 * 移动应用已上线运行 * AI 分析工作流已上线运行 * 实时警报已上线运行 * 试点测试阶段 额外的优化和扩展正在进行中。 # 10. 团队信息 | 团队成员 | 角色 | | ----------- | -------------------------------------------------- | | Fredrick | 团队负责人,系统架构,AI 工作流设计 | | Tomna | AI 工程师与后端 AI 集成 | | Solomon | 移动应用开发人员 | | Habeeb | UI/UX 设计师 | # 11. 使用的 AI 工具 开发过程中涉及: * Gemini API * TensorFlow * Keras * ChatGPT * GitHub Copilot * Claude * Google Gemini * Lovable Lovable 主要用于: * 仪表板工作流构思, * UI 灵感, * 以及组织界面探索。 # 12. 推荐的审查顺序 ## 1. 演示视频 请先观看项目演示。 位置: `/Demo/` ## 2. 演示文稿 包含: * 架构, * 工作流, * 以及负责任的 AI 设计。 位置: `/Pitch_Deck/` ## 3. APK / 移动原型 演示: * SOS, * 检测威胁, * 以及安全聊天工作流。 位置: `/Prototype/` ## 4. 仪表板截图 展示: * 分诊队列, * XAI 综合, * 以及分析员工作流。 位置: `/Dashboard_Screens/` # 13. 未来愿景 SentinelX 的长期愿景是成为一个可扩展的、负责任的 AI 基础设施,以支持: * NGO, * 干预组织, * 校园安全系统, * 以及以保护为重点的机构。 未来目标包括: * 多语言情境分析, * 更强大的可解释 AI 工作流, * 协作式组织分诊系统, * 改进的情境风险建模, * 以及为低资源组织提供更广泛的可及性。 # 14. 最后说明 SentinelX 的构建基于这样一个信念:在敏感的干预环境中,AI 应该增强人类的判断力,而不是取代它。 平台中的每一个主要架构决策在设计时都有意保留: * 问责制, * 可解释性, * 隐私, * 以及人工监督。 我们的目标不是自主干预。 我们的目标是帮助组织更早地检测到情境,同时确保人类对后续发生的事情保持完全控制。
标签:事件分诊系统, 人工智能, 可解释AI, 威胁评估, 用户模式Hook绕过, 社会工作干预, 组织安全, 网络暴力防护, 逆向工具