ruell6160-bit/SentinelX
GitHub: ruell6160-bit/SentinelX
一款面向 NGO 和保护型组织的负责任 AI 辅助威胁分诊平台,将碎片化安全信号转化为可解释的情境情报并保留人工决策权。
Stars: 0 | Forks: 0
# README_FIRST
# SentinelX
### 负责任的 AI 辅助组织威胁分诊平台
赛道:USAII Hackathon — Track A
项目名称:SentinelX
项目类型:AI 辅助组织安全与威胁情报平台
# 1. 项目概述
SentinelX 是一个负责任的 AI 辅助组织威胁分诊平台,专为 NGO、干预组织、安全团队和调查人员设计,支持面临以下情况的弱势个体:
* 网络骚扰,
* 胁迫,
* 跟踪,
* 诱导,
* 性勒索,
* 情境性虐待,
* 以及人身安全威胁。
该平台结合了:
* 情境自然语言处理 (NLP),
* 可解释的 AI 综合,
* 人工监督的威胁分析,
* 以及结构化的组织工作流
帮助组织将碎片化的安全信号转化为可操作的情境情报,同时在高风险干预环境中保留人类的问责制。
SentinelX 的设计初衷围绕一个核心原则:
因此,该系统强制执行:
* 明确由人工触发的分析,
* 可解释的 AI 输出,
* 非自主升级,
* 以及由分析员控制的干预工作流。
# 2. 我们正在解决的问题
保护弱势个体的组织经常收到通过不同渠道传来的碎片化安全信号:
* 恐慌警报,
* 不完整的叙述,
* 语音报告,
* 屏幕截图,
* 证据上传,
* 或对不断升级的虐待的情境描述。
这些报告通常是:
* 脱节的,
* 难以优先处理的,
* 具有时效性的,
* 且在情感上复杂的。
传统的报告系统严重依赖:
* 人工解读,
* 静态表单,
* 或基于关键字的系统
这些系统难以理解:
* 升级模式,
* 情境性胁迫,
* 反复骚扰,
* 诱导行为,
* 或叙述的演变过程。
这给 NGO 分析员和调查人员带来了重大的运营挑战,他们必须决定:
* 哪些案件需要立即关注,
* 哪些情况显示出升级模式,
* 以及如何负责任地分配有限的组织资源。
SentinelX 专为以下人员构建:
* NGO 分析员,
* 干预 caseworker,
* 数字安全组织,
* 以及以保护为重点的机构
他们需要结构化的情境情报,而无需将决策权交给自主系统。
# 3. 核心创新
SentinelX 的不同之处不仅在于使用了 AI,更在于如何控制 AI。
与自主监控或全自动干预系统不同,SentinelX 强制执行严格的人工监督工作流,其中:
* AI 从不自动升级案件,
* AI 从不联系当局,
* AI 从不执行自主干预,
* 并且所有现实世界的决策都保持在人工控制之下。
该平台引入了几项核心创新:
## 人工控制的 AI 分析
传入的报告将保持非活动状态,直到授权分析员通过仪表板明确启动 AI 处理。
## 结构化的安全聊天接收
SentinelX 没有使用冗长的表单让弱势用户感到不知所措,而是采用了引导式的 4 步情境接收系统,从而提升了:
* 清晰度,
* 情境一致性,
* 以及可解释性。
## 可解释的 AI 综合
该平台生成:
* 情境综合报告,
* 升级推理,
* 以及可解释的情报摘要
而不是不透明的黑盒分类。
## 多信号组织工作流
SentinelX 将以下内容统一整合:
* SOS 警报,
* 情境性语音威胁信号,
* 以及安全聊天报告
汇集到一个统一的分诊组织仪表板中。
## 负责任的 AI 治理
该架构在设计上有意减少:
* 自动化偏见,
* 对 AI 的过度依赖,
* 不受控制的监控,
* 以及非自愿的分析。
# 4. 系统工作流
SentinelX 通过三个不同的信号管道运行。
# A. SOS 流程(无 AI)
SOS 系统在设计上简单直接。
### 工作流
1. 用户长按 SOS 按钮 3 秒钟
2. 紧急警报立即发送
3. 警报路由至:
* 紧急联系人
* NGO 仪表板
4. 仪表板接收:
* 用户详情
* 时间戳
* 位置信息
5. 人工分析员决定后续步骤
### 重要的设计选择
SOS 管道不使用 AI 分析。
这是刻意为之的,因为紧急升级必须保持:
* 即时,
* 确定,
* 以及受人工控制。
# B. 检测威胁流程(设备端 AI)
检测威胁是一种可选的、由用户控制的监听模式。
### 工作流
1. 用户手动启用检测威胁
2. 在设备端本地捕获音频
3. 将音频转录为文本
4. 原始音频立即被丢弃
5. 仅处理转录文本
6. 设备端的 Bi-LSTM 模型进行分类:
* 威胁
* 或非威胁
7. 如果分类为威胁:
* 向仪表板发送信号
8. 人工分析员审查信号
### 重要的隐私设计
* 音频从不被存储
* 音频从不被上传
* 音频在转录后会立即被丢弃
只有文本分类结果会离开设备。
# C. 安全聊天 + 证据流程
安全聊天是一个引导式报告系统,专为面临以下情况的弱势用户设计:
* 胁迫,
* 跟踪,
* 数字剥削,
* 诱导,
* 性勒索,
* 或情境性虐待。
该工作流在设计上有意减轻报告过程中的压力。
## 步骤 1 — 类别选择
用户选择:
* 跟踪,
* 骚扰,
* 胁迫,
* 物理追踪,
* 剥削,
* 或相关情境。
## 步骤 2 — 情况描述
用户以自由文本描述情况。
## 步骤 3 — 时间背景
用户选择:
* 今天,
* 本周,
* 或几个月前。
## 步骤 4 — 频率背景
用户选择:
* 第一次,
* 几次,
* 或反复升级。
## 证据上传
用户可选择上传:
* 图片,
* 语音备忘录,
* 视频,
* 或支持性文件。
## 人工控制的 AI 处理
提交后:
* 报告存储为:
系统不会自动进行任何 AI 处理。
只有当分析员点击:
系统才会:
1. 检索情境报告,
2. 准备证据 payload,
3. 启动情境 AI 分析,
4. 生成可解释的综合输出,
5. 并更新仪表板。
# 5. 组织仪表板
NGO 仪表板是 SentinelX 的运营中心。
它是专门为以下人员设计的:
* 分析员,
* 调查人员,
* 安全团队,
* 以及干预组织。
仪表板提供:
* 实时警报,
* 结构化的报告分诊,
* 可解释的 AI 综合,
* 情境升级摘要,
* 证据审查,
* 以及由分析员控制的案件管理。
# 仪表板功能
## 实时警报队列
显示:
* SOS 警报,
* 检测威胁信号,
* 安全聊天报告,
* 时间戳,
* 优先级状态,
* 以及情境类别。
## 人工控制的分析
每份报告都包含一个明确的:
按钮。
AI 分析仅在此明确的分析员操作之后才会进行。
## 可解释的 AI 面板
分析后,仪表板会展示:
* 情境综合报告,
* 升级指标,
* 风险观察,
* 叙述性推理,
* 以及可解释的情报输出。
## 案件审查工作流
分析员可以:
* 审查,
* 优先处理,
* 确认接收,
* 解决,
* 或关闭案件。
# 6. 负责任的 AI 设计
负责任的 AI 治理是 SentinelX 的核心架构优先级之一。
该平台在设计上有意避免:
* 自主干预,
* 不透明的决策,
* 不受控制的监控,
* 以及对 AI 的过度依赖。
# 人工干预监督
SentinelX 有意不执行以下操作:
* 自主联系当局,
* 自动升级案件,
* 触发强制执行行动,
* 或做出最终的干预决定。
人类依然对以下事项负责:
* 情境解读,
* 干预决策,
* 升级审查,
* 以及组织问责制。
# 可解释性
该平台不使用黑盒输出,而是生成:
* 可解释的综合报告,
* 情境推理,
* 升级观察,
* 以及结构化摘要。
这有助于分析员理解:
* 为什么会浮现某个信号,
* 检测到了哪些情境模式,
* 以及 AI 推理过程如何为分析做出贡献。
# 隐私保护
该系统在设计上以知情同意和最小化数据暴露为核心。
### 检测威胁保障措施
* 音频在转录后被丢弃
* 音频从不被存储
* 音频从不被上传
* 分类在本地进行
### 证据分析保障措施
* 不进行自动证据分析
* 仅限人工触发审查
* 需要明确的分析员授权
# 减少自动化偏见
为了减少对 AI 的过度依赖:
* 分析需要手动启动,
* 输出仅作为参考,
* 分析员依然是最终决策者。
AI 是支持组织的推理过程,而不是取代它。
# 7. AI 架构摘要
SentinelX 在人工监督的组织工作流中结合了多种 AI 系统。
# AI 组件
## 情境 NLP
用于:
* 威胁理解,
* 情境解读,
* 升级分析,
* 以及叙述综合。
## Bi-LSTM 威胁分类
在检测威胁模式中用于:
* 情境语言分类,
* 设备端威胁预测,
* 以及口头威胁识别。
## Gemini API 情境综合
用于:
* 证据分析,
* 生成情境综合,
* 可解释的报告,
* 以及组织情报工作流。
# 后端基础设施
构建使用:
* Python
* Flask
* MongoDB
* WebSockets / Socket.IO
* JWT 认证
# 前端与移动端
构建使用:
* React Native Expo
仪表板 UI 支持:
* 分析员审查工作流,
* 实时分诊,
* 以及可解释情报的渲染。
# 8. 技术栈
| 层级 | 技术 |
| ---------------- | ----------------- |
| 移动应用 | React Native Expo |
| 后端 | Flask |
| 数据库 | MongoDB |
| AI 模型 | Bi-LSTM |
| AI APIs | Gemini API |
| 身份验证 | JWT |
| 实时事件 | Socket.IO |
| 托管 | Railway |
| 地图 | Mapbox |
# 9. 原型状态
当前阶段:
* 功能原型
* 组织仪表板已上线运行
* 移动应用已上线运行
* AI 分析工作流已上线运行
* 实时警报已上线运行
* 试点测试阶段
额外的优化和扩展正在进行中。
# 10. 团队信息
| 团队成员 | 角色 |
| ----------- | -------------------------------------------------- |
| Fredrick | 团队负责人,系统架构,AI 工作流设计 |
| Tomna | AI 工程师与后端 AI 集成 |
| Solomon | 移动应用开发人员 |
| Habeeb | UI/UX 设计师 |
# 11. 使用的 AI 工具
开发过程中涉及:
* Gemini API
* TensorFlow
* Keras
* ChatGPT
* GitHub Copilot
* Claude
* Google Gemini
* Lovable
Lovable 主要用于:
* 仪表板工作流构思,
* UI 灵感,
* 以及组织界面探索。
# 12. 推荐的审查顺序
## 1. 演示视频
请先观看项目演示。
位置:
`/Demo/`
## 2. 演示文稿
包含:
* 架构,
* 工作流,
* 以及负责任的 AI 设计。
位置:
`/Pitch_Deck/`
## 3. APK / 移动原型
演示:
* SOS,
* 检测威胁,
* 以及安全聊天工作流。
位置:
`/Prototype/`
## 4. 仪表板截图
展示:
* 分诊队列,
* XAI 综合,
* 以及分析员工作流。
位置:
`/Dashboard_Screens/`
# 13. 未来愿景
SentinelX 的长期愿景是成为一个可扩展的、负责任的 AI 基础设施,以支持:
* NGO,
* 干预组织,
* 校园安全系统,
* 以及以保护为重点的机构。
未来目标包括:
* 多语言情境分析,
* 更强大的可解释 AI 工作流,
* 协作式组织分诊系统,
* 改进的情境风险建模,
* 以及为低资源组织提供更广泛的可及性。
# 14. 最后说明
SentinelX 的构建基于这样一个信念:在敏感的干预环境中,AI 应该增强人类的判断力,而不是取代它。
平台中的每一个主要架构决策在设计时都有意保留:
* 问责制,
* 可解释性,
* 隐私,
* 以及人工监督。
我们的目标不是自主干预。
我们的目标是帮助组织更早地检测到情境,同时确保人类对后续发生的事情保持完全控制。
标签:事件分诊系统, 人工智能, 可解释AI, 威胁评估, 用户模式Hook绕过, 社会工作干预, 组织安全, 网络暴力防护, 逆向工具