Leapfrog-LSA/CATS-Contextual-Ambiguity-Trust-Scoring

GitHub: Leapfrog-LSA/CATS-Contextual-Ambiguity-Trust-Scoring

一个面向开源情报来源的信任评分系统，通过分析行为模式而非内容真伪来评估来源可靠性。

Stars: 0 | Forks: 0

# CATS — 上下文歧义与信任评分 [![CI](https://github.com/Leapfrog-LSA/CATS-Contextual-Ambiguity-Trust-Scoring/actions/workflows/ci.yml/badge.svg)](https://github.com/Leapfrog-LSA/CATS-Contextual-Ambiguity-Trust-Scoring/actions) [![覆盖率](https://codecov.io/gh/Leapfrog-LSA/CATS-Contextual-Ambiguity-Trust-Scoring/branch/main/graph/badge.svg)](https://codecov.io/gh/Leapfrog-LSA/CATS-Contextual-Ambiguity-Trust-Scoring) [![Python 3.11+](https://img.shields.io/badge/python-3.11%2B-blue)](https://www.python.org/) [![许可证: MIT](https://img.shields.io/badge/License-MIT-green.svg)](LICENSE) [![符合 GDPR](https://img.shields.io/badge/GDPR-Art.13--22-blue)](docs/compliance.md) [![欧盟 AI 法案](https://img.shields.io/badge/EU%20AI%20Act-documented-blue)](docs/compliance.md) ## 什么是 CATS？ | ❌ 事实核查 | ✅ CATS | |---|---| | “这条信息是真的吗？” | **“在这个上下文中，这个来源目前有多可靠？”** | CATS 分析来源随时间变化的*行为模式*——叙事一致性、情绪波动性、时间间隔以及算法操纵迹象——并返回一个透明、可解释的信任分数。 ## 信号 | 信号 | 测量内容 | 方法 | |---|---|---| | **Coherence（一致性）** | 消息间的实体/论点一致性 | spaCy NER + Jaccard 相似度 | | **Volatility（波动性）** | 叙事语调的突变 | TextBlob 情绪峰值检测 | | **Silence（静默）** | 发布时间上的异常间隔 | 间隔分析 vs. 来源类型阈值 | | **Gaming（博弈）** | 算法操纵迹象 | 重复度 + TTR + 突发度 + 词汇多样性 | ## 快速开始 ``` # 克隆并配置 git clone https://github.com/Leapfrog-LSA/CATS-Contextual-Ambiguity-Trust-Scoring.git && cd CATS-Contextual-Ambiguity-Trust-Scoring cp .env.example .env # fill in secrets (see .env.example) # 安装 make dev-install # deps + pre-commit hooks make nlp-download # spaCy it_core_news_lg + TextBlob corpora # 启动服务并运行 make docker-up # PostgreSQL 16 + Redis 7 make db-migrate # Alembic migrations uvicorn cats.api.main:app --reload # 测试 make test ``` ## API 示例 ``` curl -s -X POST http://localhost:8000/v1/cats/evaluate \ -H "Authorization: Bearer $CATS_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "source_id": "twitter:example_handle", "messages": [ {"timestamp": "2026-01-01T08:00:00Z", "text": "Governo annuncia piano economico."}, {"timestamp": "2026-01-01T09:00:00Z", "text": "Protesta dei lavoratori in piazza."}, {"timestamp": "2026-01-01T10:00:00Z", "text": "Parlamento discute la legge di bilancio."} ], "context": {"source_type": "social"} }' | jq ``` ``` { "trace_id": "550e8400-e29b-41d4-a716-446655440000", "score": 68.4, "band": "medium_high", "requires_review": false, "signals": [ {"name": "coherence", "value": 71.2, "confidence": 0.3}, {"name": "volatility", "value": 55.0, "confidence": 0.15}, {"name": "silence", "value": 0.0, "confidence": 0.1}, {"name": "gaming", "value": 12.8, "confidence": 0.06} ] } ``` ## 信任分数段 | 分数 | 等级 | 建议操作 | |---|---|---| | 80–100 | `high` | 可用于 OSINT | | 60–79 | `medium_high` | 交叉验证关键主张 | | 40–59 | `medium` | 建议人工审查 | | 20–39 | `low` | 需要人工审查 | | 0–19 | `very_low` | 未经验证不可使用 | ## 架构 ``` Client (HTTPS + Bearer token) │ nginx (TLS 1.3 · rate 30 req/min) │ FastAPI — 9-phase pipeline ├─ POST /v1/cats/evaluate ├─ GET /v1/cats/explain/{trace_id} ← GDPR Art.14/22 ├─ POST /v1/cats/contest/{trace_id} ← GDPR Art.22 ├─ GET /v1/cats/stats └─ GET /health /metrics │ │ Redis 7 PostgreSQL 16 (rate limiting) (AES-256 audit log) + APScheduler purge ``` 有关完整的信号和安全详细信息，请参阅 [docs/architecture.md](docs/architecture.md)。 ## 文档 | 文档 | 描述 | |---|---| | [docs/api.md](docs/api.md) | 完整 API 参考 | | [docs/architecture.md](docs/architecture.md) | 信号算法、权重矩阵、安全设计 | | [docs/compliance.md](docs/compliance.md) | GDPR + 欧盟 AI 法案合规性 | | [CHANGELOG.md](CHANGELOG.md) | 版本历史 | | [CONTRIBUTING.md](CONTRIBUTING.md) | 开发指南 | | [SECURITY.md](SECURITY.md) | 漏洞报告 | ## 已知限制 (WP 4.1) - **NLP 准确率约 55–62%**：spaCy NER 和 TextBlob 是基础实现 - **参数未校准**：所有阈值均为初始估算值，未在标记数据上进行验证 - **针对意大利语优化**：使用 `it_core_news_lg`；其他语言会降低准确率 - **仅限序数评分**：不适合作为自主决策的唯一依据 ## 路线图 | 版本 | 目标时间 | 关键功能 | |---|---|---| | **v1.0** | ✅ 现在 | spaCy NER · 9 阶段流水线 · GDPR API · Docker | | v1.1 | 2026 年 Q2 | BERT 意大利语情绪 · 多租户 PostgreSQL · 批量端点 | | v1.2 | 2026 年 Q3 | Sentence-BERT 一致性 · SHAP 解释器 | | v2.0 | 2027 | AUC-ROC ≥ 0.78 · 完整欧盟 AI 法案 Annex IX 合规 | ## 许可证 [MIT](LICENSE) — technical@cats-system.org

标签：ESC4, EU AI Act, GDPR合规, NER, NLP, OSINT, Python, spaCy, 信任评分, 信息真实性, 反取证, 可信度分析, 可解释性, 威胁情报, 安全评估, 实体识别, 开发者工具, 情感分析, 情绪波动检测, 搜索引擎查询, 数据合规, 文本相似度, 无后门, 欧盟人工智能法案, 测试用例, 算法操纵检测, 背景消歧, 舆情分析, 虚假信息检测, 请求拦截, 逆向工具, 透明度