shubham001official/truthscanner-ai
GitHub: shubham001official/truthscanner-ai
一款基于 RAG 架构与实时网络检索的高速事实核查引擎,能在数秒内对新闻声明和社交媒体内容进行证据支撑的真伪判定。
Stars: 0 | Forks: 0
# 🛡️ TruthScanner AI:实时事实核查引擎
[](https://truthscannerai.streamlit.app)
**TruthScanner AI** 是一款专为应对 2026 年虚假信息而设计的高速调查性 OSINT(开源情报)工具。通过将 **Groq LPU™** 极快的推理速度与 **Tavily AI** 强大的实时网络索引能力相结合,TruthScanner 能够在几秒钟内对新闻声明、推文和头条新闻进行深度核查验证。
## 📸 应用界面
## | 输入与分析 | 证据与来源 |
| :---: | :---: |
|
|
|
| *用户输入有争议的声明* | *带有实时来源链接的详细结论* |
## 🚀 核心特性
* **实时网络检索:** 使用 Tavily 的高级搜索深度,绕过静态训练数据。
* **JSON 结构化推理:** 强制 Llama 3.3-70B 输出,确保一致的 UI 指标。
* **自动化来源验证:** 将声明与路透社、美联社 (AP) 和英国广播公司 等全球知名新闻机构的报道进行交叉比对。
* **置信度评分:** 根据证据密度提供 0-100% 的确定性指标。
* **来源透明度:** 交互式卡片,带有指向分析中使用的每个来源的直接链接。
## 🛠️ 技术栈
## | 技术 | 用途 |
| :--- | :--- |
|
**Streamlit** | 前端仪表板与 UI |
|
**Groq LPU™** | 超低延迟 LLM 推理 (Llama 3.3-70B) |
|
**Tavily AI** | 专为 AI Agent 优化的搜索引擎 |
|
**Python** | 核心逻辑与 API 编排 |
## 📐 系统架构
以下图表说明了从用户输入到最终结论的数据流:
```
graph TD
A[User Input] -->|Submit| B(Streamlit UI)
B -->|Query Extraction| C{Tavily Search API}
C -->|Real-time Context| D[Contextual Snippets + URLs]
D -->|Augmented Prompt| E{Groq Inference Engine}
E -->|Llama 3.3-70B| F[JSON Parsed Analysis]
F -->|Verdict/Confidence/Evidence| G(Streamlit Dashboard)
G -->|Clickable Links| H[End User]
```
## ⚙️ 安装与本地设置
### 1\. 克隆仓库
```
git clone https://github.com/shubham001official/truthscanner-ai.git
cd truthscanner-ai
```
### 2\. 安装依赖
```
pip install -r requirements.txt
```
### 3\. 环境配置
在根目录下创建一个 `.env` 文件:
```
GROQ_API_KEY=your_groq_api_key
TAVILY_API_KEY=your_tavily_api_key
```
### 4\. 运行应用
```
streamlit run app.py
```
## 📖 工作原理:代码解析
### “法官”逻辑
与传统的基于概率预测文本的 ML 模型不同,TruthScanner 使用了 **RAG(检索增强生成)**。
1. **检索:** 系统会搜索相关性最高的前 6 个“高级”网络结果。
2. **上下文注入:** 来自这些来源的原始内容被注入到“事实核查员”系统提示词中。
3. **JSON 强制执行:** LLM 被限制为仅输出 JSON,从而允许应用以编程方式为 UI 进行颜色编码(绿色代表真实,红色代表虚假)。
## ⚖️ 许可证
基于 MIT 许可证分发。有关更多信息,请参见 `LICENSE`。
**免责声明:** *TruthScanner AI 是一款调查性工具。用户在做出决定前,应始终手动核实关键信息。*
|
|
| *用户输入有争议的声明* | *带有实时来源链接的详细结论* |
## 🚀 核心特性
* **实时网络检索:** 使用 Tavily 的高级搜索深度,绕过静态训练数据。
* **JSON 结构化推理:** 强制 Llama 3.3-70B 输出,确保一致的 UI 指标。
* **自动化来源验证:** 将声明与路透社、美联社 (AP) 和英国广播公司 等全球知名新闻机构的报道进行交叉比对。
* **置信度评分:** 根据证据密度提供 0-100% 的确定性指标。
* **来源透明度:** 交互式卡片,带有指向分析中使用的每个来源的直接链接。
## 🛠️ 技术栈
## | 技术 | 用途 |
| :--- | :--- |
| 标签:AI防伪, API编排, DLL 劫持, ESC4, Kubernetes, Llama 3, LLM推理, NLP, OSINT, Python, RAG, Streamlit, Tavily, 事实核查, 人工智能, 信息验证, 假新闻识别, 大语言模型, 媒体验证, 实时搜索, 无后门, 来源交叉比对, 检索增强生成, 用户模式Hook绕过, 置信度评分, 虚假信息检测, 访问控制, 逆向工具