msamad08/intelligent-claims-operations-ai-platform
GitHub: msamad08/intelligent-claims-operations-ai-platform
一个基于RAG的企业级智能助手平台,结合本地或云端LLM与语义检索技术,专为保险理赔、SOP检索及运营决策提供精准的知识问答支持。
Stars: 1 | Forks: 0
# 智能理赔与运营 AI 平台
用于保险理赔智能、SOP 检索、事件响应指导和运营决策支持的企业级检索增强生成 (RAG) 平台。
[](https://intelligent-claims-operations-ai-platform.onrender.com)
## 平台预览
### 对话式 RAG 界面

### FastAPI 后端

### 系统架构
## 
## 实时功能
* 对话式 AI 助手界面
* PDF 上传和摄取工作流
* 语义文档检索
* 使用 ChromaDB 进行向量数据库搜索
* 使用 SentenceTransformers 的本地嵌入模型
* 使用 Ollama 和 Llama 3.2 进行本地 LLM 摘要生成
* 零成本本地 RAG 响应生成
* 理赔智能工作流
* 运营 SOP 检索
* 事件响应指导
* 置信度评分和升级逻辑
* FastAPI 后端服务
* Streamlit 对话式前端
* Docker 部署支持
## 系统架构
```
PDF Documents
↓
Document Ingestion Pipeline
↓
Text Chunking
↓
SentenceTransformer Embeddings
↓
Chroma Vector Database
↓
Semantic Retrieval Engine
↓
Operational Intelligence Layer
↓
Confidence Scoring + Escalation Logic
↓
FastAPI Backend
↓
Streamlit Conversational Interface
```
## 核心技术
### AI / 机器学习
* Python
* LangChain
* SentenceTransformers
* ChromaDB
* 语义检索
* 检索增强生成 (RAG)
* 向量搜索
* HuggingFace Embeddings
* Ollama / Llama 3.2
* OpenAI GPT-3.5 Turbo
### 后端 / API
* FastAPI
* Uvicorn
* REST API 架构
### 前端 / 可视化
* Streamlit
* 对话式聊天界面
### 数据工程
* PDF 摄取流水线
* 文本分块
* 文档解析
* 向量数据库工作流
### 部署
* Docker
* Render
* GitHub
## 项目结构
```
intelligent-claims-operations-ai-platform/
│
├── data/
│ ├── documents/
│ └── processed/
│
├── outputs/
│ ├── figures/
│ └── reports/
│
├── src/
│ ├── app.py
│ ├── api.py
│ ├── ingest_documents.py
│ ├── rag_pipeline.py
│ └── guardrails.py
│
├── vectorstore/
├── requirements.txt
├── Dockerfile
├── start.sh
├── .env.example
├── .gitignore
└── README.md
```
## Ollama 设置(仅限本地)
如果在没有 OpenAI API 密钥的情况下在本地运行,则需要此项。
从 [https://ollama.com](https://ollama.com) 安装 Ollama
然后拉取并运行模型:
```
ollama pull llama3.2
ollama serve
```
## 环境配置
在运行之前,将 `.env.example` 复制到 `.env`:
#### Windows PowerShell
```
Copy-Item ".env.example" ".env"
```
#### macOS / Linux
```
cp .env.example .env
```
然后打开 `.env` 并填写您的配置值:
```
# 选项 1: OpenAI (cloud deployment)
OPENAI_API_KEY=your-openai-key-here
# 选项 2: Local Ollama (leave OPENAI_API_KEY blank)
OLLAMA_HOST=http://localhost:11434
```
## 快速入门
1. 完成上述 Ollama 设置(本地),或在 `.env` 中设置 `OPENAI_API_KEY`(云端)
2. 克隆仓库并安装依赖项
3. 将 PDF 文档放入 `data/documents/`
4. 运行摄取:
```
python src/ingest_documents.py
```
5. 启动应用:
```
python -m streamlit run src/app.py
```
## 本地安装
### 克隆仓库
```
git clone https://github.com/msamad08/intelligent-claims-operations-ai-platform.git
cd intelligent-claims-operations-ai-platform
```
### 创建虚拟环境
```
python -m venv .venv
```
### 激活环境
#### Windows PowerShell
```
Set-ExecutionPolicy -Scope Process -ExecutionPolicy Bypass
.venv\Scripts\Activate.ps1
```
#### macOS / Linux
```
source .venv/bin/activate
```
### 安装依赖项
```
pip install -r requirements.txt
```
## 运行 Streamlit 应用
```
python -m streamlit run src/app.py
```
然后打开:
http://localhost:8501
## 运行 FastAPI 后端
```
python -m uvicorn src.api:app --reload
```
Swagger UI:
http://127.0.0.1:8000/docs
## PDF 摄取工作流
将 PDF 文档放入:
data/documents/
然后运行:
```
python src/ingest_documents.py
```
此流水线将:
* 加载 PDF
* 将文档拆分为块
* 生成嵌入
* 构建向量数据库
* 启用语义检索
## Docker 部署
### 构建 Docker 镜像
```
docker build -t intelligent-claims-ai .
```
### 运行 Docker 容器
```
docker run -p 8501:8501 -p 8000:8000 intelligent-claims-ai
```
## 示例问题
保险理赔处理期间需要哪些文档?
在严重风暴事件期间应采取哪些操作步骤?
理赔应在何时上报给主管?
在开始紧急缓解之前必须记录哪些信息?
## 企业级工作流示例
1. 用户上传理赔政策文件
2. 文档被分块并生成嵌入
3. ChromaDB 存储语义向量
4. 用户提交运营问题
5. 语义检索找到相关章节
6. AI 助手生成基于事实的响应
7. 应用置信度评分和升级逻辑
8. 将信息源返回给用户
## 未来增强
计划中的未来改进包括:
* 身份验证和基于角色的访问控制
* 引用高亮
* 多文档推理
* 混合 BM25 + 向量检索
* CI/CD 自动化
* 对话记忆
* Agentic 工作流编排
* 运营分析仪表板集成
## 战略组合价值
本项目展示了:
* 企业级 GenAI 架构
* 检索增强生成 (RAG)
* 向量数据库工程
* 语义检索系统
* FastAPI 后端部署
* Streamlit 前端工程
* 运营 AI 工作流
* 决策支持系统设计
* 理赔智能自动化
* AI 驱动的文档智能
## 作者
Mohammad Samad
数据科学家 | AI 与运营智能 | 预测分析 | 运筹学
GitHub: [https://github.com/msamad08]
标签:AI风险缓解, AV绕过, ChromaDB, FastAPI, HuggingFace, Kubernetes, LangChain, Llama 3.2, LLM评估, Ollama, OpenAI, PDF文档解析, Python, RAG, Ruby, SentenceTransformers, SOP检索, Streamlit, 事件响应指导, 企业搜索, 企业级AI助手, 保险理赔, 内存规避, 升级逻辑, 向量搜索, 向量数据库, 对话式AI, 无后门, 智能运维, 本地大模型, 检索增强生成, 知识库, 置信度评分, 访问控制, 语义检索, 请求拦截, 轻量级, 运营决策支持, 逆向工具