landing-ai/ade-document-processing-skills
GitHub: landing-ai/ade-document-processing-skills
为智能编程助手提供 LandingAI 文档抽取平台的 Agent 技能,实现无模板的复杂文档结构化解析与提取。
Stars: 6 | Forks: 0
# ADE 文档处理技能
[](https://opensource.org/licenses/MIT)
用于 [LandingAI 的 Agentic Document Extraction (ADE)](https://landing.ai/) 的 Agent 技能 —— 生产就绪的文档 AI,可将复杂的现实世界文档转换为准确、结构化的数据,并具备完全的可审计性和可追溯性。
这些技能可教导智能编程助手(Claude、Cursor、Roo Code 或任何支持 [Agent Skills](https://agentskills.io/home) 规范的 Agent)如何编写 Python 脚本来解析、提取、分类以及构建文档处理 pipeline —— 无需模板或进行 ML 训练。
## 为什么选择 ADE?
- **视觉优先** —— 专有模型能够理解布局,而不仅仅是文本。可处理复杂的表格、密集的表单、多栏页面和扫描文档
- **准确** —— [在 DocVQA 上准确率达 99.16%](https://landing.ai/blog/superhuman-on-docvqa-without-images-in-qa-agentic-document-extraction),在已处理的 10 亿多份文档上得到验证
- **可追溯** —— 每个提取的值都包含边界框、页面坐标和置信度分数,可追溯回源文档
- **天生 Agentic** —— 自主适应每份文档,进行规划和验证,直到满足质量阈值
- **支持 20 多种文件格式** —— PDF、图像、电子表格、演示文稿等 —— 无需模板
## 技能
### 文档提取
用于解析和提取文档内容的核心 ADE SDK 操作。
- **解析**文档为结构化 Markdown,具备布局感知能力和层次化的 JSON
- **提取**特定字段,使用 JSON schema 或 Pydantic 模型(发票、表单、表格)
- **拆分**多文档批次,按类型分为单独的文档(发票与收据、报表与表单)
- **分类**按类型对每页进行分类,以便在解析前路由页面(预览版)
- **生成目录** —— 从解析的文档中提取层次化的章节结构(预览版)
- **处理大文件**异步处理(最大支持 1 GB / 6,000 页)
- **可视化定位** —— 为每个元素提供精确的边界框、页码和置信度分数
### 文档工作流
端到端 pipeline 模式,将 ADE 操作组合成生产工作流。
- **批处理**并行处理文档(使用 ThreadPoolExecutor 同步或异步处理)
- **分类后提取** pipeline,适用于混合文档类型
- **RAG 准备** —— 语义分块、embedding、ChromaDB/FAISS 数据摄入
- **导出**结构化结果到 DataFrame、CSV 或 Snowflake
- **可视化**提取结果 —— 边界框叠加、分块裁剪、页面注释
- **词级定位** —— 查找并高亮显示文档部分中的特定术语
- 构建 **Streamlit UI**,用于交互式文档处理
## 前置条件
- 来自 [LandingAI](https://va.landing.ai/settings/api-key) 的 **VISION_AGENT_API_KEY**(免费试用,无需信用卡)
- Python 环境(例如 [uv](https://docs.astral.sh/uv/) 或 venv)—— 技能会根据需要安装 `landingai-ade` 和其他依赖项
## 安装说明
### 对于 Claude Code agents
```
# Step 1: 添加 marketplace
/plugin marketplace add landing-ai/ade-document-processing-skills
# Step 2: 安装 plugin
/plugin install ade-document-processing@ade-document-processing-skills
```
### 手动安装
1. **克隆仓库:**
git clone https://github.com/landing-ai/ade-document-processing-skills.git
2. **将技能复制**到您的项目或主目录中:
# 项目级别(技能仅应用于此项目)
cp -R ade-document-processing-skills/plugins/ade-document-processing/skills/document-extraction YOUR_PROJECT/.claude/skills/
cp -R ade-document-processing-skills/plugins/ade-document-processing/skills/document-workflows YOUR_PROJECT/.claude/skills/
# 全局(技能在所有项目中均可用)
cp -R ade-document-processing-skills/plugins/ade-document-processing/skills/document-extraction ~/.claude/skills/
cp -R ade-document-processing-skills/plugins/ade-document-processing/skills/document-workflows ~/.claude/skills/
### 设置您的 API key
在您的项目根目录下创建一个 `.env` 文件:
```
echo 'VISION_AGENT_API_KEY=your-key-here' > .env
```
在 [va.landing.ai/settings/api-key](https://va.landing.ai/settings/api-key) 获取您的 key。
## 用法
这些技能会指导您的 agent 编写使用 ADE 处理文档的 Python 脚本。询问您的智能助手:
这些技能包含了关于依赖项安装、API 客户端设置和错误处理的指南与模式,因此您的 agent 会为您处理这些工作。
## 仓库结构
```
├── .claude-plugin/
│ └── marketplace.json # Maps plugins for discovery
├── plugins/
│ └── ade-document-processing/
│ ├── .claude-plugin/
│ │ └── plugin.json # Plugin manifest listing skills
│ └── skills/
│ ├── document-extraction/
│ │ ├── SKILL.md # Core ADE SDK skill
│ │ └── references/ # Detailed reference docs
│ └── document-workflows/
│ ├── SKILL.md # Pipeline patterns skill
│ └── references/ # Detailed reference docs
├── LICENSE
└── README.md
```
## 链接
- [LandingAI](https://landing.ai/) —— Agentic Document Extraction 平台
- [ADE 文档](https://docs.landing.ai/ade/)
- [ADE Python 库](https://github.com/landing-ai/ade-python)
- [Agent 技能规范](https://agentskills.io/home)
## 许可证
本项目基于 MIT 许可证授权 —— 详情请参阅 [LICENSE](LICENSE) 文件。
标签:Kubernetes, LandingAI, OCR, Python SDK, 数据提取, 文档AI, 智能体工具, 逆向工具