landing-ai/ade-document-processing-skills

GitHub: landing-ai/ade-document-processing-skills

为智能编程助手提供 LandingAI 文档抽取平台的 Agent 技能,实现无模板的复杂文档结构化解析与提取。

Stars: 6 | Forks: 0

# ADE 文档处理技能 [![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT) 用于 [LandingAI 的 Agentic Document Extraction (ADE)](https://landing.ai/) 的 Agent 技能 —— 生产就绪的文档 AI,可将复杂的现实世界文档转换为准确、结构化的数据,并具备完全的可审计性和可追溯性。 这些技能可教导智能编程助手(Claude、Cursor、Roo Code 或任何支持 [Agent Skills](https://agentskills.io/home) 规范的 Agent)如何编写 Python 脚本来解析、提取、分类以及构建文档处理 pipeline —— 无需模板或进行 ML 训练。 ## 为什么选择 ADE? - **视觉优先** —— 专有模型能够理解布局,而不仅仅是文本。可处理复杂的表格、密集的表单、多栏页面和扫描文档 - **准确** —— [在 DocVQA 上准确率达 99.16%](https://landing.ai/blog/superhuman-on-docvqa-without-images-in-qa-agentic-document-extraction),在已处理的 10 亿多份文档上得到验证 - **可追溯** —— 每个提取的值都包含边界框、页面坐标和置信度分数,可追溯回源文档 - **天生 Agentic** —— 自主适应每份文档,进行规划和验证,直到满足质量阈值 - **支持 20 多种文件格式** —— PDF、图像、电子表格、演示文稿等 —— 无需模板 ## 技能 ### 文档提取 用于解析和提取文档内容的核心 ADE SDK 操作。 - **解析**文档为结构化 Markdown,具备布局感知能力和层次化的 JSON - **提取**特定字段,使用 JSON schema 或 Pydantic 模型(发票、表单、表格) - **拆分**多文档批次,按类型分为单独的文档(发票与收据、报表与表单) - **分类**按类型对每页进行分类,以便在解析前路由页面(预览版) - **生成目录** —— 从解析的文档中提取层次化的章节结构(预览版) - **处理大文件**异步处理(最大支持 1 GB / 6,000 页) - **可视化定位** —— 为每个元素提供精确的边界框、页码和置信度分数 ### 文档工作流 端到端 pipeline 模式,将 ADE 操作组合成生产工作流。 - **批处理**并行处理文档(使用 ThreadPoolExecutor 同步或异步处理) - **分类后提取** pipeline,适用于混合文档类型 - **RAG 准备** —— 语义分块、embedding、ChromaDB/FAISS 数据摄入 - **导出**结构化结果到 DataFrame、CSV 或 Snowflake - **可视化**提取结果 —— 边界框叠加、分块裁剪、页面注释 - **词级定位** —— 查找并高亮显示文档部分中的特定术语 - 构建 **Streamlit UI**,用于交互式文档处理 ## 前置条件 - 来自 [LandingAI](https://va.landing.ai/settings/api-key) 的 **VISION_AGENT_API_KEY**(免费试用,无需信用卡) - Python 环境(例如 [uv](https://docs.astral.sh/uv/) 或 venv)—— 技能会根据需要安装 `landingai-ade` 和其他依赖项 ## 安装说明 ### 对于 Claude Code agents ``` # Step 1: 添加 marketplace /plugin marketplace add landing-ai/ade-document-processing-skills # Step 2: 安装 plugin /plugin install ade-document-processing@ade-document-processing-skills ``` ### 手动安装 1. **克隆仓库:** git clone https://github.com/landing-ai/ade-document-processing-skills.git 2. **将技能复制**到您的项目或主目录中: # 项目级别(技能仅应用于此项目) cp -R ade-document-processing-skills/plugins/ade-document-processing/skills/document-extraction YOUR_PROJECT/.claude/skills/ cp -R ade-document-processing-skills/plugins/ade-document-processing/skills/document-workflows YOUR_PROJECT/.claude/skills/ # 全局(技能在所有项目中均可用) cp -R ade-document-processing-skills/plugins/ade-document-processing/skills/document-extraction ~/.claude/skills/ cp -R ade-document-processing-skills/plugins/ade-document-processing/skills/document-workflows ~/.claude/skills/ ### 设置您的 API key 在您的项目根目录下创建一个 `.env` 文件: ``` echo 'VISION_AGENT_API_KEY=your-key-here' > .env ``` 在 [va.landing.ai/settings/api-key](https://va.landing.ai/settings/api-key) 获取您的 key。 ## 用法 这些技能会指导您的 agent 编写使用 ADE 处理文档的 Python 脚本。询问您的智能助手: 这些技能包含了关于依赖项安装、API 客户端设置和错误处理的指南与模式,因此您的 agent 会为您处理这些工作。 ## 仓库结构 ``` ├── .claude-plugin/ │ └── marketplace.json # Maps plugins for discovery ├── plugins/ │ └── ade-document-processing/ │ ├── .claude-plugin/ │ │ └── plugin.json # Plugin manifest listing skills │ └── skills/ │ ├── document-extraction/ │ │ ├── SKILL.md # Core ADE SDK skill │ │ └── references/ # Detailed reference docs │ └── document-workflows/ │ ├── SKILL.md # Pipeline patterns skill │ └── references/ # Detailed reference docs ├── LICENSE └── README.md ``` ## 链接 - [LandingAI](https://landing.ai/) —— Agentic Document Extraction 平台 - [ADE 文档](https://docs.landing.ai/ade/) - [ADE Python 库](https://github.com/landing-ai/ade-python) - [Agent 技能规范](https://agentskills.io/home) ## 许可证 本项目基于 MIT 许可证授权 —— 详情请参阅 [LICENSE](LICENSE) 文件。
标签:Kubernetes, LandingAI, OCR, Python SDK, 数据提取, 文档AI, 智能体工具, 逆向工具