itigges22/ATLAS

GitHub: itigges22/ATLAS

一个完全自托管的编码智能体,通过约束驱动的测试时学习与自主专业化,在离线环境下实现高质量代码生成与修复。

Stars: 1911 | Forks: 170

ATLAS Banner

Version License Model GPU

简体中文 日本語 한국어

A.T.L.A.S.

自适应测试时学习与自主专业化

ATLAS 是一个由智能推理基础设施驱动的完全自托管编码助手。我们将冻结的本地模型包裹在约束驱动的生成、能量验证和自验证修复中——无需微调、无需 API 调用、无需云端。ATLAS 的存在是为了证明:有意义的 AI 工具并不要求前沿模型、云 API 或巨额预算,只需围绕能力开放的权重模型构建智能基础设施即可。 ## 🔥 最新动态 - **2026-04-05** - **[V3.0.1 发布](CHANGELOG.md)** - 交互式 CLI、Docker Compose 部署、95.8% 可靠性 - **2026-04-03** - ["$500 GPU 击败 Claude:本地 AI 开发者的革命"](https://ownet.it/blog/500-gpu-beats-claude-local-ai-revolution-for-web-devs) - ownet.it - **2026-03-29** - ["一张 $500 显卡在编码基准测试中超越 Claude Sonnet"](https://aivy.com.au/news/atlas-500-gpu-outperforms-claude-sonnet-coding/) - Aivy - **2026-03-28** - ["为什么一张 $500 显卡能在编码基准上击败 Claude Sonnet"](https://medium.com/data-science-collective/why-a-500-gpu-can-beat-claude-sonnet-on-coding-benchmarks-6c8169ffe4fe) - Data Science Collective - **2026-03-27** - ["ATLAS:一张 $500 显卡超越 Claude Sonnet"](https://clauday.com/article/b92c5551-b490-4d76-ae3d-d8dedf10d88b) - Clauday - **2026-03-26** - [Hacker News 首页](https://news.ycombinator.com/item?id=47533297) - 489 分,285 条评论 - **2026-03-05** - **[V3.0 发布](docs/reports/V3_ABLATION_STUDY.md)** - 在冻结的 Qwen3-14B 上实现 74.6% LiveCodeBench pass@1-v(k=3) - **2026-02-18** - **[V2.0 发布](CHANGELOG.md)** - 基准测试基础设施、HumanEval/MBPP/LiveCodeBench/GPQA/SciCode 评测套件 Star History Chart ## 🧱 ATLAS 的功能 1. **[atlas-proxy](docs/ARCHITECTURE.md#3-atlas-proxy-outer-layer)** - 基于 Go 的代理循环,负责协调整个系统。 - a. [工具调用路由](docs/ARCHITECTURE.md#tools) - 按复杂度层级分类文件操作 - b. [语法强制](docs/ARCHITECTURE.md#grammar-enforcement) - GBNF 模式保证 100% 有效的 JSON 输出 - c. [安全限制](docs/ARCHITECTURE.md#safety-limits) - 调用次数上限、令牌预算、超时强制 2. **[V3 流水线](docs/ARCHITECTURE.md#4-v3-pipeline-inner-layer)** - 将单个提示转换为已验证的高质量输出的多阶段代码生成。 - a. [PlanSearch](docs/reports/V3_ABLATION_STUDY.md#phase-1-constraint-driven-generation-124pp) - 约束驱动的结构化规划 - b. [DivSampling](docs/reports/V3_ABLATION_STUDY.md#phase-1-constraint-driven-generation-124pp) - 跨温度与策略的多样化候选生成 - c. [Budget Forcing](docs/reports/V3_ABLATION_STUDY.md#phase-1-constraint-driven-generation-124pp) - 控制每阶段的思考令牌分配 - d. [PR-CoT 修复](docs/reports/V3_ABLATION_STUDY.md#pr-cot-repair-36-rescues) - 为迭代修复循环生成自测试用例 - e. [精炼循环](docs/reports/V3_ABLATION_STUDY.md#refinement-loop-6-rescues) - 重复的沙箱验证与修正 - f. [推导链](docs/reports/V3_ABLATION_STUDY.md#derivation-chains-0-rescues) - 复杂问题的多步推理 3. **[Geometric Lens](docs/ARCHITECTURE.md#5-geometric-lens)** - 无外部预言机的能量评分与检索。([什么是“Geometric Lens”?](docs/ARCHITECTURE.md#why-geometric-lens)) - a. [C(x) Cost 场](docs/ARCHITECTURE.md#scoring-models) - 从嵌入中评分候选质量的 MLP - b. [G(x) 质量预测](docs/ARCHITECTURE.md#scoring-models) - 用于选择决策的 XGBoost 模型 - c. [RAG / PageIndex V2](docs/ARCHITECTURE.md#rag--pageindex-v2) - AST 感知的代码检索与项目索引 - d. [置信度路由器](docs/ARCHITECTURE.md#confidence-router--pattern-cache) - Thompson 采样将计算路由到关键位置 4. **[Sandbox](docs/ARCHITECTURE.md#6-sandbox)** - 用于构建验证的隔离执行环境。 - a. 多语言执行 - Python、Rust、Go、C、Shell 等 - b. 编译与 linting - 评分前的语法验证 - c. 测试运行 - 执行生成的和现有的测试套件 5. **[llama-server](docs/CONFIGURATION.md#6-llama-server)** - 单消费级 GPU 上的本地 LLM 推理。 - a. CUDA 加速 - 量化模型推理(Q6_K / Q4_K_M) - b. 语法约束解码 - 令牌级的结构化输出 - c. 自嵌入 - 无需单独模型的嵌入提取 6. **[Interactive CLI](docs/CLI.md)** - 在任意项目目录中输入 `atlas` 即可开始构建。 - a. [工具调用代理循环](docs/CLI.md#streaming-output) - 读取、写入、编辑、删除、运行命令 - b. [流式输出](docs/CLI.md#how-streaming-works) - 通过 SSE 实时响应 - c. [项目感知上下文](docs/CLI.md#proxy-file-access) - 自动文件发现与注入 完整文档——安装指南、架构、配置、故障排除和基准报告位于 [docs/](docs/) 目录中。 ## 🚀 快速开始 ATLAS 需要一张 16GB+ 显存的 GPU、Docker(带 nvidia-container-toolkit)或 Podman,以及 Python 3.9+。当前在 NVIDIA GPU 上测试通过——ATLAS 并非 NVIDIA 专属,AMD GPU 的 ROCm 支持已在路线图上。请参阅 **[SETUP.md](docs/SETUP.md)** 获取完整的安装说明,涵盖 Docker Compose、裸机部署与 K3s 部署。运行后,在任意项目目录中输入 `atlas` 即可开始构建。 ## ⚠️ 已知限制 - **仅测试于 NVIDIA** - ATLAS 使用 llama.cpp 进行推理,支持多种加速器后端。ROCm 支持是 V3.1 的优先事项。 - **9B 模型尚未正式评测** - CLI 打包了 Qwen3.5-9B,但 LiveCodeBench 正式分数来自 14B 模型。9B 基准测试为 V3.1 工作内容。 - **复杂功能添加可能失败** - 向现有项目添加功能约 67% 成功率。模型有时会过度探索而非直接写代码。 - **语法约束推理速度** - llama-server 上约 51 令牌/秒。计划中的 V3.1 将引入 C 侧采样器链以提升约束解码速度。 ## 🗺️ 路线图 **V3.0.1** - 当前发布版本。交互式 CLI、Docker Compose 部署、V3 流水线集成。 **V3.1** - 进行中。 - ROCm 支持 - 通过 llama.cpp ROCm 后端实现 AMD GPU 推理 - 正式 9B 评测 - 在 Qwen3.5-9B 上运行 LiveCodeBench、GPQA Diamond、SciCode - CLI 可靠性 - 扩展测试,目标 L6 ≥ 90% - 语法速度 - C 侧采样器链实现更快的约束解码 ## 📄 许可证 根据 [GNU Affero General Public License v3.0 (AGPL-3.0)](LICENSE) 授权。
标签:$500 GPU编码, AGPL-3.0许可, A.T.L.A.S, ATLAS V3.0.1, Docker Compose部署, IPv6支持, Qwen3.5-9B, RTX 5060 Ti, 中文文档, 交互式CLI, 代码智能体, 可视化界面, 开放权重模型, 한국어文档, 无监督修复, 无需API, 无需云端, 无需微调, 日志审计, 日本語文档, 智能基础设施, 服务枚举, 本地AI革命, 本地模型, 测试时学习, 约束生成, 编码助手, 编码基准超越, 能效验证, 能量验证, 自主专长, 自主学习循环, 自适应推理, 自验证修复, 请求拦截, 逆向工具, 领域自适应, 高可靠性