owainlewis/awesome-artificial-intelligence
GitHub: owainlewis/awesome-artificial-intelligence
一份精心策划的人工智能资源大全,涵盖课程、书籍、论文、开发框架与前沿模型,系统化解决 AI 学习路径与工程实践中的信息过载问题。
Stars: 14145 | Forks: 2325
# 极佳的人工智能
一份精选的**必备、积极维护的资源**合集,用于构建和发布 AI 系统。
重点:**AI 工程**(RAG、agents、evals、guardrails、deploy)以及最好的书籍、指南、论文和*精心挑选*的工具集。

## 📚 学习
_深刻、持久耐用的知识 —— 五年后依然有价值。_
### 书籍
**现代与实用**
- [设计机器学习系统](https://www.oreilly.com/library/view/designing-machine-learning/9781098107956/) — 可扩展、可维护的 ML pipeline (Chip Huyen)。
- [AI 工程](https://www.oreilly.com/library/view/ai-engineering/9781098166298/) — 端到端 AI 产品构建 (Chip Huyen)。
- [从零构建大型语言模型](https://www.manning.com/books/build-a-large-language-model-from-scratch) — 在原始 PyTorch 中逐层实现 Transformers (Sebastian Raschka)。
- [大语言模型实战](https://www.llm-book.com/) — LLM 应用的可视化与实用指南 (Jay Alammar, Maarten Grootendorst)。
- [LLM 工程师手册](https://www.packtpub.com/en-us/product/llm-engineers-handbook-9781836200079) — 生产级 LLMOps:fine-tuning、quantization、serving (Labonne, Iusztin)。
- [百页语言模型书](https://www.thelmbook.com/) — 简明、基于数学的路径,从 n-grams 到 transformers (Andriy Burkov)。
- [生成式深度学习(第 2 版)](https://www.oreilly.com/library/view/generative-deep-learning/9781098134174/) — GANs、VAEs、diffusion models (David Foster)。
**基础**
- [人工智能:一种现代的方法](https://aima.cs.berkeley.edu/) — 经典的 AI 理论教材 (Russell, Norvig)。
- [深度学习](https://www.deeplearningbook.org/) — 神经网络的数学基础 (Goodfellow, Bengio, Courville)。
- [深度学习:基础与概念](https://www.bishopbook.com/) — Bishop 的 2024 年更新版;基于概率的现代 DL (Bishop & Bishop)。
- [理解深度学习](https://udlbook.github.io/udlbook/) — 数学 + 直觉 + Python notebooks (Simon Prince)。
- [语音与语言处理(第 3 版)](https://web.stanford.edu/~jurafsky/slp3/) — NLP 参考书,在深度学习时代保持更新 (Jurafsky, Martin)。
- [强化学习:导论(第 2 版)](https://web.stanford.edu/class/psych209/Readings/SuttonBartoIPRLBook2ndEd.pdf) — RL 基础 (Sutton, Barto)。
### 课程
**初学者**
- [Google 生成式 AI 学习路径](https://www.cloudskillsboost.google/paths/118)
- [Hugging Face LLM 课程](https://huggingface.co/learn/llm-course/chapter1/1)
- [Fast.ai — 实用深度学习](https://course.fast.ai/)
**中级 / 高级**
- [斯坦福 CS324:大型语言模型](https://stanford-cs324.github.io/winter2022/)
- [全栈深度学习](https://fullstackdeeplearning.com/)
- [MIT 6.S191:深度学习简介](https://introtodeeplearning.com/)
**专项**
- [DeepLearning.AI 短期课程](https://learn.deeplearning.ai/)
- [Google DeepMind — 强化学习简介](https://www.youtube.com/playlist?list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ)
- [Karpathy — 神经网络:从零到英雄](https://www.youtube.com/playlist?list=PLAqhIrjkxbuWI23v9cThsA9GvCAUhRvKZ)
### 里程碑式论文
_塑造了现代 AI 的研究 —— 值得一读,以了解当今架构背后的“原因”。_
- [Attention Is All You Need](https://arxiv.org/abs/1706.03762) — Transformer 架构。
- [Scaling Laws for Neural Language Models](https://arxiv.org/abs/2001.08361) — 模型/数据/算力的缩放定律。
- [Language Models are Few-Shot Learners](https://arxiv.org/abs/2005.14165) — GPT-3 的能力。
- [Constitutional AI](https://arxiv.org/abs/2212.08073) — 更安全的模型对齐。
## 🛠 构建
_用于构建 AI 的工具链。_
_个人注记:你不需要大量的框架 —— 从简单的 LLM 调用开始,然后逐步升级。_
### 指南与方案
- **[构建有效的 Agents (Anthropic)](https://www.anthropic.com/engineering/building-effective-agents)** — ⭐ 设计 AI agents 的模式、陷阱和权衡。
- [OpenAI Agents 指南](https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf) — 构建 agents 的实用指南。
- [Google AI Agents 论文](https://www.kaggle.com/whitepaper-agents) — 来自 Google 的构建 AI agents 的实用指南。
- [Google Agents 配套论文](https://www.kaggle.com/whitepaper-agent-companion) — 来自 Google 的配套指南。
- [OpenAI Cookbook](https://cookbook.openai.com/) — 使用 OpenAI API 的示例代码、方案和最佳实践。
- [LLM 工程师手册](https://github.com/SylphAI-Inc/LLM-engineer-handbook) — 为 AI 工程师提供的宝贵链接宝库。
### 框架
- [PocketFlow](https://the-pocket.github.io/PocketFlow/) — 仅用 100 行代码实现的极简 AI agent 框架。绝佳的学习方式。
- [Google ADK](https://google.github.io/adk-docs/) — Google 的 Agent 开发工具包(Python、Java)。出色的本地开发体验 + A2A + MCP。
- [Pydantic-AI](https://ai.pydantic.dev/) — 基于 Pydantic 模型构建的类型化、结构化 LLM 编排框架,用于安全、可预测的输出。
- [LangGraph](https://www.langchain.com/langgraph) — 在 LangChain 之上使用有状态图构建多 agent 工作流。
- [CrewAI](https://www.crewai.com/) — 具有结构化任务和 human-in-the-loop 控制的 agent 编排。
- [AutoGen](https://microsoft.github.io/autogen/) — Microsoft 用于多 agent 对话和协作的框架。
- [LlamaIndex](https://www.llamaindex.ai/) — 用于使用 LLM 摄取、索引和查询私有数据的数据框架。
- [Haystack](https://haystack.deepset.ai/) — 具有模块化 pipeline 的开源搜索/RAG 框架。
- [Docling](https://github.com/docling-project/docling) — 非常棒的库,用于为 RAG 摄取任何类型的文档 ⭐
### Evals
- [OpenAI Evals](https://github.com/openai/evals) — OpenAI 用于编写 evals 的框架。
### IDE
- [Cursor](https://cursor.sh/) — 由 LLM 驱动的 IDE,支持多文件编辑和感知代码库的聊天。
- [GitHub Copilot](https://github.com/features/copilot) — IDE 内的代码补全、聊天和重构。
## 🤖 Agents
_将 LLM 转化为自主工作者的框架。模型是可替换的;框架即产品。_
### 编程
_如需实时能力比较,请参见 [Terminal-Bench](https://www.tbench.ai/leaderboards) 和 [SWE-bench](https://www.swebench.com/)。_
- [Claude Code](https://code.claude.com/) — Anthropic 的 CLI agent;支持长上下文的多文件代码库重构。
- [Codex CLI](https://github.com/openai/codex) — OpenAI 基于 Rust 的本地终端 agent;轻量且快速。
- [Gemini CLI](https://github.com/google-gemini/gemini-cli) — Google 官方开源终端 agent;支持长上下文代码库探索。
- [Cursor CLI](https://cursor.com/cli) — Cursor 的终端原生 agent,具有沙盒权限。
- [Aider](https://aider.chat/) — 集成 Git 的结对编程,支持精准编辑和撤销。
- [OpenCode](https://opencode.ai/) — 与提供商无关的终端框架,具有强大的 TUI。
- [OpenHands](https://docs.all-hands.dev/) — 开源自主 SWE 平台;浏览器 + shell + 编辑器循环。
- [Cline](https://github.com/cline/cline) — 开源的 agentic IDE 扩展,具有强大的多提供商支持。
- [Continue](https://www.continue.dev/) — 开源 IDE + CLI 助手,支持受版本控制的规则。
- [Goose](https://block.github.io/goose/) — Block 的可扩展、MCP 驱动的本地 agent。
- [Factory Droid](https://factory.ai/product/cli) — 领先基准测试的多模型框架,支持 BYOK 本地执行。
- [Amp](https://ampcode.com/) — Sourcegraph 的商业 agentic 编程工具,具有出色的产品 UX。
- [Mistral Vibe](https://mistral.ai/products/vibe) — Mistral 的 agentic 编程 CLI,由 Devstral 提供支持。
- [Qwen Code](https://github.com/QwenLM/qwen-code) — 阿里巴巴的终端编程 agent,针对 Qwen 模型进行了优化。
- [Pi](https://pi.dev/) — 高度可定制的终端框架;极简的基础 prompt,扩展驱动。
- [Nanocoder](https://github.com/Nano-Collective/nanocoder) — 面向 Ollama 和 LM Studio 的私有、本地优先 agent。
- [Kilo CLI](https://kilo.ai/cli) — 多模式 agent,提供统一网关以访问 500 多个模型。
## 🧠 模型
_按模态划分的最先进的模型。_
### 💬 语言
主要的前沿实验室。
- [ChatGPT](https://openai.com/chatgpt/overview/) — 最适合通用推理、工具使用和最广泛的生态系统。
- [Claude](https://www.anthropic.com/claude) — 最适合长上下文分析、编程和结构化思维。
- [Gemini](https://gemini.google.com/) — 最适合多模态任务和 Google 生态系统集成。
- [Grok](https://x.ai/) — 最适合通过 X 获取实时信息和非常长的上下文。
- [Llama](https://www.llama.com/) — 最适合自托管和 fine-tuning 的开放权重家族。
- [Mistral](https://mistral.ai/) — 最适合轻量级、高性能的开放权重模型。
- [DeepSeek](https://deepseek.com/) — 最适合具有开放权重的低成本推理。
- [Qwen](https://qwenlm.github.io/) — 最适合多语言和中文优先的应用。
- [Kimi](https://www.kimi.com/) — 最适合长上下文指令遵循。
- [GLM](https://chatglm.cn/) — 具有开放权重的前沿级中文模型。
- [Cohere](https://cohere.com/) — 最适合具有强大检索增强生成 API 的企业级 LLM。
### 🖼 图像
- [GPT Image](https://openai.com/index/introducing-chatgpt-images-2-0/) — OpenAI 的集成图像生成,具有近乎完美的文本渲染。
- [Midjourney](https://www.midjourney.com/) — 艺术和逼真的图像。
- [Adobe Firefly](https://www.adobe.com/sensei/generative-ai/firefly.html) — 集成到 Creative Cloud 中;商业安全。
- [Ideogram](https://ideogram.ai/) — 在生成的图像中呈现精确、清晰的文本。
- [Flux](https://blackforestlabs.ai/) — 高分辨率、prompt 可编辑、开放权重图像。
### 🎥 视频
- [Google Veo](https://deepmind.google/technologies/veo/) — 具有同步音频的高质量视频。
- [Runway](https://runwayml.com/) — 具有精细创意控制的视频编辑 + 生成。
- [Kling](https://klingai.com/) — 电影级、逼真的视频生成。
### 🎙 音频
- [ElevenLabs](https://elevenlabs.io/) — 高质量的文本转语音和语音克隆。
- [Suno](https://suno.ai/) — 从文本 prompt 生成 AI 音乐。
### 📊 比较
_实时基准测试、定价和最新的模型版本。_
- [OpenRouter](https://openrouter.ai/models) — 统一 API + 跨越约 300 个模型的实时定价。
- [LMArena](https://lmarena.ai/leaderboard) — 用于文本、图像和视频的人类偏好 Elo 排名。
- [Artificial Analysis](https://artificialanalysis.ai/) — 跨提供商的速度、价格和质量基准测试。
## 📡 关注
_在不被噪音淹没的情况下保持最新。_
### 时事通讯
- [The Rundown AI](https://www.therundown.ai/)
- [AlphaSignal](https://alphasignal.ai/)
- [Superhuman AI](https://www.superhuman.ai/)
- [AI Engineer](https://newsletter.owainlewis.com)
标签:Apex, C2, DLL 劫持, LLMOps, RAG, 人工智能, 凭据扫描, 大语言模型, 学习资源, 机器学习, 用户模式Hook绕过, 系统调用监控, 逆向工具