owainlewis/awesome-artificial-intelligence

GitHub: owainlewis/awesome-artificial-intelligence

一份精心策划的人工智能资源大全,涵盖课程、书籍、论文、开发框架与前沿模型,系统化解决 AI 学习路径与工程实践中的信息过载问题。

Stars: 14145 | Forks: 2325

# 极佳的人工智能 一份精选的**必备、积极维护的资源**合集,用于构建和发布 AI 系统。 重点:**AI 工程**(RAG、agents、evals、guardrails、deploy)以及最好的书籍、指南、论文和*精心挑选*的工具集。 ![](https://media.giphy.com/media/jeAQYN9FfROX6/giphy.gif) ## 📚 学习 _深刻、持久耐用的知识 —— 五年后依然有价值。_ ### 书籍 **现代与实用** - [设计机器学习系统](https://www.oreilly.com/library/view/designing-machine-learning/9781098107956/) — 可扩展、可维护的 ML pipeline (Chip Huyen)。 - [AI 工程](https://www.oreilly.com/library/view/ai-engineering/9781098166298/) — 端到端 AI 产品构建 (Chip Huyen)。 - [从零构建大型语言模型](https://www.manning.com/books/build-a-large-language-model-from-scratch) — 在原始 PyTorch 中逐层实现 Transformers (Sebastian Raschka)。 - [大语言模型实战](https://www.llm-book.com/) — LLM 应用的可视化与实用指南 (Jay Alammar, Maarten Grootendorst)。 - [LLM 工程师手册](https://www.packtpub.com/en-us/product/llm-engineers-handbook-9781836200079) — 生产级 LLMOps:fine-tuning、quantization、serving (Labonne, Iusztin)。 - [百页语言模型书](https://www.thelmbook.com/) — 简明、基于数学的路径,从 n-grams 到 transformers (Andriy Burkov)。 - [生成式深度学习(第 2 版)](https://www.oreilly.com/library/view/generative-deep-learning/9781098134174/) — GANs、VAEs、diffusion models (David Foster)。 **基础** - [人工智能:一种现代的方法](https://aima.cs.berkeley.edu/) — 经典的 AI 理论教材 (Russell, Norvig)。 - [深度学习](https://www.deeplearningbook.org/) — 神经网络的数学基础 (Goodfellow, Bengio, Courville)。 - [深度学习:基础与概念](https://www.bishopbook.com/) — Bishop 的 2024 年更新版;基于概率的现代 DL (Bishop & Bishop)。 - [理解深度学习](https://udlbook.github.io/udlbook/) — 数学 + 直觉 + Python notebooks (Simon Prince)。 - [语音与语言处理(第 3 版)](https://web.stanford.edu/~jurafsky/slp3/) — NLP 参考书,在深度学习时代保持更新 (Jurafsky, Martin)。 - [强化学习:导论(第 2 版)](https://web.stanford.edu/class/psych209/Readings/SuttonBartoIPRLBook2ndEd.pdf) — RL 基础 (Sutton, Barto)。 ### 课程 **初学者** - [Google 生成式 AI 学习路径](https://www.cloudskillsboost.google/paths/118) - [Hugging Face LLM 课程](https://huggingface.co/learn/llm-course/chapter1/1) - [Fast.ai — 实用深度学习](https://course.fast.ai/) **中级 / 高级** - [斯坦福 CS324:大型语言模型](https://stanford-cs324.github.io/winter2022/) - [全栈深度学习](https://fullstackdeeplearning.com/) - [MIT 6.S191:深度学习简介](https://introtodeeplearning.com/) **专项** - [DeepLearning.AI 短期课程](https://learn.deeplearning.ai/) - [Google DeepMind — 强化学习简介](https://www.youtube.com/playlist?list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ) - [Karpathy — 神经网络:从零到英雄](https://www.youtube.com/playlist?list=PLAqhIrjkxbuWI23v9cThsA9GvCAUhRvKZ) ### 里程碑式论文 _塑造了现代 AI 的研究 —— 值得一读,以了解当今架构背后的“原因”。_ - [Attention Is All You Need](https://arxiv.org/abs/1706.03762) — Transformer 架构。 - [Scaling Laws for Neural Language Models](https://arxiv.org/abs/2001.08361) — 模型/数据/算力的缩放定律。 - [Language Models are Few-Shot Learners](https://arxiv.org/abs/2005.14165) — GPT-3 的能力。 - [Constitutional AI](https://arxiv.org/abs/2212.08073) — 更安全的模型对齐。 ## 🛠 构建 _用于构建 AI 的工具链。_ _个人注记:你不需要大量的框架 —— 从简单的 LLM 调用开始,然后逐步升级。_ ### 指南与方案 - **[构建有效的 Agents (Anthropic)](https://www.anthropic.com/engineering/building-effective-agents)** — ⭐ 设计 AI agents 的模式、陷阱和权衡。 - [OpenAI Agents 指南](https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf) — 构建 agents 的实用指南。 - [Google AI Agents 论文](https://www.kaggle.com/whitepaper-agents) — 来自 Google 的构建 AI agents 的实用指南。 - [Google Agents 配套论文](https://www.kaggle.com/whitepaper-agent-companion) — 来自 Google 的配套指南。 - [OpenAI Cookbook](https://cookbook.openai.com/) — 使用 OpenAI API 的示例代码、方案和最佳实践。 - [LLM 工程师手册](https://github.com/SylphAI-Inc/LLM-engineer-handbook) — 为 AI 工程师提供的宝贵链接宝库。 ### 框架 - [PocketFlow](https://the-pocket.github.io/PocketFlow/) — 仅用 100 行代码实现的极简 AI agent 框架。绝佳的学习方式。 - [Google ADK](https://google.github.io/adk-docs/) — Google 的 Agent 开发工具包(Python、Java)。出色的本地开发体验 + A2A + MCP。 - [Pydantic-AI](https://ai.pydantic.dev/) — 基于 Pydantic 模型构建的类型化、结构化 LLM 编排框架,用于安全、可预测的输出。 - [LangGraph](https://www.langchain.com/langgraph) — 在 LangChain 之上使用有状态图构建多 agent 工作流。 - [CrewAI](https://www.crewai.com/) — 具有结构化任务和 human-in-the-loop 控制的 agent 编排。 - [AutoGen](https://microsoft.github.io/autogen/) — Microsoft 用于多 agent 对话和协作的框架。 - [LlamaIndex](https://www.llamaindex.ai/) — 用于使用 LLM 摄取、索引和查询私有数据的数据框架。 - [Haystack](https://haystack.deepset.ai/) — 具有模块化 pipeline 的开源搜索/RAG 框架。 - [Docling](https://github.com/docling-project/docling) — 非常棒的库,用于为 RAG 摄取任何类型的文档 ⭐ ### Evals - [OpenAI Evals](https://github.com/openai/evals) — OpenAI 用于编写 evals 的框架。 ### IDE - [Cursor](https://cursor.sh/) — 由 LLM 驱动的 IDE,支持多文件编辑和感知代码库的聊天。 - [GitHub Copilot](https://github.com/features/copilot) — IDE 内的代码补全、聊天和重构。 ## 🤖 Agents _将 LLM 转化为自主工作者的框架。模型是可替换的;框架即产品。_ ### 编程 _如需实时能力比较,请参见 [Terminal-Bench](https://www.tbench.ai/leaderboards) 和 [SWE-bench](https://www.swebench.com/)。_ - [Claude Code](https://code.claude.com/) — Anthropic 的 CLI agent;支持长上下文的多文件代码库重构。 - [Codex CLI](https://github.com/openai/codex) — OpenAI 基于 Rust 的本地终端 agent;轻量且快速。 - [Gemini CLI](https://github.com/google-gemini/gemini-cli) — Google 官方开源终端 agent;支持长上下文代码库探索。 - [Cursor CLI](https://cursor.com/cli) — Cursor 的终端原生 agent,具有沙盒权限。 - [Aider](https://aider.chat/) — 集成 Git 的结对编程,支持精准编辑和撤销。 - [OpenCode](https://opencode.ai/) — 与提供商无关的终端框架,具有强大的 TUI。 - [OpenHands](https://docs.all-hands.dev/) — 开源自主 SWE 平台;浏览器 + shell + 编辑器循环。 - [Cline](https://github.com/cline/cline) — 开源的 agentic IDE 扩展,具有强大的多提供商支持。 - [Continue](https://www.continue.dev/) — 开源 IDE + CLI 助手,支持受版本控制的规则。 - [Goose](https://block.github.io/goose/) — Block 的可扩展、MCP 驱动的本地 agent。 - [Factory Droid](https://factory.ai/product/cli) — 领先基准测试的多模型框架,支持 BYOK 本地执行。 - [Amp](https://ampcode.com/) — Sourcegraph 的商业 agentic 编程工具,具有出色的产品 UX。 - [Mistral Vibe](https://mistral.ai/products/vibe) — Mistral 的 agentic 编程 CLI,由 Devstral 提供支持。 - [Qwen Code](https://github.com/QwenLM/qwen-code) — 阿里巴巴的终端编程 agent,针对 Qwen 模型进行了优化。 - [Pi](https://pi.dev/) — 高度可定制的终端框架;极简的基础 prompt,扩展驱动。 - [Nanocoder](https://github.com/Nano-Collective/nanocoder) — 面向 Ollama 和 LM Studio 的私有、本地优先 agent。 - [Kilo CLI](https://kilo.ai/cli) — 多模式 agent,提供统一网关以访问 500 多个模型。 ## 🧠 模型 _按模态划分的最先进的模型。_ ### 💬 语言 主要的前沿实验室。 - [ChatGPT](https://openai.com/chatgpt/overview/) — 最适合通用推理、工具使用和最广泛的生态系统。 - [Claude](https://www.anthropic.com/claude) — 最适合长上下文分析、编程和结构化思维。 - [Gemini](https://gemini.google.com/) — 最适合多模态任务和 Google 生态系统集成。 - [Grok](https://x.ai/) — 最适合通过 X 获取实时信息和非常长的上下文。 - [Llama](https://www.llama.com/) — 最适合自托管和 fine-tuning 的开放权重家族。 - [Mistral](https://mistral.ai/) — 最适合轻量级、高性能的开放权重模型。 - [DeepSeek](https://deepseek.com/) — 最适合具有开放权重的低成本推理。 - [Qwen](https://qwenlm.github.io/) — 最适合多语言和中文优先的应用。 - [Kimi](https://www.kimi.com/) — 最适合长上下文指令遵循。 - [GLM](https://chatglm.cn/) — 具有开放权重的前沿级中文模型。 - [Cohere](https://cohere.com/) — 最适合具有强大检索增强生成 API 的企业级 LLM。 ### 🖼 图像 - [GPT Image](https://openai.com/index/introducing-chatgpt-images-2-0/) — OpenAI 的集成图像生成,具有近乎完美的文本渲染。 - [Midjourney](https://www.midjourney.com/) — 艺术和逼真的图像。 - [Adobe Firefly](https://www.adobe.com/sensei/generative-ai/firefly.html) — 集成到 Creative Cloud 中;商业安全。 - [Ideogram](https://ideogram.ai/) — 在生成的图像中呈现精确、清晰的文本。 - [Flux](https://blackforestlabs.ai/) — 高分辨率、prompt 可编辑、开放权重图像。 ### 🎥 视频 - [Google Veo](https://deepmind.google/technologies/veo/) — 具有同步音频的高质量视频。 - [Runway](https://runwayml.com/) — 具有精细创意控制的视频编辑 + 生成。 - [Kling](https://klingai.com/) — 电影级、逼真的视频生成。 ### 🎙 音频 - [ElevenLabs](https://elevenlabs.io/) — 高质量的文本转语音和语音克隆。 - [Suno](https://suno.ai/) — 从文本 prompt 生成 AI 音乐。 ### 📊 比较 _实时基准测试、定价和最新的模型版本。_ - [OpenRouter](https://openrouter.ai/models) — 统一 API + 跨越约 300 个模型的实时定价。 - [LMArena](https://lmarena.ai/leaderboard) — 用于文本、图像和视频的人类偏好 Elo 排名。 - [Artificial Analysis](https://artificialanalysis.ai/) — 跨提供商的速度、价格和质量基准测试。 ## 📡 关注 _在不被噪音淹没的情况下保持最新。_ ### 时事通讯 - [The Rundown AI](https://www.therundown.ai/) - [AlphaSignal](https://alphasignal.ai/) - [Superhuman AI](https://www.superhuman.ai/) - [AI Engineer](https://newsletter.owainlewis.com)
标签:Apex, C2, DLL 劫持, LLMOps, RAG, 人工智能, 凭据扫描, 大语言模型, 学习资源, 机器学习, 用户模式Hook绕过, 系统调用监控, 逆向工具