tofuadmiral/agentcon-presentation-2026-nyc

GitHub: tofuadmiral/agentcon-presentation-2026-nyc

AgentCon NYC 2026 演讲幻灯片,介绍如何结合 Microsoft Foundry 红队测试与 Arize 可观测性构建 AI Agent 的自动化自我改进安全循环。

Stars: 0 | Forks: 0

# 使用自动化红队测试构建 AI Agent 的自我改进安全循环 **AgentCon NYC 2026** | Fuad Ali,[Arize AI](https://arize.com) 产品经理 ## 现场演示 **[查看幻灯片](https://fuad-ali-agentcon-2026.vercel.app/)** 使用方向键、空格键、滚动或滑动进行导航。 ## 预览 | | | | |---|---|---| | ![幻灯片 1 - 标题](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/c13f62244a105252.png) | ![幻灯片 2 - 概述](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/849f06ff74105254.png) | ![幻灯片 3 - 攻击面](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/84a9d48740105256.png) | | ![幻灯片 4 - 手动测试](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/c9ca4c202c105258.png) | ![幻灯片 5 - 红队测试循环](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/3884d63156105302.png) | ![幻灯片 6 - MS 架构](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/22378b0bb6105312.png) | | ![幻灯片 7 - 设置代码](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/95b168c004105316.png) | ![幻灯片 8 - 目标代码](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/86c839ad25105334.png) | ![幻灯片 9 - 攻击示例](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/540ef13d66105337.png) | | ![幻灯片 10 - 结果](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/1d8f6ea803105340.png) | ![幻灯片 11 - Arize Traces](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/578d4e8b0d105349.png) | ![幻灯片 12 - Traces 转数据](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/6ab6af3098105351.png) | | ![幻灯片 13 - Karpathy](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/475dcf066b105353.png) | ![幻灯片 14 - Prompt 优化](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/b32ca17b47105356.png) | ![幻灯片 15 - 从 20 到 100](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/32ec066ceb105358.png) | | ![幻灯片 16 - 安全循环](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/c81956366f105416.png) | ![幻灯片 17 - 谢谢](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/742cf69379105422.png) | | ## 关于本次演讲 AI Agent 引入了传统安全测试无法覆盖的攻击面:prompt 注入、工具滥用、指令劫持等。本次演讲将介绍如何构建一个自我改进的安全循环,使用: - **Microsoft Foundry 的 AI Red Teaming Agent** 用于自动化对抗测试 - **Arize** 用于可观测性、trace 捕获和自动化 prompt 优化 我们将演示该循环如何在五次自动化迭代中,将基础 AI 助手的安全评分从 20% 提升至 100%。 基于[此博客文章](https://arize.com/blog/how-to-improve-ai-agent-security-with-microsofts-ai-red-teaming-agent-in-microsoft-foundry/)。 ## 文件 - **现场演示**: [fuad-ali-agentcon-2026.vercel.app](https://fuad-ali-agentcon-2026.vercel.app/) - `agentcon-red-teaming.pptx` - PowerPoint 备份(17 张幻灯片,含演讲者备注) - `generate_pptx.py` - 用于重新生成 PPTX 的 Python 脚本 ## 致谢 本演示文稿使用 [frontend-slides](https://github.com/zarazhangrui/frontend-slides) 构建 —— 一个用于创建完全在浏览器中运行的富动画 HTML 演示文稿的工具。强烈推荐用于会议演讲。
标签:AgentCon, AI 可观测性, Arize AI, DLL 劫持, Git 安全, LLM 安全, Microsoft Foundry, RESTful API, 人工智能安全, 合规性, 后端开发, 多模态安全, 大语言模型, 对抗性机器学习, 工具滥用, 指令劫持, 提示词优化, 数据可视化, 演讲幻灯片, 私有化部署, 网络安全, 自动红队测试, 自我改进安全循环, 追踪数据, 逆向工具, 防御规避, 隐私保护