Josh-blythe/Josh-blythe

GitHub: Josh-blythe/Josh-blythe

该项目聚焦 LLM 提示注入攻防，构建快速检测与实战演练一体的安全解决方案。

Stars: 0 | Forks: 0

### 嘿，我是 Josh FTSE 100 网络安全专业人士，致力于构建多模态提示注入检测工具。如果你能找到突破它的方法，请告诉我。毕业于英国前十的顶尖大学计算机科学专业，专攻人工智能、网络安全与密码学。现将所学应用于 [Bordair](https://bordair.io) 的 LLM 应用安全防护。 **我正在构建的项目：** - [Bordair](https://bordair.io) — 一个在 50 毫秒内扫描 LLM 输入的提示注入检测 API - 三阶段门控流水线：正则快速拒绝 → 快速接受 → ONNX INT8 Transformer 分类器 - 基于 100 万+ 标注样本进行训练，包含手工设计的与研究支持的高难度负样本 - 双区域 AWS（伦敦 + 弗吉尼亚）部署，基于延迟的路由策略 - [Bordair's Castle](https://castle.bordair.io) — 一个兼具实时红队演练的提示注入挑战游戏 **我关注的方向：** - OWASP LLM Top 10（尤其是 LLM01：提示注入） - 对抗性机器学习 — 编码载荷、语义攻击、多轮越狱攻击 - 让 AI 安全工具对独立开发者同样友好，而不仅限于企业用户 **联系方式：** - 尝试破解我的检测器：[castle.bordair.io](https://castle.bordair.io) - API 文档：[bordair.io](https://bordair.io) - 邮箱：[hello@bordair.io](mailto:hello@bordair.io) - `pip install bordair` - `npm install bordair`

标签：AI安全, AWS双区域, Bordair, Castle, Chat Copilot, CNCF毕业项目, INT8量化, LLM01, npm install, ONNX, OWASP LLM Top 10, pip install, Transformer分类器, 伦敦Virginia, 低延迟检测, 多模态提示注入, 多阶段管道, 大模型安全, 威胁情报, 安全API, 密码学, 对抗性机器学习, 延迟路由, 开发者工具, 手动系统调用, 提示注入, 暗色界面, 正则表达式快速拒绝, 漏洞利用检测, 硬负样本, 网络安全, 计算机科学, 逆向工具, 隐私保护, 集群管理, 零日漏洞检测