BezL1k1y/prompting_lab

GitHub: BezL1k1y/prompting_lab

基于 Groq API 的 LLM 提示工程实验集合,涵盖零样本/少样本分类、思维链推理、自我反思和提示注入检测五项技术的系统评测。

Stars: 0 | Forks: 0

# Prompting 实验室 在 LLM prompting 技术上进行系统性实验,并在真实的 benchmark 上进行评估。 ## 实验 | # | 名称 | 技术 | 数据集 | |---|------|-----------|---------| | 1 | Zero-Shot 情感分析 | 单指令 prompt | IMDB | | 2 | Few-Shot 情感分析 | 上下文中包含 5 个标注样本 | IMDB | | 3 | Chain-of-Thought 数学 | 显式逐步推理 | 自定义数学任务 | | 4 | 自我反思 | 模型审查并纠正其自身的答案 | 相同的数学任务 | | 5 | Injection 检测 | Regex + 模式防护 | 对抗性输入 | ## 配置 ``` pip install requests datasets transformers export GROQ_API_KEY="gsk_..." ``` ## 运行 ``` # 单个实验 python prompting_lab.py --experiment zero_shot # 所有实验 python prompting_lab.py --experiment all ``` ## 设计说明 ### Zero-shot 与 Few-shot 这两种方法都在相同的 20 样本 IMDB benchmark 上进行了测试。 Few-shot 通常在强大的指令微调模型上能看到 **0–5%** 的准确率提升。 ### Chain-of-Thought `solve_cot` 函数要求模型逐步进行推理。 单独的 `extract_answer` 调用会将最终的数字解析为 JSON —— 避免在冗长的文本上使用脆弱的 regex。 ### 自我反思 第二次 LLM 调用要求模型对自身的解决方案进行评判。 分析:模型通常会纠正边缘情况(百分比与计数),但偶尔也会对原本正确的答案进行过度纠正。 ### Injection 检测 基于规则的防护,包含涵盖以下内容的 10 种模式: - SQL injection - Python 代码 injection - XSS - 指令覆盖攻击 - DAN / jailbreak 模式 检测在有意设计上偏向保守 —— 在面向用户的助手场景中,漏报比误报更安全。
标签:DLL 劫持, Groq API, Rego, Sysdig, 人工智能, 大语言模型, 提示词工程, 机器学习实验, 用户模式Hook绕过, 策略决策点, 系统调用监控, 逆向工具, 零日漏洞检测