n-chiu/Thesis-An-Exploratory-Case-Study-of-LLMs-for-Security-Test-Generation
GitHub: n-chiu/Thesis-An-Exploratory-Case-Study-of-LLMs-for-Security-Test-Generation
本研究通过大型语言模型自动生成安全测试用例,以评估其对OWASP安全漏洞的覆盖能力。
Stars: 0 | Forks: 0
# 论文-针对安全测试生成的LLM探索性案例研究
本最终论文在约恩雪平大学工程学院计算机工程专业2026届完成。
本论文探讨了利用大型语言模型生成测试用例,特别是专注于安全测试用例,并评估生成的测试用例对OWASP 2025年十大安全类别的覆盖程度。鉴于人工智能和大型语言模型在软件开发测试用例生成工具中日益普遍,本论文研究了不同大型语言模型在生成满足相关OWASP安全漏洞的安全测试用例方面的成功程度,以及人类干预可能需要到何种程度。
# 大型语言模型
以下模型用于安全测试用例生成,且未经微调:
- OpenAI GPT-5.2
- Gemini 3.1 Pro
- Claude Sonnet 4.6
# 根据用户故事生成测试用例的提示
对每个用户故事使用模型执行以下提示。
```
Generate test cases for the following user story. Present the output as a table using the standardized test case template
with the following fields:
Test Case
Title/Scenario
Preconditions
Test Steps
Expected Results
Environment Specification
As a Software company Customer, I want the mobile client to observe the principle of "least privilege”
```
# 如何复现结果
1. 使用本代码库中提供的预定义用户故事。
2. 对于每个模型,使用上述提示模板,每个用户故事仅使用一次以生成测试用例。
标签:AI应用, AI测试生成, Claude, CVE检测, Gemini, GPT, meg, OWASP Top 10, pocsuite3, TruffleHog, 人工智能, 信息安全, 大型语言模型, 学术论文, 安全测试, 安全测试生成, 安全漏洞, 探索性案例研究, 攻击性安全, 数据管道, 毕业论文, 测试用例生成, 漏洞管理, 用户模式Hook绕过, 软件工程, 软件开发, 软件测试, 逆向工具