ailab-hanyang/RECODE

GitHub: ailab-hanyang/RECODE

RECODE 是一个通过多智能体系统从自动驾驶软件代码中恢复需求并进行评审的工具,旨在解决需求债务问题。

Stars: 2 | Forks: 1

# RECODE:基于代码的需求恢复用于自动驾驶软件采用评审 [![状态](https://img.shields.io/badge/Status-Accepted_at_RE_2026-brightgreen)]() [![许可:CC BY 4.0](https://img.shields.io/badge/License-CC_BY_4.0-lightgrey.svg)](https://creativecommons.org/licenses/by/4.0/) ## 新闻 - **2026年5月18日** — 论文被**IEEE国际需求工程会议**(RE'26,加拿大蒙特利尔)的**工业创新轨道**接收。 ## 论文 - 🔗 DOI:_IEEE 分配后将添加_ - 🎤 会议:IEEE国际需求工程会议(RE'26),工业创新轨道 — 加拿大蒙特利尔,2026年8月17-21日 ## 概述 该流程通过将逆向需求工程任务分解为三个阶段来解决**需求债务**——缺失、过时或脱节的需求制品所累积的成本: | 阶段 | 智能体 | 输出 | |-------|--------|--------| | **特征恢复** | 特征工程师 + 特征验证者 | 经过验证的层次化特征图 | | **SRS构建** | SRS编写者 + SRS验证者 | 具有稳定REQ ID的IEEE 830结构化SRS | | **采用评审** | 汽车标准专家 + 汽车软件工程师 | 带有`[VIOLATION]`、`[CODE_LOGIC_ERROR]`和`[CONTAMINATED_REQUIREMENT]`注解的已评审SRS | ![流程架构](https://static.pigsec.cn/wp-content/uploads/repos/2026/05/369675060e093554.svg) ## 核心概念 - **I型(实现型)缺陷**:仅从代码本身即可识别的代码局部问题(例如,缺失的边界检查、未初始化的变量) - **O型(遗漏型)差距**:仅在建立预期行为后才显现的需求/安全差距(例如,缺失的超时处理、缺少安全状态转换) - **受污染的需求**:语法上格式正确但反映实现制品而非系统级期望的需求陈述 ## 评估 ### SQ1:基于变异的缺陷检测 在自动紧急制动和多目标跟踪器模块中注入36个故意制造的I型和O型变异的受控基准,通过LLM辅助的人工评估进行评价。 ### SQ2:制品质量评估 实践者评估,使用包含三个层面(需求陈述质量、文档质量、实用价值)共10个标准的结构化评分规则。 ### 比较配置 两种配置接收**相同的任务定义**(相同的LLM(Claude Sonnet 4.6)、源代码快照和六个任务描述);制品质量由实践者和LLM评估器(Claude Opus 4.6)独立评估。唯一的区别是编排方式:单智能体 vs. 多智能体分解。 | | **Mono**(单智能体) | **RECODE**(多智能体) | |---|---|---| | 编排 | 一次性完成全部六个任务 | 跨越三个阶段的六个专门智能体 | | 中间制品 | 无 | 经过验证的特征图、经过验证的SRS | | 验证 | 无 | 迭代式验证者反馈(特征验证者、SRS验证者) | | 评审视角 | 混合于单次任务中 | 独立(基于标准 + 基于实现) | ### 结果 | | Mono | RECODE | |---|---|---| | **SQ1:检测率** | 47.2% (17/36) | **83.3% (30/36)** | | > I型 | 65.0% | 95.0% | | > O型 | 25.0% | 68.8% | | **SQ2:实践者评分**(3分制) | 1.92 | **2.61** | ## 补充材料 | 材料 | 位置 | 描述 | |----------|----------|-------------| | 智能体提示 | [`prompts/`](prompts/) | 所有六个智能体的完整系统提示(RECODE多智能体提示将与相机就绪版本一同发布) | | 变异目录 | [`evaluation/SQ1_Mutation_Catalog.md`](evaluation/SQ1_Mutation_Catalog.md) | 36个基准变异(20个I型 + 16个O型),包含注入细节和ISO参考 | | 评估规则 | [`evaluation/SQ2_Evaluation_Rubric.md`](evaluation/SQ2_Evaluation_Rubric.md) | 用于制品质量评估的10项标准评分规则(等级A/B/C) | ## 引用 ``` @inproceedings{na2026recode, author = {Na, Yuseung and Park, Jeongwoo and Koo, Jahyun and Kim, Chanwoo and Heo, Seungwoo and Bong, Sechang and Choi, Junyeol and Jo, Kichun}, booktitle = {2026 IEEE 34th International Requirements Engineering Conference (RE)}, title = {{RECODE: REquirements recovery from CODE for adoption review of autonomous driving software}}, year = {2026}, volume = {}, number = {}, pages = {}, doi = {}, } ``` ## 许可 本作品采用 [知识共享署名 4.0 国际许可协议](https://creativecommons.org/licenses/by/4.0/) 进行许可。 ## 致谢 本工作部分由现代汽车公司自动驾驶系统开发团队支持,部分由韩国科学技术信息通信部(MSIT)资助的韩国国家研究基金会(NRF)在项目编号RS-2024-00421129下支持。
标签:I-type缺陷, O-type缺口, SRS构建, 云资产清单, 代码分析, 凭证管理, 变异测试, 工业软件, 数据管道, 污染需求, 特征恢复, 缺陷检测, 自动驾驶, 软件审查, 软件工程, 逆向工具, 逆向工程, 采纳审查, 需求债务, 需求工程, 需求恢复