pengwei-iie/CTISum
GitHub: pengwei-iie/CTISum
CTISum 提供了一个专门用于网络安全威胁情报自动摘要的新基准数据集及多种基线模型,旨在推动安全领域文本摘要研究的发展。
Stars: 1 | Forks: 3
# CTISum
论文《CTISum:一个新的网络安全威胁情报摘要基准数据集》(CTISum: A New Benchmark Dataset For Cyber Threat Intelligence Summarization)的新数据集和基线模型。
本仓库包含以下部分:
- 数据集文件。
- 基线模型,包括 llama2、bart 和 xxx。
- 评估指标。
## 数据集
数据集可分为三个部分。
- 一部分用于原始的 pdf 文件。
- 一部分用于网络安全威胁情报(CTI)摘要任务。
- 一部分用于攻击过程摘要(APS)任务。
下表描述了 CTISum 数据集与来自不同领域的现有摘要数据集的统计信息。

## 基线模型
- LLAMA2
- BART
- Longformer
- T5
- Transformer
- MatchSum
- BertSumExt
## 评估指标
自动和人工 A/B 评估,例如 BERTScore 和 ROUGE-𝑛 (R-𝑛) 被作为主要的评估指标,这些指标广泛用于评估摘要生成的质量。
我们在相应的文件夹中提供了:
- rouge
- bert-score
每个 .py 文件都有相应的运行命令行。
**注意:考虑到数据开放的审批流程,我们抽取了一些示例供参考,其余文件将在论文发表后发布。更多的案例分析可以在论文中查看。**
感谢您的关注。
## 贡献者
- Peng Wei
- Ding Junmei
标签:Apex, BART, BERTScore, BertSumExt, DLL 劫持, LLAMA2, LLM, Longformer, MatchSum, NLP, ROUGE, T5, Transformer, Unmanaged PE, 人工智能, 基准数据集, 基准模型, 大语言模型, 威胁情报, 开发者工具, 文本摘要, 机器学习, 模型评估, 深度学习, 用户模式Hook绕过, 网络安全, 网络安全数据集, 自动摘要, 论文复现, 逆向工具, 隐私保护