PitziLabs/reference-checker
GitHub: PitziLabs/reference-checker
针对学术参考文献的取证完整性审计工具,利用Claude与实时搜索识别并分级引用伪造风险。
Stars: 0 | Forks: 0
# 取证参考完整性审计员
一个针对学术参考文献列表的提示工程深度扫描验证系统。为护理与健康科学出版领域的责任编辑设计,用于在论文发表前捕捉伪造、操纵和可疑的引用。
## 问题
学术参考文献列表是信任的载体。论文工厂、AI生成的引用以及日益复杂的元数据操纵意味着,一个引用可能在格式上看起来完全正确,但实际上完全是虚构的——或者更糟糕的是,由真实元素拼接而成以规避常规验证。
现有工具只解决了问题的部分方面:
| 工具 | 功能 | 遗漏 |
|---|---|---|
| **Edifix** | 格式校正、DOI查询 | 无对抗性验证 |
| **Scite.ai** | 引用上下文分析 | 无法检测虚构的元数据 |
| **iThenticate** | 文本相似性/抄袭检测 | 忽略参考文献列表完整性 |
| **Papermill Alarm** | 论文工厂模式检测 | 启发式范围狭窄 |
| **RefChecker** | 基础DOI/元数据验证 | 无取证深度 |
没有一种工具能同时在多个启发式维度上进行对抗性取证验证。这就是本工具的作用。
## 工作原理
审计员作为一条结构化的提示在Anthropic的Claude(Opus)上运行,启用实时网络搜索以验证每条引用:
- **Crossref** — DOI解析、元数据匹配、撤稿状态
- **PubMed / PMC** — 生物医学引用验证
- **Retraction Watch** — 已知撤稿和关注表达数据库
- **出版商网站** — 直接验证期刊档案
### 取证启发式(v3)
每条引用根据七个取证启发式进行评估,以捕捉逐步复杂的伪造行为:
| # | 启发式 | 捕捉内容 |
|---|---|---|
| 1 | **DOI解析** | 无效DOI、指向错误论文的DOI、虚构的DOI模式 |
| 2 | **同形异义检测** | 标题、作者名或期刊名中的Unicode替换(如西里尔字符),用于规避字符串匹配 |
| 3 | **数字换位分析** | 卷、期、页码的错位排列,使真实引用无法查找到 |
| 4 | **作者变动** | 与实际出版物记录相比,微妙地重新排列、增加或移除作者 |
| 5 | **双重真实陷阱** | 真实DOI + 来自不同论文的真实元数据,构成可通过表面检查的合成引用 |
| 6 | **期刊变异** | 期刊标题的轻微改动(词语替换、缩写操纵),指向不存在或不同的期刊 |
| 7 | **影子论文签名** | 元数据看似合理但与任何已知出版物都不匹配的引用——完全虚构但构造得看似合法 |
### 风险分级
每条引用被赋予四个风险等级之一:
| 等级 | 标签 | 含义 |
|---|---|---|
| **H** | 高 | 存在伪造或操纵的强证据。建议拒绝或询问作者。 |
| **E** | 升高 | 检测到多个异常。需人工验证后方可接受。 |
| **M** | 中等 | 轻微异常或验证不完整。标记以供编辑注意。 |
| **D** | 可辩护 | 已验证或与已知出版记录一致。无须操作。 |
### 评分公式
```
Reference List Score = 100 − (H × 12) − (E × 5) − (M × 2) − (D × 3)
```
该权重机制对伪造行为施加重罚,同时避免对灰色文献(政府报告、组织白皮书、URL等)过度惩罚——这些文献合法地缺乏DOI。
## 输出
审计员生成一个自包含的HTML报告,包含六个部分,专为编辑决策设计:
1. **执行仪表盘** — 置信度量表(0–100)、风险等级热图、摘要统计卡片。编辑一眼即可判断是否需要担忧。
2. **取证审计表** — 每条引用的发现结果,包含启发式标记、验证来源及风险等级分配。
3. **可疑性排序指数** — 按风险严重性排序的引用。最高风险引用优先显示。
4. **清理后的APA参考文献列表** — 所有已验证引用的格式修正(APA第7版)。
5. **PRISMA风格流程图** — 引用通过验证流程的可视化表示(已验证、已标记、无法解析、灰色文献)。
6. **取证附录** — 方法论文档、启发式定义及评分说明。支持编辑审计跟踪并符合COPE规范。
## 使用方法
### 要求
- Anthropic Claude(推荐使用Opus以获得高质量的法医解释)
- 启用网络搜索(审计员执行实时外部来源验证)
### 执行审计
1. 将提示(参见 `prompts/v3-auditor.md`)提供给Claude并启用网络搜索。
2. 粘贴或上传待审计的参考文献列表。
3. 审计员将系统化地验证每条引用并生成HTML报告。
### 输入格式
审计员接受以下格式的参考文献列表:
- 原始文本(粘贴的APA格式引用)
- 从手稿PDF或Word文档中提取的内容
- 混合格式(审计员将在处理过程中进行标准化)
## 测试
系统已针对以下内容进行验证:
### 对抗性测试集
精心构建的30条引用列表,包含多层陷阱:
- 同形异义替换(期刊标题中的西里尔字符)
- 作者变动的引用(真实论文但作者列表被操纵)
- 影子论文(完全虚构但听起来合理的引用)
- 双重真实合成(真实DOI + 来自不同论文的元数据)
- 流行文化垃圾引用(包括虚构的欧比旺·克诺比出版物)
- 贯穿始终的清洁引用,用于测试误报率
### 真实已发表论文
来自JOGNN、MCN及相关护理期刊的多篇真实文章,验证审计员能正确将合法引用分类为“可辩护”,而不过度标记。
## 路线图
### v4 启发式(规划中)
- **批量模式检测** — 对多个提交进行统计分析,以识别协同伪造活动
- **Crossref撤稿API集成** — 直接进行程序化撤稿检查
- **掠夺性期刊标记** — 采用Cabells风格方法识别掠夺性或可疑期刊
- **时间不可能性检查** — 发表于期刊存在之前或提交之后的引用
- **隐藏引用检测** — 出现在列表中但在手稿正文中从未引用的引用
- **COPE流程图对齐** — 与出版伦理委员会调查程序一致的结构化建议输出
### 架构(规划中)
为在编辑规模上实现成本优化,将流程分解到不同模型层级:
| 阶段 | 模型 | 角色 |
|---|---|---|
| 法医解释 | Opus | 决策判断、模糊案例、对抗性推理 |
| 程序验证 | Sonnet | DOI解析、元数据匹配、系统化检查 |
| 格式化与输出 | Haiku | APA校正、HTML报告生成、结构化输出 |
## 项目背景
本项目源于真实的编辑工作流程需求。我曾与几家领先护理期刊的编辑交谈。他们明确表示:这些期刊面临与所有学术出版相同的引用完整性威胁,并因AI生成内容的快速增长和论文工厂的复杂化而加剧。
该工具旨在融入责任编辑的实际工作流程:接收手稿,运行参考文献列表审计,生成支持编辑决策的报告。它不是研究工具,而是编辑操作工具。
## 开发方法论
本项目采用**从指令到声明式促进**作为核心开发方法:
1. **探索性运行** — 执行提示,观察Claude的输出,优化原始输出。
2. **识别有效部分** — 命名成功的特定行为、启发式和输出模式。
3. **规范化为规范** — 将成功行为写入提示,作为任何Claude实例都能重现的声明式指令。
这类似于从手工调优的已知良好状态编写配置管理(Puppet、Ansible):先让系统手工运行,然后捕获该状态作为代码。
在经过测试之前,不会向规范添加任何内容。提示本身就是工件。
## 仓库结构
```
├── README.md
├── prompts/
│ └── v3-auditor.md # Current production prompt
├── test-sets/
│ ├── adversarial-30.md # Adversarial reference list with layered traps
│ └── real-articles/ # Real article reference lists used for validation
├── reports/ # Sample output reports
├── docs/
│ ├── heuristics.md # Detailed heuristic documentation
│ ├── competitive-landscape.md
│ └── architecture.md # Pipeline decomposition design
└── roadmap/
└── v4-features.md # Planned enhancements
```
## 许可证
MIT许可证 — 参见 [LICENSE](LICENSE)。
## 致谢
由Chris Pitzi构建——从基础设施专业人士转型为提示工程师。将30年生产运营经验应用于让AI执行有用、可验证、对抗性的工作。与[Claude](https://claude.ai)(Anthropic)共同开发。
标签:Anthropic, CIS基准, Claude, Crossref, CVE检测, DOI解析, PMC, PubMed, Retraction Watch, 伪造检测, 元数据验证, 出版管理, 参考文献核查, 学术出版, 引用完整性, 查重审计, 深度验证, 生物医学出版, 编辑工具, 网络搜索验证, 论文真实性, 跨库检索