safahbo/Tersine-Muhendislik-Final

GitHub: safahbo/Tersine-Muhendislik-Final

一款基于 Python 的二进制文件静态分析引擎,利用 mmap 和 Shannon 熵检测嵌入的密钥、API Token 及可疑调用。

Stars: 1 | Forks: 0

# 静态字符串提取与分类器
Istinye University
![GitHub](https://img.shields.io/badge/GitHub-Private-red?style=flat-square\&logo=github) ![Language](https://img.shields.io/badge/Language-Python-blue?style=flat-square) ![Status](https://img.shields.io/badge/Status-Completed-success?style=flat-square) ![Course](https://img.shields.io/badge/Course-BGT210-purple?style=flat-square) ![License](https://img.shields.io/badge/License-Educational-green?style=flat-square)
# 🎓 指导教师 / Danışman | 字段 | 信息 | | ------------- | ------------------------------------------------------------------ | | **Name / Ad** | Keyvan Arasteh | | **GitHub** | [@keyvanarasteh](https://github.com/keyvanarasteh) | | **Email** | [keyvan.arasteh@istinye.edu.tr](mailto:keyvan.arasteh@istinye.edu.tr) | | **LinkedIn** | [keyvanarasteh](https://www.linkedin.com/in/keyvanarasteh/) | | **Website** | https://qline.tech | # 👤 学生 / Öğrenci | 字段 | 信息 | | ------------------------------- | -------------------- | | **Name / Ad Soyad** | Safa Hacıbayramoğlu | | **Student ID / Öğrenci No** | `2420191014` | # 📚 课程信息 / Ders Bilgileri | 字段 | 信息 | | -------------------------------- | -------------------------------------------- | | **Course Name / Ders Adı** | Reverse Engineering / Tersine Mühendislik | | **Course Code / Ders Kodu** | BGT210 | | **Credits / Kredi** | 3 ECTS | | **Semester / Dönem** | 2025–2026 春季 / 2025–2026 Bahar | | **Institution / Üniversite** | [Istinye University](https://istinye.edu.tr) | # 📋 项目概述 / Proje Özeti 本项目是一个高级静态分析引擎,通过直接内存映射 (**mmap**) 的方法分析编译后的 binary 文件 (**APK, ELF, PE, DEX**)。 该系统超越了传统的基于正则表达式的字符串提取,能够: * 执行 Shannon 熵计算。 * 利用启发式 (heuristic) 方法检测加密密钥和 API token。 * 分析可疑的 API 调用。 * 提取 ASCII 和 UTF-16LE 格式的字符串。 * 对 binary 文件结构进行低级别的检查。 # 🗂 仓库结构 / Repo Yapısı ``` . ├── README.md ├── ROADMAP.md ├── Dockerfile ├── docker-compose.yml ├── .env.example ├── .gitignore ├── docs/ │ ├── assets/ │ │ └── istinye-logo.png │ ├── modules/ │ │ └── heuristic-engine.md │ ├── research/ │ │ └── research-notes.md │ └── references/ ├── reports/ │ └── final-report.md └── src/ └── main.py ``` # 🚀 快速开始 / Kurulum ``` git clone https://github.com/safahbo/Tersine-Muhendislik-Final.git cd Tersine-Muhendislik-Final python src/main.py \ -f \ -o reports/analysis.json ``` # 📊 交付成果 / Teslimler | 功能 | 状态 | | ------------------------------------------------- | ---- | | 基于 Magic Byte 的文件检测 | ✅ | | 使用 mmap 的低级内存管理 | ✅ | | 基于 Shannon 熵的启发式分析 (Heuristic) | ✅ | | 加密密钥检测 | ✅ | | API Token 检测 | ✅ | | 可疑 API 调用检测 | ✅ | | ASCII 字符串提取 | ✅ | | UTF-16LE 字符串恢复 | ✅ | | Binary 文件分类 | ✅ | # 🔬 技术能力 * Binary 字符串提取 * UTF-16LE 字符串恢复 * 基于熵的机密信息检测 * API endpoint 识别 * Magic byte 文件分类 * 内存映射文件分析 (mmap) * 静态逆向工程支持 * 基于启发式的恶意软件工件发现 # 📚 文档 / Belgeleme | 文档 | 位置 | | ------------ | ------------------------- | | 模块文档 | `docs/modules/` | | 研究笔记 | `docs/research/` | | 参考资料 | `docs/references/` | | 最终报告 | `reports/final-report.md` | # 🛠 使用的技术 * Python 3.x * mmap * re (正则表达式) * math * argparse * pathlib * JSON 序列化 # 🎯 项目目标 在本项目范围内实现了以下目标: * 对 binary 文件执行静态分析。 * 通过低级别的内存访问实现高性能的字符串提取。 * 检测敏感信息泄露。 * 开发可用于逆向工程工作的辅助工具。 * 应用基于熵的启发式分析方法。 # ⚠️ 教育目的 本项目仅出于教育和学术研究目的而开发。 如果将获得的结果用于学术测试、安全研究或取证分析过程,建议采用额外的验证机制。 此工具本身不能提供绝对的安全评估,也不能替代专业的分析过程。
**BGT210 – Reverse Engineering 期末项目** **Istinye University – 2025/2026 春季学期**
标签:ELF, Homebrew安装, PE, Python, Shannon熵, StruQ, 二进制分析, 云安全监控, 云安全运维, 云资产清单, 无后门, 机密信息提取, 请求拦截, 逆向工具, 逆向工程, 静态分析