safahbo/Tersine-Muhendislik-Final
GitHub: safahbo/Tersine-Muhendislik-Final
一款基于 Python 的二进制文件静态分析引擎,利用 mmap 和 Shannon 熵检测嵌入的密钥、API Token 及可疑调用。
Stars: 1 | Forks: 0
# 静态字符串提取与分类器
    
# 🎓 指导教师 / Danışman
| 字段 | 信息 |
| ------------- | ------------------------------------------------------------------ |
| **Name / Ad** | Keyvan Arasteh |
| **GitHub** | [@keyvanarasteh](https://github.com/keyvanarasteh) |
| **Email** | [keyvan.arasteh@istinye.edu.tr](mailto:keyvan.arasteh@istinye.edu.tr) |
| **LinkedIn** | [keyvanarasteh](https://www.linkedin.com/in/keyvanarasteh/) |
| **Website** | https://qline.tech |
# 👤 学生 / Öğrenci
| 字段 | 信息 |
| ------------------------------- | -------------------- |
| **Name / Ad Soyad** | Safa Hacıbayramoğlu |
| **Student ID / Öğrenci No** | `2420191014` |
# 📚 课程信息 / Ders Bilgileri
| 字段 | 信息 |
| -------------------------------- | -------------------------------------------- |
| **Course Name / Ders Adı** | Reverse Engineering / Tersine Mühendislik |
| **Course Code / Ders Kodu** | BGT210 |
| **Credits / Kredi** | 3 ECTS |
| **Semester / Dönem** | 2025–2026 春季 / 2025–2026 Bahar |
| **Institution / Üniversite** | [Istinye University](https://istinye.edu.tr) |
# 📋 项目概述 / Proje Özeti
本项目是一个高级静态分析引擎,通过直接内存映射 (**mmap**) 的方法分析编译后的 binary 文件 (**APK, ELF, PE, DEX**)。
该系统超越了传统的基于正则表达式的字符串提取,能够:
* 执行 Shannon 熵计算。
* 利用启发式 (heuristic) 方法检测加密密钥和 API token。
* 分析可疑的 API 调用。
* 提取 ASCII 和 UTF-16LE 格式的字符串。
* 对 binary 文件结构进行低级别的检查。
# 🗂 仓库结构 / Repo Yapısı
```
.
├── README.md
├── ROADMAP.md
├── Dockerfile
├── docker-compose.yml
├── .env.example
├── .gitignore
├── docs/
│ ├── assets/
│ │ └── istinye-logo.png
│ ├── modules/
│ │ └── heuristic-engine.md
│ ├── research/
│ │ └── research-notes.md
│ └── references/
├── reports/
│ └── final-report.md
└── src/
└── main.py
```
# 🚀 快速开始 / Kurulum
```
git clone https://github.com/safahbo/Tersine-Muhendislik-Final.git
cd Tersine-Muhendislik-Final
python src/main.py \
-f \
-o reports/analysis.json
```
# 📊 交付成果 / Teslimler
| 功能 | 状态 |
| ------------------------------------------------- | ---- |
| 基于 Magic Byte 的文件检测 | ✅ |
| 使用 mmap 的低级内存管理 | ✅ |
| 基于 Shannon 熵的启发式分析 (Heuristic) | ✅ |
| 加密密钥检测 | ✅ |
| API Token 检测 | ✅ |
| 可疑 API 调用检测 | ✅ |
| ASCII 字符串提取 | ✅ |
| UTF-16LE 字符串恢复 | ✅ |
| Binary 文件分类 | ✅ |
# 🔬 技术能力
* Binary 字符串提取
* UTF-16LE 字符串恢复
* 基于熵的机密信息检测
* API endpoint 识别
* Magic byte 文件分类
* 内存映射文件分析 (mmap)
* 静态逆向工程支持
* 基于启发式的恶意软件工件发现
# 📚 文档 / Belgeleme
| 文档 | 位置 |
| ------------ | ------------------------- |
| 模块文档 | `docs/modules/` |
| 研究笔记 | `docs/research/` |
| 参考资料 | `docs/references/` |
| 最终报告 | `reports/final-report.md` |
# 🛠 使用的技术
* Python 3.x
* mmap
* re (正则表达式)
* math
* argparse
* pathlib
* JSON 序列化
# 🎯 项目目标
在本项目范围内实现了以下目标:
* 对 binary 文件执行静态分析。
* 通过低级别的内存访问实现高性能的字符串提取。
* 检测敏感信息泄露。
* 开发可用于逆向工程工作的辅助工具。
* 应用基于熵的启发式分析方法。
# ⚠️ 教育目的
本项目仅出于教育和学术研究目的而开发。
如果将获得的结果用于学术测试、安全研究或取证分析过程,建议采用额外的验证机制。
此工具本身不能提供绝对的安全评估,也不能替代专业的分析过程。
    
**BGT210 – Reverse Engineering 期末项目**
**Istinye University – 2025/2026 春季学期**
标签:ELF, Homebrew安装, PE, Python, Shannon熵, StruQ, 二进制分析, 云安全监控, 云安全运维, 云资产清单, 无后门, 机密信息提取, 请求拦截, 逆向工具, 逆向工程, 静态分析