dfirvault/CSV_Splitter
GitHub: dfirvault/CSV_Splitter
一款基于 Python 终端的 CSV 文件拆分工具,支持按大小或行数切分大型文件并自动复制表头和校验数据完整性。
Stars: 0 | Forks: 0
# CSV Splitter(基于终端,按大小或行数拆分)
一款快速的、基于终端的 Python 工具,可按 **文件大小(MB)** 或 **行数** 拆分大型 CSV 文件 —— 具备自动文件大小跟踪、进度条以及拆分后的数据完整性检查功能。
## 功能特性
- 📁 **文件选择对话框** — 无需输入完整路径
- 📦 **按大小或行数拆分**
- 📊 **精确按大小拆分** — 确保没有任何文件超出您的限制
- 🔍 **数据完整性检查** — 确认所有行均被保留
- 📜 **进度条(tqdm)** 提供实时反馈
## 工作原理
选择您的 CSV 文件后,选择以下拆分模式:
- `size` → 设置每个文件的最大大小(MB)(例如:500)
- `lines` → 设置每个文件的最大行数(不含表头)
每个输出文件的命名格式如下:
- yourfile_split_1.csv
- yourfile_split_2.csv
拆分完成后,脚本会重新统计所有拆分文件中的总行数,并与原文件进行对比。如果有任何数据行丢失,您将会收到通知。
## 使用方法
```
python csv_splitter.py
```
程序会提示您进行以下操作:
- 选择您输入的 .csv 文件
- 选择输出文件夹
- 选择拆分模式:按大小(size)或按行数(lines)
- 提供具体的数值(MB 或行数)
## 环境要求
Python 3.7+
tqdm(用于显示进度条)
安装依赖项:
```
pip install tqdm
```
## 示例
将一个 611MB 的 CSV 文件拆分为多个 500MB 的部分:
```
Split by: size
Max size: 500 MB
Split files saved as: mydata_split_1.csv, mydata_split_2.csv
✅ All rows verified: No data lost.
```
## 注意事项
- 输出文件会保留表头(可选)
- 使用真实的字节数进行精确的文件大小跟踪
- 完全基于终端操作,并配备现代化的文件对话框(无需额外的 GUI 依赖)
标签:CSV, Python, 域名侦查, 文件分割, 无后门, 逆向工具