dfirvault/CSV_Splitter

GitHub: dfirvault/CSV_Splitter

一款基于 Python 终端的 CSV 文件拆分工具,支持按大小或行数切分大型文件并自动复制表头和校验数据完整性。

Stars: 0 | Forks: 0

# CSV Splitter(基于终端,按大小或行数拆分) 一款快速的、基于终端的 Python 工具,可按 **文件大小(MB)** 或 **行数** 拆分大型 CSV 文件 —— 具备自动文件大小跟踪、进度条以及拆分后的数据完整性检查功能。 ## 功能特性 - 📁 **文件选择对话框** — 无需输入完整路径 - 📦 **按大小或行数拆分** - 📊 **精确按大小拆分** — 确保没有任何文件超出您的限制 - 🔍 **数据完整性检查** — 确认所有行均被保留 - 📜 **进度条(tqdm)** 提供实时反馈 image ## 工作原理 选择您的 CSV 文件后,选择以下拆分模式: - `size` → 设置每个文件的最大大小(MB)(例如:500) - `lines` → 设置每个文件的最大行数(不含表头) 每个输出文件的命名格式如下: - yourfile_split_1.csv - yourfile_split_2.csv 拆分完成后,脚本会重新统计所有拆分文件中的总行数,并与原文件进行对比。如果有任何数据行丢失,您将会收到通知。 ## 使用方法 ``` python csv_splitter.py ``` 程序会提示您进行以下操作: - 选择您输入的 .csv 文件 - 选择输出文件夹 - 选择拆分模式:按大小(size)或按行数(lines) - 提供具体的数值(MB 或行数) ## 环境要求 Python 3.7+ tqdm(用于显示进度条) 安装依赖项: ``` pip install tqdm ``` ## 示例 将一个 611MB 的 CSV 文件拆分为多个 500MB 的部分: ``` Split by: size Max size: 500 MB Split files saved as: mydata_split_1.csv, mydata_split_2.csv ✅ All rows verified: No data lost. ``` ## 注意事项 - 输出文件会保留表头(可选) - 使用真实的字节数进行精确的文件大小跟踪 - 完全基于终端操作,并配备现代化的文件对话框(无需额外的 GUI 依赖)
标签:CSV, Python, 域名侦查, 文件分割, 无后门, 逆向工具