iremDURGUN/Synthetic-Data-Generator

GitHub: iremDURGUN/Synthetic-Data-Generator

基于Python和Faker的合成金融数据生成器,能够模拟完整的ERP业务数据关系并直接写入SQL Server,解决隐私合规场景下无法使用真实业务数据的痛点。

Stars: 0 | Forks: 0

# 合成数据生成器 # 概述 [EN] 本项目直接将合成的金融和交易数据集生成到 Enterprise Analytics SQL Server 数据库中,用于分析和测试目的。 [TR] Bu proje, analitik ve test süreçleri için doğrudan bir Kurumsal Analitik SQL Server veri tabanına sentetik finansal ve işlemsel veri setleri üretir. # 目的 [EN] 由于隐私限制,无法共享真实世界的业务数据。此工具创建模拟以下内容的真实模拟数据: * 查找表(流程代码、借方原因) * 供应商和客户(带有细分) * 发票和支付 * 总账汇总 [TR] Gerçek dünya iş verileri gizlilik kısıtlamaları nedeniyle paylaşılamamaktadır. Bu araç, aşağıdakileri taklit eden gerçekçi sahte veriler oluşturur: * Sabit Tanım Tabloları (İşlem tipleri, Borç nedenleri) * Tedarikçiler ve Müşteriler (segmentasyon özellikleri ile) * Faturalar ve Tahsilatlar/Ödemeler * Genel Defter (Mizan) toplamları # 特性 [EN] * 生成真实的土耳其人口统计和企业数据。 * 在实体之间构建逻辑的主从关系。 * 通过自动余额计算模拟基于时间的金融交易。 [TR] * Gerçekçi Türkçe demografik ve kurumsal veriler üretir. * Varlıklar arasında mantıksal ana-detay ilişkileri kurar. * Otomatik bakiye hesaplamalarıyla zamana bağlı finansal hareketleri simüle eder. # 技术栈 * Python * Faker * pyodbc * SQL Server # 数据模型 [EN] 查找定义 → 账户(供应商/客户) → 账户交易(发票/支付) → 总账 [TR] Sabit Tanımlar → Cari Hesaplar (Tedarikçi/Müşteri) → Hesap Hareketleri (Fatura/Ödeme) → Genel Defter # 运行方法 [EN] ## 创建数据库: 首先,在您的 SQL Server 环境中执行 `create_enterprise-analytics_database.sql` 脚本,以构建数据库、表和函数。 ## 安装依赖: pip install -r requirements.txt 更新脚本中的服务器和数据库变量,使其与您的 SQL Server 环境匹配。 ## 运行脚本: python mock_data.py [TR] ## 创建数据库: Öncelikle, veri tabanını, tabloları ve fonksiyonları inşa etmek için SQL Server ortamınızda `create_enterprise-analytics_database.sql` betiğini çalıştırın. ## 安装所需的库: pip install -r requirements.txt Kodun içindeki server ve database değişkenlerini kendi SQL Server ortamınıza göre güncelleyin. ## 运行代码: python mock_data.py # 输出 [EN] 直接使用合成记录填充连接的 SQL Server 表。不生成 CSV 文件;所有内容都会立即写入数据库。 [TR] Bağlanılan SQL Server tablolarını doğrudan sentetik kayıtlarla doldurur. CSV dosyası üretilmez; her şey anında veri tabanına yazılır. # 用途 [EN] 此数据集用于多个分析项目,包括: * ERP 系统模拟 * 销售和财务报告仪表板 * 数据库性能和索引测试 [TR] Bu veri seti, aşağıdakiler de dahil olmak üzere çeşitli analitik projelerinde kullanılır: * ERP sistem simülasyonları * Satış ve finansal raporlama panoları (dashboard) * Veri tabanı performans ve indeks testleri # 注意事项 [EN] 所有数据完全是合成的,仅用于演示和测试目的。与真实人物或公司的任何相似之处纯属巧合。 [TR] Tüm veriler tamamen sentetiktir ve yalnızca gösterim/test amacıyla üretilmiştir. Gerçek kişi veya kurumlarla olan herhangi bir benzerlik tamamen tesadüftür. # 自定义 [EN] 自定义说明:** 此项目中提供的数据库表结构可以根据您的需求完全自定义。您可以自由更改表名、列数据类型以及整体架构,以匹配您自己的数据库架构。如果您想从头创建数据库,可以使用代码库中提供的 `create_database.sql` 文件。 [TR] Özelleştirme Notu:** Bu projede bulunan veri tabanı tablo yapısı kendi ihtiyaçlarınıza göre tamamen şekillendirilebilir. Tablo isimlerini, veri tiplerini ve genel yapıyı kendi veri tabanı mimarinize uyacak şekilde değiştirmekte özgürsünüz. Veri tabanını sıfırdan kurmak isterseniz, repoda bulunan `create_database.sql` dosyasındaki kodları kullanabilirsiniz.
标签:ERP模拟, Faker, pyodbc, Python, SQL Server, 主从表关系, 代码示例, 假数据, 合成数据生成, 总账, 数据分析, 数据库填充, 数据脱敏, 无后门, 测试数据, 网络安全, 财务模拟, 账单与支付, 逆向工具, 金融数据, 隐私保护