thiagonladislau/fiscal-anomaly-detector

GitHub: thiagonladislau/fiscal-anomaly-detector

一个基于机器学习的税务异常检测项目,通过线性回归模型自动识别发票数据中的税率偏差和异常,帮助企业在审计前发现潜在的税务错误。

Stars: 0 | Forks: 0

# 税务异常检测器 一个专注于使用机器学习识别税务异常的实用项目。本项目旨在作为对 **Aurélien Géron** 所著的 **"Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow"** 一书中相关概念的实践学习。 ## 项目概述 该工具模拟了一个企业税务环境,其中发票按标准的 12% 税率开具。通过实现一个线性回归模型,系统能够“学习”税务规律,并识别偏离该规则的记录(异常情况),从而模拟错误或系统故障。 ## 技术成果 使用 `tax_data.csv` 数据集对模型进行训练后,取得了以下成果: - **模型系数:** 0.1229(AI 成功识别了约 12% 的税务规律)。 - **RMSE(均方根误差):** 6.09(模型在每张发票上的平均误差仅为 6.09 个单位)。 ## 实际示例(案例研究) 系统将 **发票 ID 956** 识别为严重异常: - **发票金额:** 14,587.22 - **实际发现税额:** 2,625.70(税率 18%) - **预期税额(AI 预测):** ~1,750.46(税率 12%) **结果:** 差异被自动标记,从而节省了时间并避免了潜在的税务处罚。 ## 路线图 - [x] 初始设置与 Git 仓库建立 - [x] 数据模拟与探索(第 2 章 - Hands-On ML) - [x] 数据清洗与 pipeline 创建 - [x] 用于异常检测的模型训练(线性回归) - [ ] 模型部署/自动化 ## 技术栈 - **Python 3.12** - **Pandas**(数据处理) - **Scikit-Learn**(机器学习) - **Matplotlib/Seaborn**(数据可视化)
标签:Apex, Hands-On ML, ICMS, Matplotlib, Python, Reinf, Scikit-Learn, Seaborn, Sped, 减少人工工作量, 异常值分析, 异常检测, 数据清洗, 数据科学, 无后门, 机器学习, 税务审计, 税收管理系统, 线性回归, 网络调试, 自动化, 财税合规, 资源验证, 逆向工具, 预测模型