thiagonladislau/fiscal-anomaly-detector
GitHub: thiagonladislau/fiscal-anomaly-detector
一个基于机器学习的税务异常检测项目,通过线性回归模型自动识别发票数据中的税率偏差和异常,帮助企业在审计前发现潜在的税务错误。
Stars: 0 | Forks: 0
# 税务异常检测器
一个专注于使用机器学习识别税务异常的实用项目。本项目旨在作为对 **Aurélien Géron** 所著的 **"Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow"** 一书中相关概念的实践学习。
## 项目概述
该工具模拟了一个企业税务环境,其中发票按标准的 12% 税率开具。通过实现一个线性回归模型,系统能够“学习”税务规律,并识别偏离该规则的记录(异常情况),从而模拟错误或系统故障。
## 技术成果
使用 `tax_data.csv` 数据集对模型进行训练后,取得了以下成果:
- **模型系数:** 0.1229(AI 成功识别了约 12% 的税务规律)。
- **RMSE(均方根误差):** 6.09(模型在每张发票上的平均误差仅为 6.09 个单位)。
## 实际示例(案例研究)
系统将 **发票 ID 956** 识别为严重异常:
- **发票金额:** 14,587.22
- **实际发现税额:** 2,625.70(税率 18%)
- **预期税额(AI 预测):** ~1,750.46(税率 12%)
**结果:** 差异被自动标记,从而节省了时间并避免了潜在的税务处罚。
## 路线图
- [x] 初始设置与 Git 仓库建立
- [x] 数据模拟与探索(第 2 章 - Hands-On ML)
- [x] 数据清洗与 pipeline 创建
- [x] 用于异常检测的模型训练(线性回归)
- [ ] 模型部署/自动化
## 技术栈
- **Python 3.12**
- **Pandas**(数据处理)
- **Scikit-Learn**(机器学习)
- **Matplotlib/Seaborn**(数据可视化)
标签:Apex, Hands-On ML, ICMS, Matplotlib, Python, Reinf, Scikit-Learn, Seaborn, Sped, 减少人工工作量, 异常值分析, 异常检测, 数据清洗, 数据科学, 无后门, 机器学习, 税务审计, 税收管理系统, 线性回归, 网络调试, 自动化, 财税合规, 资源验证, 逆向工具, 预测模型