syeda-sabra/Week-1-Project-Sales-Data-Analysis-Dashboard
GitHub: syeda-sabra/Week-1-Project-Sales-Data-Analysis-Dashboard
一个基于 Python 数据科学生态的销售数据分析与可视化项目,通过完整的清洗、特征工程和交互式仪表板,从全球零售数据中提取业务洞察。
Stars: 0 | Forks: 0
# 第 1 周:销售数据分析仪表板
## 项目概述
本项目专注于分析来自多个数据集的销售数据,以获取有意义的业务洞察。主要目标是执行数据清洗、转换、探索性数据分析 (EDA)、特征工程和可视化,从而了解销售业绩、盈利能力和客户行为。
该项目还包括高级可视化(例如交互式图表和地理分析),以支持数据驱动的决策制定。
## 数据集信息
- **来源:** Global Superstore Dataset & Online Retail Dataset
- **使用文件:**
- Global_Superstore2.csv
- Global_Superstore2.xlsx
- OnlineRetail.csv
- **大小:**
- df1/df2:约 34,000+ 行
- df3:约 540,000+ 行
- **主要特征:**
- Order ID, Order Date, Ship Date
- Customer ID, Customer Name
- Sales, Profit, Discount, Quantity
- Product Name, Category, Sub-Category
- Country, Region, City
- Invoice Date (df3)
## 主要发现
- 销售额与利润呈正相关,但高折扣会降低盈利能力。
- 某些地区和国家的销售额贡献显著偏高。
- 少数产品创造了大部分收入。
- 季节性模式显示了月度和季度销售额的波动情况。
- 客户细分表明,高价值客户贡献了大部分利润。
## 技术实现
- **使用库:**
- NumPy
- Pandas
- Matplotlib
- Seaborn
- Plotly
- **关键技术:**
- 数据清洗与预处理
- 处理缺失值
- 移除重复项和异常值
- 数据类型标准化
- 特征工程(利润率、基于时间的特征)
- 数据聚合与分组
- 相关性分析
- 时间序列分析
- 客户细分
- 数据可视化(静态 + 交互式)
## 如何运行
1. 克隆或下载项目文件夹
2. 打开 Jupyter Notebook 或 VS Code
3. 安装所需的库:
4. 按照以下顺序运行 notebooks:
- 数据加载与清洗
- EDA 与可视化
- 特征工程
- 业务洞察
## 结果
- 为销售和利润分析创建了交互式仪表板。
- 地理可视化识别出了表现最佳的国家。
- 时间序列分析揭示了季节性的销售模式。
- 客户细分突出了高价值的客户群体。
- 提取了用于决策制定的业务洞察。
## 经验教训
- 真实世界的数据通常包含缺失值、格式不一致和异常值。
- 适当的数据清洗能显著提高分析质量。
- 特征工程有助于揭示数据中隐藏的模式。
- 交互式可视化增强了数据叙事能力。
- 基于分组的分析能提供强有力的业务洞察。
标签:EDA, Matplotlib, NoSQL, NumPy, Plotly, Python, Seaborn, SEO, 交互式仪表盘, 利润分析, 商业智能, 商业洞察, 地理空间分析, 大数据处理, 客户细分, 客户行为分析, 异常值检测, 探索性数据分析, 数据清洗, 数据科学项目, 无后门, 时间序列分析, 特征工程, 相关性分析, 缺失值处理, 逆向工具, 销售数据分析, 零售数据集, 零售行业