syeda-sabra/Week-1-Project-Sales-Data-Analysis-Dashboard

GitHub: syeda-sabra/Week-1-Project-Sales-Data-Analysis-Dashboard

一个基于 Python 数据科学生态的销售数据分析与可视化项目,通过完整的清洗、特征工程和交互式仪表板,从全球零售数据中提取业务洞察。

Stars: 0 | Forks: 0

# 第 1 周:销售数据分析仪表板 ## 项目概述 本项目专注于分析来自多个数据集的销售数据,以获取有意义的业务洞察。主要目标是执行数据清洗、转换、探索性数据分析 (EDA)、特征工程和可视化,从而了解销售业绩、盈利能力和客户行为。 该项目还包括高级可视化(例如交互式图表和地理分析),以支持数据驱动的决策制定。 ## 数据集信息 - **来源:** Global Superstore Dataset & Online Retail Dataset - **使用文件:** - Global_Superstore2.csv - Global_Superstore2.xlsx - OnlineRetail.csv - **大小:** - df1/df2:约 34,000+ 行 - df3:约 540,000+ 行 - **主要特征:** - Order ID, Order Date, Ship Date - Customer ID, Customer Name - Sales, Profit, Discount, Quantity - Product Name, Category, Sub-Category - Country, Region, City - Invoice Date (df3) ## 主要发现 - 销售额与利润呈正相关,但高折扣会降低盈利能力。 - 某些地区和国家的销售额贡献显著偏高。 - 少数产品创造了大部分收入。 - 季节性模式显示了月度和季度销售额的波动情况。 - 客户细分表明,高价值客户贡献了大部分利润。 ## 技术实现 - **使用库:** - NumPy - Pandas - Matplotlib - Seaborn - Plotly - **关键技术:** - 数据清洗与预处理 - 处理缺失值 - 移除重复项和异常值 - 数据类型标准化 - 特征工程(利润率、基于时间的特征) - 数据聚合与分组 - 相关性分析 - 时间序列分析 - 客户细分 - 数据可视化(静态 + 交互式) ## 如何运行 1. 克隆或下载项目文件夹 2. 打开 Jupyter Notebook 或 VS Code 3. 安装所需的库: 4. 按照以下顺序运行 notebooks: - 数据加载与清洗 - EDA 与可视化 - 特征工程 - 业务洞察 ## 结果 - 为销售和利润分析创建了交互式仪表板。 - 地理可视化识别出了表现最佳的国家。 - 时间序列分析揭示了季节性的销售模式。 - 客户细分突出了高价值的客户群体。 - 提取了用于决策制定的业务洞察。 ## 经验教训 - 真实世界的数据通常包含缺失值、格式不一致和异常值。 - 适当的数据清洗能显著提高分析质量。 - 特征工程有助于揭示数据中隐藏的模式。 - 交互式可视化增强了数据叙事能力。 - 基于分组的分析能提供强有力的业务洞察。
标签:EDA, Matplotlib, NoSQL, NumPy, Plotly, Python, Seaborn, SEO, 交互式仪表盘, 利润分析, 商业智能, 商业洞察, 地理空间分析, 大数据处理, 客户细分, 客户行为分析, 异常值检测, 探索性数据分析, 数据清洗, 数据科学项目, 无后门, 时间序列分析, 特征工程, 相关性分析, 缺失值处理, 逆向工具, 销售数据分析, 零售数据集, 零售行业