DavemYedess/Quantium-Retail-Analytics

GitHub: DavemYedess/Quantium-Retail-Analytics

一个零售数据分析求职模拟项目，通过客户细分与统计提升测试，评估门店新布局的商业成效并输出战略建议。

Stars: 0 | Forks: 0

# Quantium 零售分析与客户洞察求职模拟欢迎来到我的作品集仓库。该项目是通过 Forage 平台完成的 **Quantium 数据分析求职模拟**。本项目复现了在 Quantium 所进行的真实数据分析工作，重点关注数据准备、客户细分、统计实验以及商业应用。 ## 📌 项目概述与背景 Quantium 是一家全球领先的数据分析公司，专注于受众生成和零售分析。在此模拟中，我担任数据分析师，负责某主要零售客户（Woolworths Group）的 **Chips 品类**业务。目标是将原始的交易和客户人口统计数据转化为关于客户购买行为以及新店铺布局设计商业有效性的战略业务建议。本项目分为三个不同的核心任务： 1. **任务 1：数据准备与客户分析** – 了解客户细分、购买驱动因素和产品偏好。 2. **任务 2：实验与提升测试** – 设计一个统计框架，以评估试验店铺布局与匹配的对照店铺相比的绩效表现。 3. **任务 3：分析与商业应用** – 将洞察综合成专业的客户演示文稿和结构化的战略函件。 ## 📂 仓库结构为了确保达到生产级数据工程和版本控制标准，本仓库的组织结构如下： ``` ├── data/ │ ├── raw/ # Raw client data (Git-ignored in production) │ │ ├── QVI_transaction_data.xlsx # Raw transaction data │ │ └── QVI_purchase_behaviour.csv # Customer loyalty profiles │ └── processed/ # Cleaned, structured, and feature-engineered datasets │ └── QVI_consolidated_data.csv # Unified dataset used for tasks 2 and 3 │ ├── notebooks/ │ ├── Quantium_Data_preparation_&_Analysis_Task_1.ipynb # Data cleaning, EDA, and segmentation │ └── Quantium_Data_preparation_&_Analysis_Task_2.ipynb # Metrics scaling, t-tests, and uplift analysis │ ├── documents/ │ ├── Quantium_presentation_Task_3.pdf # Final client slide-deck presentation │ └── Client_Executive_Brief_Mail.docx # Formal executive correspondence to Category Manager │ ├── .gitignore # Prevents uploading large data files ├── README.md # Repository documentation (This file) └── requirements.txt # Project dependencies (pandas, openpyxl, scipy, seaborn, etc.) ``` ## 🛠️ 任务详细分解 ### 任务 1：数据准备与客户分析 * **目标：** 清理原始的商业交易记录，并将其与人口统计细分相结合，以分离出核心的购买驱动因素。 * **关键步骤与方法：** * **数据清洗：** 将 Excel 的整数日期转换为标准格式。筛选并清除极端异常值（例如，特定客户档案单次购买 200 包薯片的交易）。 * **特征工程：** 从文本描述中提取 `pack_size`（克）并分离出 `Brand_Name`（例如，统一规范 *Kettle*、*Smiths*、*Thins*、*Doritos* 等品牌）。 * **探索性数据分析 (EDA)：** 评估消费分布、指标峰值以及总销售量。 * **核心战略洞察：** * 12 月全月销售额出现急剧飙升，在平安夜前夕达到最高峰，随后由于全国范围内的假日门店关闭，**12 月 25 日**的运营数据出现回落。 * **主流年轻单身人士/情侣** 在购买休闲薯片的绝对客户总数中占比最高。 * **年长家庭** 和 **年轻家庭** 在总平均交易单位规模中占据主导地位，在所有收入阶层中，每次购物篮购买的单位数量最多。 * 与其余市场相比，*主流年轻单身人士/情侣* 购买 270 克装 *Twisties Cheese* 薯片的可能性 **高出 27%**。 ### 任务 2：实验与提升测试 * **目标：** 评估在 3 个月的试营业期内（2019 年 2 月 – 2019 年 4 月），三家试点门店（**77、86 和 88**）实施新店铺设计的商业有效性。 * **关键步骤与方法：** * **对照门店匹配：** 开发了一个 Python 脚本，通过计算历史基线相关性和每月销售额及客户交易量的欧几里得距离进行评分，从而建立一致的对照基线： * **试点门店 77** $ ightarrow$ 对照门店 233 * **试点门店 86** $ ightarrow$ 对照门店 155 * **试点门店 88** $ ightarrow$ 对照门店 237 * **统计提升框架：** 在试营业前阶段，对对照门店的销售额进行缩放，以匹配试点门店的业绩趋势。进行独立的 **双样本 t检验**，以评估试营业期间的差异是否具有统计显著性（$a = 0.05$）。 * **核心战略洞察：** * **门店 77 和 86** 表现出显著的成功，在活跃的试营业月份内，总毛利润和个人客户数量均实现了统计上的显著增长。 * **门店 88** 表现出停滞或温和的业绩提升，这表明存在局部的宏观经济差异或客流弹性的不同。 ### 任务 3：分析与商业应用 * **目标：** 将技术分析结果综合为专为零售高层管理者设计的高层次业务建议。 * **交付成果：** * 一份结构化、面向客户的 11 页演示文稿，总结了方法论、数据保护合规性 (ISO27001)、细分深度挖掘以及实验产出。 * 一封发给品类经理的高管战略邮件，详细说明了关键的品类建议。 ## 📈 展示的关键技术技能 * **语言与生态系统：** Python（Pandas、NumPy、Matplotlib、Seaborn、Scipy.stats）。 * **统计方法：** 假设检验、双样本 t检验、置信区间、欧几里得距离匹配、缩放与归一化。 * **领域能力：** 零售分析、品类管理、A/B 测试实验、消费者细分、数据匿名化与治理。 ## 🚀 如何运行此分析 1. 克隆仓库：`git clone https://github.com/yourusername/Quantium-Retail-Analytics.git` 2. 安装必要的依赖项：`pip install -r requirements.txt` 3. 在 `notebooks/` 目录下按顺序执行 Jupyter notebooks，以重现数据清理和统计测试的可视化图表。 *免责声明：数据及项目简介由 Quantium Group Pty Ltd 作为 Forage 数据分析求职模拟的一部分提供。*

标签：A/B测试, NoSQL, 代码示例, 客户分群, 数据分析, 逆向工具, 零售分析