Python 采购分析项目

2024 年 8 月 29 日 | 阅读 6 分钟

引言

在本文中,我们将讨论使用 Python 进行采购分析项目。作为一家中型零售店的店长,您在 ERP 中设置补货数量。当每个 SKU 的库存水平低于某个阈值时,您的 ERP 会向供应商发送一份自动采购订单 (PO)。您需要平衡库存容量、运输成本和库存成本的限制,以确定正确的采购订单数量。

作为数据科学家,如果您希望利用数据对公司产生影响,为大规模运营做出贡献,并看到您的模型用于实施具体的解决方案:供应链是您开启数据科学之旅的最佳选择。

我已在供应链领域工作超过七年,专注于仓储和运输运营。作为一名供应链解决方案设计师,我将客户的需求转化为实际运营(零售、电子商务、奢侈品、快速消费品、汽车),进行再工程研究以改进仓库运营并优化运输网络。所有这些项目的共同点是我利用数据技术工具,使我对商品流有了可视性,能够模拟数千种场景,并构建模型来预测未来。

我在这篇文章中分享了 11 个(编辑:我增加了额外的例子)重要的案例研究,可以通过以下独特的教程应用于您的运营。对于每个示例,我分享了带有虚拟数据的源代码,以便您可以将模型调整到您自己的项目中。

1. 供应商通过 EDI 连接(与您的 ERP)接收您的订单,并使用第三方运输公司以您的成本进行运输

注意:本文中我们不考虑任何交货时间

60 个活跃库存单位 (SKU),具有采购价格(美元/箱)和年销售量(箱/年)

使用第三方公司进行运输,该公司运营包裹运输,按箱计费(美元/箱)

存储位置(商店备货区),货架容量为 480 箱。

数据分析项目的优势

为了获得一份工作,您应该做数据分析项目,因为它们向招聘经理展示您对该职位的适合性。该领域的专业人员必须精通多种技能,包括 Postgresql、R 和 Python 等脚本语言、数据清理和数据可视化。您可以通过数据分析项目展示您对这些技能的掌握。此外,个人项目是分析各种数据分析程序的绝佳机会,特别是如果学生需要更多实践经验。

如何在数据分析中展示您的项目?

一个有效的数据分析作品集展示了您的能力。每个项目都需要解释您创建的基于云的平台或模型的优点。描述您面临的技术问题以及如何有效地解决它,您使用的设备以及原因,以及您如何通过精心选择的图片得出结论。

您必须在作品集中包含大量项目,例如探索性研究、数据清理、SQL 和数据可视化。将您的作品导入 GitHub 将有助于您改进它们。如果您使用 Tableau 可视化数据,请将您的应用程序设置为“公开”,以便潜在雇主可以在线找到它。

什么是供应链分析?

使用 Python 进行数据分析,通过在战略和运营层面实现数据驱动的诊断和决策来提高运营绩效。供应链可以定义为为满足客户请求而改变物料、信息或货币流动的多个事件。由于数据扮演着重要角色,供应链分析已成为组织从与成本链中所有流程相关的数据中获取洞察力的方法和工具。在本文中,您将了解不同类型的 Python 供应链分析,并理解它们对端到端运营效率的影响,以便您可以开始您的项目。

Python 中的一些项目构想

1. Reddit

Reddit 拥有大量可用数据,包括对帖子和评论以及用户信息的简单分析,包括与每个帖子的互动,因此成为网络浏览的热门资源。Twitter 允许您从子版块中提取特定主题的帖子。Python PRAW 包允许您使用 Reddit API 抓取选定的子版块。然后,您可以同时从一个或多个讨论论坛收集数据。Reddit 数据集可在 Data 中找到。

如果您不想擦除数据,请访问全世界。

2. 麦当劳营养事实

由于钠和脂肪含量高,麦当劳的餐食产品经常引起争议。您可以使用此 Kaggle 数据集对每个菜单项目进行营养分析,包括沙拉、饮料和蛋糕。Python 必须首先导入事实来源。随后,根据糖和纤维含量等特征对事物进行分类。之后,您可以使用热图、散点图以及条形图和饼图来建模结果。您将需要 Python 脚本、Pandas 和记录对象库来完成此挑战。

3. 全球自杀率

有几个关于自杀率的数据集,但 Siddarth Sudhakar 的数据集包含来自世界卫生组织、国际货币基金组织、Kaggle 和 UNDP 的信息。使用 Python 导入数据并使用 Pandas 模块进行探索。然后,您可以概括数据的特征。例如,您可以查看人均 GDP 与自杀率之间的关系。

4. 数据可视化

数据中的趋势、异常和离群值通过可视化传达。如果您是该行业的新手并正在寻找描述性统计项目,那么创建可视化是一个很好的起点。选择最适合您要讲述的故事的图表。直方图和折线图可以有效地显示随时间的变化。

5. 观众的 Google 评论

Google 评论是客户反馈的绝佳来源,也是一项统计分析任务。您可以使用 Google Plus 商业 API 检索位置信息和评论。数据迷 Alexandr Bhole 在 Medium 上的这个项目中,利用 Python 对 Google Play 商店的客户评论进行了情感分析。然后,她使用 Panda 的分析对数据进行了探索性分析,以发现变量、交互、关系和缺失值。随后,通过 TextBlob 根据语义事实和主观性确定了情感分数。

6. 语言识别

DeepSpeech 是一个使用 Google TensorFlow 的透明语音转文本引擎。一个识别口语并将其转换为文本的程序。下载一个 Python 语音合成包,如 Apiai、SpeechRecognition 或 Anderson。

7. Netflix 的个性化

创建一个利用基于项目的协同过滤的规则集,该过滤根据用户排名生成商品之间的相似性,以设计一个受 Netflix 启发的推荐引擎。该项目根据旅行、演员、情境、语言和年份(按发布)以及其他因素,为 IMDB 评论建立了过滤能力。您可以下载公开可访问的 IMDb 数据子集来创建自己的数据集。使用小工具获取知识和人工智能来推动 Netflix 的推荐引擎与 Amazon 的非常相似。该公司根据用户的观看记录、搜索历史、评分历史、时间、日期和设备类型来预测应该向用户推荐什么。根据数据,Netflix 在 2014 年采用了 76,897 种“所有类型”或原创策略,以确定要向观众推荐哪些电影和电视节目,从而定制他们的体验并让他们不断回来。此外,该公司利用消费者数据为每个用户设计特定的网页。它显示它认为最能激发用户兴趣并提高他们整体平台使用的内容。

后续步骤

我们将在这里看到,我们的解决方案主要受运输成本驱动,因为我们有 356 箱的满库存。

在下一篇文章中,我们将进行探索性数据分析,以了解我们选择变量的分布,并理解每个参考的结果是由什么驱动的。

我们还将尝试理解从非连续决策变量到整数决策变量的转换的影响。

最终,我们将尝试几种情况,看看模型如何反应

  1. 高租金成本和低运输费用
  2. 非线性采购成本
  3. 更高的最小订购量

结论

在本文中,我们将讨论使用 Python 进行采购分析项目。您需要平衡库存容量、运输成本和库存成本的限制,以确定正确的采购订单数量。