查看原文
其他

如何将业务问题转化为数据科学问题

晓晓 数据驱动智能
2024-09-16

机器学习、人工智能和数据科学领域面临的挑战数量和复杂程度正在显著增加。我们无法控制问题,但可以提高解决问题的能力,以找到合适的解决方案。如果您正在寻找创新的解决问题方法将业务问题转化为数据科学问题,那么数学建模就是答案。

但是,我们真的能把每个业务问题都转化为数据科学问题吗?数学建模是战略工具,它可以将任何业务问题转化为数据科学问题,以找到有效的解决方案。它突出了所有要不惜一切代价避免的错误,以消除所有可能导致代价高昂的错误或浪费资源、时间和精力的情况。

一理解数学建模

为了将这个概念分解为更简单的术语,数学建模可以被称为使用基本算术、数学公式和方法来表示和解释真实的业务问题和概念。

将业务问题转化为数据科学问题时,数学建模是一系列方程和不等式,可用作决策工具。然后,使用代数和算术定律来建立模型并求解。举个例子:

我们来考虑一个简单的盈利和亏损的情况:

收入—支出=利润(若为负则为亏损)

这个等式解释了利润和亏损的定义:利润是收入超过支出的数额,亏损是支出超过收入的数额。上面的等式解释了模型中的关系。基于这个数学模型,算术定律可以帮助推导出其他关系:

收入=利润(若为负则为亏损)+费用

费用=收入—利润(若为负则为亏损)

这只是一个简单的例子,用来解释如何使用基本算法将业务问题转化为数学建模。然而,当通过数学建模将业务问题转化为数据科学问题时,需要根据目标函数或目的使用高等数学。

例如,泰勒多项式可用于近似值。因此,企业正在分析客户随时间变化的消费模式。在这种情况下,泰勒多项式可以根据历史数据近似消费趋势,并且该模型可用于预测未来行为。因此,泰勒多项式非常适合通过数学建模解决业务问题。

另一个例子是使用马尔可夫链预测未来。马尔可夫链可用于对系统转换、客户行为、库存管理和财务建模进行建模。

二为什么在数据科学或机器学习中使用数学建模

数学建模是人工智能和数据科学从业者可以用来提取有价值的见解、优化复杂系统和预测未来趋势的实用技术之一。以下是数学建模如何通过将业务问题转化为数据科学问题来帮助解决业务问题:

有助于制定机器学习和数据科学算法

机器学习和数据科学算法的设计和开发依赖于数学原理。算法是旨在解决特定问题的数学构造。

协助建立变量之间的关系

数学模型表示和建立变量之间的关系,理解这种关系有助于建立准确的模型。

创建系统的方法从大量数据中寻找见解

它提供了一种系统的方法来捕捉数据之间的模式和关系,以帮助模型对新的、看不见的数据做出准确的预测。

简化了优化目标函数的方法

它可以帮助优化机器学习和数据科学算法并找到最小化或最大化特定目标函数的最佳解决方案。

提供一个框架来理解算法的可扩展性

当数据集大小或数据科学问题的复杂性增加时,数学模型可以提供一个框架来理解算法的可扩展性及其性能。

三 如何将实际的业务问题转化为数据科学问题

以下是将业务问题转化为数据科学问题的一些简单步骤:

理解并定义问题

将业务问题转化为数据科学问题的第一步是将模糊的实际业务问题框架化为具体问题。数据科学家面临模糊的业务问题,例如增加收入或降低客户流失率。然而,必须框架化问题并以某种方式定义它,以便可以使用数学建模来解决它。

以下是理解业务问题并将其转化为具体数据科学问题的三种方法:

●向利益相关者提出切实的问题。

●优先考虑痛点。

●从利益相关者那里获得平衡的观点。

例如,利益相关者可能想了解为什么用户访问网站但不购买任何东西。真正的问题在于提供不恰当的推荐。如果推荐不符合用户的兴趣,他们就不会与品牌互动,如果这样做,客户就会购买产品。

定义问题之后,像数据科学问题一样思考解决问题的决策是至关重要的。哪些用户会在90天内流失,或者应该提供哪些折扣来帮助他们返回并完成购买?

获得答案的最佳方式是考虑时间,例如何时向用户展示特定广告以获得最大转化。

如果我们将其应用到我们的示例中,定义的业务问题就变成:

应该给哪些用户折扣以避免在90天内流失?

(1)制定分析目标并确定解决方案的范围

现在,我们已经将业务问题转化为数据科学问题,但进一步分解以进行实际分析至关重要。提出问题有助于引导您实现目标。例如,

  1. 我们如何实时识别潜在的欺诈交易?

  2. 我们如何预测哪些员工可能在未来六个月内离开公司?

  3. 我们如何将客户分成不同的群体以开展有针对性的营销活动?

设定里程碑后,设计最小可行产品至关重要。最小可行产品将以较小的增量为利益相关者提供价值。任何数据科学项目都应计划在项目时间表内为客户提供增量价值。最小可行产品可以是分析报告、交互式Web应用程序或分析仪表板的形式。

确定目标指标对于解决数据科学问题至关重要,因为这是利益相关者的期望结果。在确定目标指标时,请确保该指标是可衡量的。此外,作为分析,所有指标的子集不应只有一组指标。使指标非技术性,以便所有利益相关者都可以轻松理解和领悟它。

(2)规划数据集和分析

将业务问题转化为数据科学问题的最后一步是规划数据集,因为数据对于解决任何数据科学问题都至关重要。确定可用于解决问题的相关数据源,如财务记录、客户反馈等。预处理数据并将其转换为适合数学建模的格式。现在,通过首先消除不合适的技术来找到适合您的分析的方法,然后选择流程,同时牢记约束。

四 数学建模在哪里发挥作用

将业务问题转化为数据科学问题需要确定使用数据和分析解决问题的关键方面。这就是数学建模发挥作用的地方。它是转换过程的关键组成部分,因为它提供了一个正式的框架来表示关系、进行预测和优化解决方案。

让我们了解实现数学建模以将业务问题转化为数据科学问题的步骤:

  1. 定义问题—第一步是明确定义您要解决的业务问题陈述。例如,假设一家制造公司面临着优化其生产资源分配以最大化利润同时最小化成本的挑战。

  2. 做出假设——现在,数学模型通常需要简化和假设,以使问题更易于管理。因此,收集质量数据并使用历史数据或机器学习技术估算不确定参数。在我们的案例中,制造公司的专业人员将假设生产以恒定的速度进行,市场需求稳定,并且资源成本在一段时间内保持不变。

  3. 定义要在模型中使用的变量。下一步是确定影响实际业务问题的关键变量。在我们的案例中,影响我们问题的变量将是生产率、原材料成本、劳动力成本和生产时间。

  4. 计算解决方案—下一步是开发一个表示变量之间关系的数学方程。然后,利用数学技术(如优化算法)来最小化或最大化目标函数。在我们的示例中,数学方程将表示总成本作为生产率和资源成本的函数。总成本将是目标函数。

  5. 评估和分析模型及其结果以验证其准确性。此步骤对于通过与历史数据或运行模拟进行比较来评估模型的有效性和可靠性至关重要。

五 通过数学建模解决业务问题时应考虑哪些参数

将业务问题转化为数据科学问题并通过数学建模解决时,需要考虑两个组成部分,即变量和系数。

变量是数学模型中可以操纵的量。它有两种类型:独立变量或输入变量和相关变量或输出变量。

  1. 输入或独立变量—输入变量是影响被建模系统的量。这些变量可以被操纵以获得所需的结果。

  2. 输出或因变量—输出变量是感兴趣的量。它们取决于独立变量。通常需要确定的是结果或目标函数。

让我们通过一个简单的例子来理解这个概念:

在制造优化模型中,因变量或目标函数是降低总生产成本、最大化生产产量,有时甚至是两者兼而有之。独立变量是生产率、原材料成本、劳动力成本和生产时间。所有独立变量都会影响因变量。

系数是代表固定值并定义变量之间关系的常数。因此,系数的值在模型内不会改变。系数会影响您正在处理的模型或系统的行为。

目的是在考虑各种约束和目标的同时,找到最大化整体目标函数的参数值组合。

如何识别实际业务问题中的参数?

以下是通过数学建模解决业务问题时识别因素的一些方法:

确定问题的关键要素。

彻底了解问题并确定在系统中发挥关键作用的关键要素和变量。例如,如果您优化供应链,潜在参数将是生产率、运输成本和库存水平。

分析过去数据的参数。

利用历史数据分析模式和趋势。例如,在财务建模中,收入、支出、利率和市场条件等参数是可能对系统产生重大影响的一些变量。

进行敏感性分析。

执行敏感性分析,其中特定参数的变化可以帮助评估整个模型的影响。

咨询业务利益相关者。

您可以咨询利益相关者或进行研究以确定实际业务问题中可能影响您的系统的标准参数。

如何建立参数之间的关系?

将业务问题转换为数据科学问题并通过数学建模解决时,最困难的部分是找到参数之间的关系。找到目标函数(因变量)和独立变量后,您将需要数学函数来查看独立变量如何导致输出最大化。它需要头脑风暴会议来开发最佳解决方案以实现所需的输出。

在将业务问题转化为数据科学或机器学习问题时,以下一些数学工具可以帮助建立参数之间的关系:

线性代数——使用线性回归根据广告趋势预测销售额。

微积分——使用基于微积分的优化方法找到最优价格,从而实现利润最大化。

微分方程——通过使用微分方程对市场动态进行建模来预测未来的股票价格。

概率与统计——分析客户满意度调查结果以推断整个基础。

图论——分析社交网络以找出最有影响力的个人和团体。

小结

数据科学是一种有效的工具,可帮助企业了解其问题并准确分析需要做什么才能实现目标。数学建模是将业务问题转化为数据科学问题的基础。它提供了一个框架来表示关系、进行预测和优化解决方案。

透明的沟通以及问题和目标的定义应该清晰,以确保数学模型能够正确反映业务动态。此外,迭代和改进也是该过程必不可少的部分,因为如果业务需要发展,数学模型可能无法提供适当的性能。


往期推荐

如何开展战略数据分析

大型集团企业数据治理实施的有效策略

如何设计更好的指标

谈谈数据交易现在最大的问题

为何数字化转型需要数据战略

2024数据治理信息质量会议笔记

一文读懂数据战略&数据管理&数据治理的关系

谈谈企业数据管理的核心内容和最佳实践

继续滑动看下一个
数据驱动智能
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存