自古套路得人心,大数据与BI坑爹报告
11641
2019-11-21 09:48
文章摘要:高数字,低质量。

来源:Felix张飞逸

2019年的双十一似乎也与往日没啥不同,依然是商家们的不眠,我辈们的剁手,天猫、京东们成片的交易单数量繁如夏夜星空,而火热的交易额亦灿如秋日红叶。

这时,应该会有人跳出来,说这是多么亮眼的“大数据”,有了这些数据,电商们将能够精确地知晓我们生活习惯的方方面面,并进而研究出最先进的算法,这之后便是我们熟悉的什么“云计算”、“区块链”、“人工智能”、“机器学习”甚至是“贝叶斯”这样难懂的词,实在是让我们的空气变得快活。

自古套路得人心,大数据与BI坑爹报告

图片来源:网络

不过,你信吗?时至今日,似乎数据的参考价值仍大于实际应用价值,被捧上天的“大数据”看似完美无缺,但实际上里面套路遍地排排坐,一不小心躺成盒。这里便有一篇来自外文科技媒体 Bitnews Today 的文章:

https://bitnewstoday.com/news/big-data-and-bi-failure-reports

在其中作者Yuri Pakhomov针对如今流行的大数据以及商业智能(BI)指出了其中的几点问题,我们不妨来一看。(以下为个人翻译)

9月,莫斯科主办了大数据与商业智能日会议,旨在讨论大数据和商业智能技术在商业和公共管理中的应用情况。5-7年前,这样的会议就像是庆功会。而如今,却变成了诉苦大会。大家似乎达成了共识:要掌握新技术的可能性,失败的经验可能比成功的经验更有价值。

挖矿与物联网

邮件服务商Mail.ru Cloud Solution发现了最大也让人最意外的问题:在他们向客户提供的免费服务中,有60%的流量被用来进行比特币挖矿。因此,公司专家不得不创建和设置特殊的过滤器来中断这些“伪”流量。

数据还有另外一个常见应用场景:物联网,这类服务总是承诺并提供精准农业、智能家居、智能城市和机器人产业等。然而,那些构成物联网基础的传感器,往往会给出不准确的数据,这是当今工业物联网发展中面临的最严重问题之一。所以,面对BI工具时,我们应该对成功案例持更批判的态度:在一家公司成功的并不意味着在另一家公司成功,不同的员工、不同的业务类型和不同的IT环境这些都是变数。

自古套路得人心,大数据与BI坑爹报告

图片来源:Pixabay

风险管理与沟通问题

那么风险管理呢?事实证明,尽管我们开发了更多的程序和软件,但目前,风险管理更像是一个神话,而不是真正的落地实践。这其中一个原因是,决定引入特定风险管理工具的决策人往往不熟悉数学和度量理论的基础。他们很少问这样一个问题:风险事件发生的概率结论出自哪里?它有多可靠?而这也只是可能出现的问题的一个例子,还有很多问题需要解决。

分析师们还讨论了虚假相关性( false correlations)的问题。在使用大数据的方法时,我们可以发现:城市中自杀的概率与奶酪的销售有明显的相关,以及大学授予博士学位也与酸奶销售相关。然而,这些错误关联的原因以及如何识别它们并将它们排除在业务分析的结论之外仍然没有得以发现。

沟通问题也是最热门的问题之一: CEO们长长会求助于分析部门,却无法清楚地提出自己的问题。如何处理“内部客户(即公司员工)”感到但无法表达的痛苦? 如何将他们模糊的愿望转化为明确的任务?当公司各部门对大数据分析的需求都将激增时,如何解决这个问题?

自古套路得人心,大数据与BI坑爹报告

图片来源:Pixabay

最大的痛点

为什么企业不能从大数据中受益? 这是如今数据处理平台的方案常常让企业产生的疑问。

今天的一套数据或BI方案实施过程大致如下:

一个平台被选中(它有一定能力或不能使用某些指标),

然后企业选择数据或BI软件,

这时,问题出现了,明确且精准的业务任务表述应该由使用大数据工具来解决。

而企业常识却使得他们采取相反的步骤:从业务任务倒推指标,然后再到处理工具,最后再到选择可以部署这些工具的平台。

此外,媒体与出版物围绕与“大数据”、“BI”、“人工智能”和“机器学习”等词汇的夸张描述,也是有待解决的问题之一。讨论表明,对这些词汇连会议的参与者都没有一致的理解,要知道正是他们亲手“制造”出了大数据、BI、AI和ML。

自古套路得人心,大数据与BI坑爹报告

图片来源:网络


版权声明:

凡本网内容请注明来源:T媒体(http://www.cniteyes.com)”的所有原创作品,版权均属于易信视界(北京)信息科技有限公司所有,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,易信视界(北京)信息科技有限公司将追究其相关法律责任。

评论