您当前的位置:首页 > 互联网百科 > 大数据

还有人在质疑数据挖掘是泡沫吗?千万不要叶公好龙

时间:2020-07-14 09:27:34  来源:  作者:

 

数据挖掘会饱和吗?学大数据还有机会吗?这是很多计算机专业的学生,编程和算法技术员考虑的问题。

数据挖掘不是独立市场,而是解决各领域问题的方法和工具,生物、制造、零售、金融等等领域都越来越依仗对数据的利用和挖掘,数据挖掘所面对的市场是很多行业的市场。

还有人在质疑数据挖掘是泡沫吗?千万不要叶公好龙

 

要说数据挖掘应用饱和,除非各个领域都已经发展到了瓶颈没有上升空间,而这是不可能的。要说数据挖掘人才饱和,数据科学家/分析师已经成为各企业的标配,现在看离这个标准还差得远呢。

但也不得不说现在数据挖掘发展情况没有很理想,这也和数据挖掘人才不足有一定关系。

数据挖掘是泡沫吗?你说它是泡沫,那它却有一些如智能推荐、风险捕捉等高价值场景你不能视而不见吧。但你若说它不是泡沫,却有太多的灌水论文是关于它的,这些论文只有作者自己写很嗨,等拿到生产环节中一试,这什么XX玩意儿。

说到应用,除了那几个经典的场景外,身边没有什么实实在在的、落地的案例,这样的应用量级与它在舆论中的地位比起来,可以说是有些丢人。这好比一个隐居的大名士,大家都说这人厉害,不出山都是一种损失,终于他在一众追捧之中出山之后,却发现这人只能做个县令。

还有人在质疑数据挖掘是泡沫吗?千万不要叶公好龙

 

我的看法,数据挖掘不是泡沫。

第一,它背后是数据库技术,是统计学,这些都是硬的不能再硬的知识。它的核心是对数据进行深度的计算,让数据展示其潜在的信息,这一处理过程就是使用数学、统计学方法对数据进行计算,数据经过这样的加工之后,确实会展示出其隐藏的一面,所以他的本质并不泡沫。

第二、有很多人使用这样的方法来帮助自己工作,这是从上个世纪就有的,今天依然很多,数据挖掘这样的技术确实帮他们解决了问题,带来了价值。还有,我也是相信高校一定看的比我要远的多的。

那么,如果数据挖掘不是泡沫,是什么原因造成了当前这种模糊的状态呢?

还有人在质疑数据挖掘是泡沫吗?千万不要叶公好龙

 

第一、人才缺失

这一条应该很多人不服,一板砖拍到程序员堆里都要有两个是做数据挖掘的,怎么还会缺人呢,甚至知乎中已经有“做数据挖掘/机器学习的人是不是饱和了”这样的问题。我们需要更细一层的分析,数据挖掘的人才可以分成三类:

  • 第一类是研究型,研究算法做本质上突破的人,这类人在任何时候都是紧缺的,当然大部分人都不属于这一类人才。
  • 第二类是应用型,能够跨领域将数据挖掘技术应用到自己所在领域的人。对算法内部原理不需要很懂,技术上只需要知道怎样应用就够了,重要的是能够熟悉某一业务领域,并且能够针对业务领域的问题提出解决方案,使用数据挖掘技术来解决。这一类人才是目前最为紧缺的,数据挖掘应用现在很少,主要是由于这一类人才的缺少。
  • 第三类是数据挖掘技术使用人群,有学生、有程序员,会用数据挖掘技术解决手头的问题,但是对算法没有深入的研究,也没有将数据挖掘落地到生产的能力。

所以,现在依然是缺少人才的,尤其是应用型人才。

第二、网络或舆论氛围浮躁。

浮躁是几个原因造成的

  • 需求氛围上,多数人也不过是叶公好龙,很多技术概念都是这样,去年的数据中台被阿里提出来之后,很多企业好像一下子就懂了,也纷纷跟着搞数据中台一个样子,实际上很多企业到底什么是数据中台也没搞明白。
  • 知识氛围上,研究算法、机器学习、人工智能等等这些技术的人越来越多,这好事没毛病。另一方面灌水的论文也确实不少,论文中算法调来调去预测准确性到90%都可以,但这些论文真的有几个可以拿到生产中去验证和使用?
  • 商业环境上,软件公司也加了一把火。近年来有很多资本投资机器学习相关的初创公司,这些公司为了拿到投资也“制造”了很多案例,我见过很多宣传诸如“算法准确率超过google”、“500强企业xxx在用我们产品预测xxx”,和灌水的论文一样。

虽然现在还有各种各样的问题,但毕竟数据挖掘本身是一个很实用的应用型技术,它给社会给企业带来的价值早晚会得到更多企业的认可。数据挖掘冲出泡沫的方式,我觉得会有这样两种。

第一,通过更多基于数据挖掘技术的应用软件走进企业。虽然已经有一些企业开发并应用了推荐、风控等场景,但企业数量还是很少的,并且这些应用通用性不强。

若要让更多的企业享受数据挖掘技术的福利,需要有类似于OA、CRM这样的有更强的通用性,可以被更多企业接受和使用的软件。

第二,企业中有自己的应用型人才,能够搭建企业内部的挖掘应用。不同于OA、CRM或ERP之类的软件使用,这种模式更类似于现在企业中数据分析系统,例如报表平台或bi平台,这些数据分析应用,往往由企业自己通过一些比较好用的工具如finereport/finebi自己建设起来的。

(此处已添加小程序,请到今日头条客户端查看)

数据的分析和应用灵活且多变,即便企业开始是由软件公司开发的报表或bi系统,多年之后这个系统也不会是项目当初的样子了。正因为企业自己在数据分析应用中发挥着主导作用,数据分析在企业中发展非常迅速,也受到很大认可。

数据挖掘的应用也有类似的特点,数据挖掘的应用点不会是单一的,很多数据深度挖掘后会展示出新的一面,企业中的数据也有不同的维度和模块需要深度挖掘。并且随着企业的发展,数据会跟着变化,挖掘应用也需要随之调整,企业自身有能力开发并维护挖掘应用,更有利于数据挖掘在企业中推广和应用。

这两个相比较,我更期待第二种情形的出现,这会有更多的可能性,也一定能给企业带来更大的价值。但这也有一些条件现在还没有满足,主要还是人才问题,当前企业中能够使用数据挖掘的人很少,能够将技术和业务痛点结合起来形成落地应用的人更少。满足这一条件有两种方式:

第一是大量的数据挖掘技术人才走进企业,这点还是比较困难的,一方面短期内看不出企业中有哪些数据挖掘的用武之地,企业本身就不会在此投入太多,另一方面供需双方对收入的期待水平相差太大。

还有另一种方式,就是企业原有的it人才可以掌握数据挖掘技术,这一个方向我觉得是可行的。一方面很多企业的it人员对业务是有一定理解的,并且长期负责企业数据,有很强的数据思维,具有针对业务痛点形成解决方案的基础。

另一方面当前很多企业的it人员有意愿学习更多的数据技术,提升自身竞争力,这种驱动力是不缺的。



Tags:数据挖掘   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
导读:数据挖掘是一种发现知识的手段。数据挖掘要求数据分析师通过合理的方法,从数据中获取与挖掘项目相关的知识。作者:赵仁乾 田建中 叶本华 常国珍来源:华章科技数据挖掘是一...【详细内容】
2021-11-23  Tags: 数据挖掘  点击:(20)  评论:(0)  加入收藏
互联网信息技术的迅速发展,大数据时代悄悄地来临。大数据是一种时代特征及数字平台,内容包括数据优化、分配与管理。在根据平台的操作过程之中,数据自身潜在的信息难以完成精确...【详细内容】
2021-07-07  Tags: 数据挖掘  点击:(89)  评论:(0)  加入收藏
1.统计知识在做数据分析,统计的知识肯定是需要的,Excel、SPSS、R等是需要掌握的基本技能。如果我们做数据挖掘的话,就要重视数学知识,数据挖掘要从海量数据中发现规律,这就需要...【详细内容】
2021-04-16  Tags: 数据挖掘  点击:(164)  评论:(0)  加入收藏
最近梳理了一下数据挖掘与分析的常用方法论,这里简要介绍6种模型。1、CRISP-DM 模型CRISP-DM是CrossIndustry Standard Process for Data Mining(跨行业数据挖掘标准流程)的字...【详细内容】
2021-03-08  Tags: 数据挖掘  点击:(137)  评论:(0)  加入收藏
本文总结了几种常用的数据加载方法,基于R语言工具实现数据加载模块,让用户对数据挖掘工具设计有更直观的了解。在分析和设置过程中,主要实现了聚类分析、相关分析、决策树和随...【详细内容】
2020-08-06  Tags: 数据挖掘  点击:(107)  评论:(0)  加入收藏
数据在当今世界意味着金钱,随着向基于App的世界的过渡,数据呈指数增长。今天给大家介绍6个开源数据挖掘工具,有需要的朋友可以自取,有更好用的工具也欢迎交流。1、DataMeltData...【详细内容】
2020-08-03  Tags: 数据挖掘  点击:(97)  评论:(0)  加入收藏
在机器学习的流程中数据挖掘是重要的一环。数据挖掘是从大量数据中提取隐藏的或未知,但可能有用信息的过程。这些数据最终会被加上标签,用于模型的训练。很多的数据科学家和机...【详细内容】
2020-07-22  Tags: 数据挖掘  点击:(86)  评论:(0)  加入收藏
数据挖掘会饱和吗?学大数据还有机会吗?这是很多计算机专业的学生,编程和算法技术员考虑的问题。数据挖掘不是独立市场,而是解决各领域问题的方法和工具,生物、制造、零售、金融...【详细内容】
2020-07-14  Tags: 数据挖掘  点击:(98)  评论:(0)  加入收藏
一个优秀的数据分析师,除了要掌握基本的统计学、数据库、数据分析方法、思维、数据分析工具技能之外,还需要掌握一些数据挖掘的思想,帮助我们挖掘出有价值的数据,这也是数据分析...【详细内容】
2020-06-10  Tags: 数据挖掘  点击:(116)  评论:(0)  加入收藏
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost,...【详细内容】
2019-11-14  Tags: 数据挖掘  点击:(332)  评论:(0)  加入收藏
▌简易百科推荐
前言什么是数据脱敏数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护常用脱敏规则替换、重排、加密、截断、掩码良好的数据脱敏实施1、尽...【详细内容】
2021-12-28  linyb极客之路    Tags:数据脱敏   点击:(2)  评论:(0)  加入收藏
张欣安科瑞电气股份有限公司 上海嘉定 201801 摘要:随着电力行业各系统接入,海量数据涌现,如何利用电网信息化中大量数据,对客户需求进行判断分析,服务于营销链条,提升企业市场竞...【详细内容】
2021-12-14  安科瑞张欣    Tags:大数据   点击:(10)  评论:(0)  加入收藏
1、什么是数据分析结合分析工具,运用数据分析思维,分析庞杂数据信息,为业务赋能。 2、数据分析师工作的核心流程:(1)界定问题:明确具体问题是什么;●what 发生了什么(是什么)●why 为...【详细内容】
2021-12-01  逆风北极光    Tags:大数据   点击:(26)  评论:(0)  加入收藏
在实际工作中,我们经常需要整理各个业务部门发来的数据。不仅分散,而且数据量大、格式多。单是从不同地方汇总整理这些原始数据就花了大量的时间,更不用说还要把有效的数据收集...【详细内容】
2021-11-30  百数    Tags:数据   点击:(21)  评论:(0)  加入收藏
数据作为新的生产要素,其蕴含的价值日益凸显,而安全问题却愈发突出。密码技术,是实现数据安全最经济、最有效、最可靠的手段,对数据进行加密,并结合有效的密钥保护手段,可在开放环...【详细内容】
2021-11-26  炼石网络    Tags:数据存储   点击:(17)  评论:(0)  加入收藏
导读:网易大数据平台的底层数据查询引擎,选用了Impala作为OLAP查询引擎,不但支撑了网易大数据的交互式查询与自助分析,还为外部客户提供了商业化的产品与服务。今天将为大家分享...【详细内容】
2021-11-26  DataFunTalk    Tags:大数据   点击:(15)  评论:(0)  加入收藏
导读:数据挖掘是一种发现知识的手段。数据挖掘要求数据分析师通过合理的方法,从数据中获取与挖掘项目相关的知识。作者:赵仁乾 田建中 叶本华 常国珍来源:华章科技数据挖掘是一...【详细内容】
2021-11-23  华章科技  今日头条  Tags:数据挖掘   点击:(20)  评论:(0)  加入收藏
今天再给大家分享一个不错的可视化大屏分析平台模板DataColour。 data-colour 可视化分析平台采用前后端分离模式,后端架构设计采用微服务架构模式。 前端技术:Angularjs、Jq...【详细内容】
2021-11-04  web前端进阶    Tags:DashboardClient   点击:(40)  评论:(0)  加入收藏
在Kubernetes已经成了事实上的容器编排标准之下,微服务的部署变得非常容易。但随着微服务规模的扩大,服务治理带来的挑战也会越来越大。在这样的背景下出现了服务可观测性(obs...【详细内容】
2021-11-02  大数据推荐杂谈    Tags:Prometheus   点击:(40)  评论:(0)  加入收藏
同一产品对老客户的要价竟然比新客户要高?这是当下“大数据杀熟”的直接结果。近年来,随着平台经济的蓬勃发展,大数据在为用户服务之外,也引发了多种不合理现象。为了有效遏制“...【详细内容】
2021-10-29    海外网   Tags:大数据   点击:(31)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条