数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

简介

数据挖掘说的直白些就是在海量的数据中找到有价值的数据,为企业经营决策提供依据。数据挖掘是从一大堆数据里挖掘出你想要的有用的信息。怎么样,是不是和模式识别有点异曲同工之妙?不过其主要数据对象是数据库(Database),类似的还有文本挖掘(textmining)。

价值

价值包括以下几类:

1、相关性

相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。相关性不等于因果性,也不是简单的个性化,相关性所涵盖的范围和领域几乎覆盖了我们所见到的方方面面,相关性在不同的学科里面的定义也有很大的差异。用于确定数据之间的变化情况,即其中一个属性或几个属性变化的是否会对其它属性造成影响,影响有多大。

2、趋势

是指将实际达到的结果,与不同时期财务报表中同类指标的历史数据进行比较 ,从而确定财务状况,经营成果和现金流量的变化趋势和变化规律的一种分析方法。可以通过拆线图预测数据的走向和趋势,也可以通过环比、同比的方式对比较的结果进行说明。

3、特征

看具体分析的内容是什么,比如互联网类,就是用户画像这类的需求,根据不同的用户给用户群打相应的标签。

展现形式

数据挖掘的结果一般有几种展现形式:

1、表格

最早的一种展现方式,交叉表的展示

2、图表

相比于图表更具展现力,让人很直观的就能看出数据的整体情况

3、决策树

套用俗语,决策树分类的思想类似于找对象。现想象一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话:

女儿:多大年纪了? 

      母亲:26。 

      女儿:长的帅不帅? 

      母亲:挺帅的。 

      女儿:收入高不? 

      母亲:不算很高,中等情况。 

      女儿:是公务员不? 

      母亲:是,在税务局上班呢。 

      女儿:那好,我去见见。

这个女孩的决策过程就是典型的分类树决策。相当于通过年龄、长相、收入和是否公务员对将男人分为两个类别:见和不见。假设这个女孩对男人的要求是:30岁以下、长相中等以上并且是高收入者或中等以上收入的公务员,那么这个可以用下图表示女孩的决策逻辑。

涉及的领域

数据挖掘是计算机学科中的一个交叉研究领域,其研究方法与多个其他科学紧密相连,如:统计、机器学习、专家系统、信息检索、社会网络、自然语言处理和模式识别等等。

       人工智能与人脑大脑有什么区别?
       人工智能cnn是什么意思
       人工智能NPU什么意思
       人工智能ASR是什么意思
       人工智能CV是什么意思
       人工智能Attr是什么意思
       人工智能取代了什么
       学习人工智能需要哪些知识
       人工智能为什么需要大数据库
       人工智能专业属于什么专业