百香果nlp(nlp.100xg.cn):欢迎提交人工智能(AI)、自然语言处理(NLP )、大数据、智能硬件、云计算、5G、物联网、前沿科技相关的公司、术语、项目、产品领域词条。快速提交,并将在这里展现。

机器学习(英文:Machine Learning,简称:ML)是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。

介绍

机器学习(英文:Machine Learning)是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(Generalization)能力。

机器学习学术定义为:计算机程序可以从经验E中学习某类任务T和性能测量P,如果它通过P测量的T中任务的性能随着经验E而提高。普通定义为作为工智能的重要分支,基于样本数据建立数学模型(训练数据),以实现在没有明确编程以执行任务的情况下进行预测或决策。

背景资料

现在,问题分为特定于元数据的区块,用户可以将这些信息提供给机器学习。在众多机器学习算法和技术中,使用神经网络(即深度学习)的监督式机器学习成为了最受欢迎的方法之一。神经网络的概念自1949年提出以来,随着计算和存储能力的增强,神经网络经过了大量训练以解决各种现实问题,从图像识别、自然语言处理到预测网络性能。其他应用包括异常特征发现,时间序列异常检测和根本原因分析的相关事件。

技术介绍

机器学习是在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域,是其他三大领域的底层基础。

在传统算法设计中,由人来分析问题得到模型,并将模型编码输

入机器,机器只负责根据人编写好的算法模型将输入转化为输出;而在机器学习算法中,人们并不直接编写处理问题的算法模型,而是吧利用数据进行学习的方法教给机器,机器自己根据输入与输出的对应关系抽象出问题处理模型。


机器学习与计算统计密切相关,计算统计侧重于使用计算机进行预测。在跨业务问题的应用中,机器学习也被称为预测分析。数学优化研究为机器学习领域提供了方法,理论和应用领域。

机器学习可分为监督学习、半监督学习、无监督学习以及主动学习等。监督学习算法根据包含输入和期望输出的一组数据建立数学模型。半监督学习算法从不完整的训练数据开发数学模型,而且其中一部分样本输入没有标签。无监督学习从一组数据建立数学模型,该数据仅包含输入而不包含期望的输出标签。主动学习基于有限输入的期望输出(训练标签),并优化其将获得训练标签的输入的选择。

注:监督学习会使用大理分类算法和回归算法。数据挖掘是机器学习中的一个研究领域,侧重于通过无监督学习进行探索性数据分析。无监督学习常常利用降维学习。


机器学习是人工智能(AI)的分支,它使计算机系统能够使用统计方法,识别或学习大量数据中存在的规律和模式。机器学习将这些模式汇总到一个模型中,通过该模型,计算机就能进行预测或执行具体的识别任务,而无需人为地编写规则来实现对输入数据的识别和处理。简单地说,机器学习是对数据进行处理、统计和归纳,是数据处理的科学。


现代的机器学习需要依赖特定的算法,虽然这些算法大多数在数十年前就已经存在了,但算法的存在并没有使机器学习在那些年就被重视和认可。直到近些年,可用于训练的数据和负担得起的计算能力爆炸式增长、模型训练方法的进步、以及用于开发机器学习解决方案的工具数量和质量飞速增长,才使得人工智能得以快速发展。


我们可以注意到,从基础架构角度,除了强大的算力(云和GPU居功至伟)之外,推动机器学习向前发展的两大动力,一是强(爱)大(省事)的程序员们编写了大量支撑机器学习的框架和工具,二是海量的数据成为可能。

概续

现在这个问题被划分到特定领域的元数据块中,用户可以将这些信息输入到机器学习这个神奇而强大的世界中。有许多机器学习算法和技术,带有监督的机器学习使用神经网络(即深度学习)来实现,现在已经成为最流行的方法之一。神经网络的概念从1949年开始,笔者曾经在上世纪80年代建立了我的第一个神经网络。但是随着计算机技术的革新和存储能力的增强,神经网络被开发来解决各种实际问题,从图像识别到自然语言处理,以此来预测网络性能。其他应用还包括异常特征发现,时间序列异常和事件深度分析。

机器学习的4种主要类型:

1、监督机器学习

在这种情况下,你需要向计算机程序提供带有标签的数据。举个例子,如果分配的任务是使用分类图像算法区分男孩和女孩的图片,那么男孩的照片会被打上“男孩”标签,女孩的照片会被打上“女孩”标签。这被认为是一种“训练”数据集,在程序能够以可接受的速率成功地对图像进行分类之前,这些标签会一直被保留。

2、半监督机器学习

在这种情况下,只有少数图像被标记。计算机程序随后将使用算法对未标记的图像进行最佳猜测,然后将数据作为训练数据反馈给程序。随后,它会被提供一批新的图像,当中只有少数分类标签。这是一个重复的过程,直到程序能以可接受的速度区分男孩和女孩。

3、无监督机器学习

这种类型的机器学习不涉及任何标签。相反,程序会被要求使用两种方法之一将男孩和女孩的图像分成两组。当中的一种算法被称为“聚类”,它会根据诸如头发长度,下巴大小,眼睛位置等特征将相似的对象分组在一起。另一种算法称为“关联”,程序会根据它发现的相似性创建if / then规则。换句话说,它会对图像之间的共同模式作出判断,并对它们进行相应的排序。

4、增强机器学习

国际象棋是这种算法一个很好的例子。该程序知道游戏的规则和玩法,并会按部就班地完成一轮对弈。提供给该计划的唯一信息是它是否赢得比赛。它会一直重播比赛,追踪自己成功的落子,直到最终赢得比赛。

       电子病历自动生成
       语音录入病例
       人工智能医疗影像识别
       智能医疗
       人工智能中医辅助诊断系统
       胸部CT全病种筛查系统
       Decanter AI
       MoBagel(行动贝果)
       Automl-Zero
       AutoML算法比赛平台
       AutoSSL(自动半监督学习)
       自动时序树模型工具(HE-TreeNet)
       自动时序嵌入(TemporalGo)
       自动多表时序特征(FeatureZero)
       自动深度稀疏网络(AutoDSN)