2020-02-24 11:28:29

百香果nlp(nlp.100xg.cn):欢迎提交人工智能(AI)、自然语言处理(NLP)、大数据(big data)、机器学习(ML)、数据挖掘(DM)、知识图谱、智能硬件、工业互联网、工业机器人、云计算、5G网络、物联网、边缘计算(MEC)、机器人流程自动化(RPA)、前沿科技相关的公司、术语、API接口、项目、产品领域词条。快速提交,并将在这里展现。

机器翻译 (Machine Translation, MT):两种语言的的转换。深度学习里面的很多模型sequence2sequence、Transformer、Bert等模型应用到了机器翻译上面。。机器翻译是将文本或语音从一种人类语言自动翻译成另一种语言的任务。机器翻译:顾名思义就是语言之间的转换,典型案例有百度翻译、谷歌翻译。机器翻译是指把输入的源语言文本通过自动翻译获得另外一种语言的文本。根据输入媒介不同,可以细分为文本翻译、语音翻译、手语翻译、图形翻译等。机器翻译从最早的基于规则的方法到二十年前的基于统计的方法,再到今天的基于神经网络(编码-解码)的方法,逐渐形成了一套比较严谨的方法体系。

介绍

随着通信技术与互联网技术的飞速发展、信息的急剧增加以及国际联系愈加紧密,让世界上所有人都能跨越语言障碍获取信息的挑战已经超出了人类翻译的能力范围。

机器翻译因其效率高、成本低满足了全球各国多语言信息快速翻译的需求。机器翻译属于自然语言信息处理的一个分支,能够将一种自然语言自动生成另一种自然语言又无需人类帮助的计算机系统。目前,谷歌翻译、百度翻译、搜狗翻译等人工智能行业巨头推出的翻译平台逐渐凭借其翻译过程的高效性和准确性占据了翻译行业的主导地位。

商业用途

机器翻译是语言理解的经典测试。它由语言分析和语言生成组成。大型机器翻译系统具有巨大的商业用途,给你一些值得注意的例子:

1、谷歌翻译每天翻译1000亿字;

2、Facebook使用机器翻译自动翻译帖子和评论中的文字,以打破语言障碍,让世界各地的人们相互交流;

3、阿里巴巴使用机器翻译技术来实现跨境贸易,连接世界各地的买家和卖家;

4、微软为Android、iOS和Amazon Fire上的最终用户和开发人员提供基于人工智能的翻译,无论他们是否可以访问互联网。

在传统的机器翻译系统中,我们必须使用平行语料库:一组文本,每个文本都被翻译成一种或多种不同于原文的其他语言。例如,给定源语言f(例如法语)和目标语言e(例如英语),我们需要建立多个统计模型,包括使用贝叶斯规则的概率公式,训练的翻译模型p(f | e)平行语料库和语言模型p(e)在纯英文语料库上训练。这种方法跳过了数百个重要细节,需要大量的手工特征工程,整体而言它是一个非常复杂的系统。

子服务

机器翻译作为自然语言处理的一个基础应用,提供中文、英文、俄语、葡萄牙语、西班牙语、法语的自动语种识别和翻译服务,支持通用场景和电商垂直场景。

1、文本翻译

文本翻译是为了实现语种间的转换。对于用户输入原始语种的文本,转换为目标语种的文本。

2、语种识别

语种识别是为了识别文本所属的语种。对于用户输入的文本,返回识别出的所属语种。


机器翻译研究如何利用计算机实现人类语言之间的自动翻译。基于深度学习的机器翻译方法利用神经网络直接实现语言之间的自动翻译,目前已取代传统的统计机器翻译,成为学术界和工业界新的主流方法。

清华大学计算机系长聘副教授刘洋介绍了神经网络机器翻译的基本原理、重要挑战以及最新研究进展。近年来,随着深度学习技术的发展,机器翻译的质量迈上了一个新的台阶。但是神经网络翻译模型仍然面临一系列重要挑战,例如:现有模型都是基于双语平行语料进行学习的,缺乏先验知识的融合;神经网络模型就像一个黑盒子,缺乏可解释性,难以调试和分析;模型对训练数据敏感、鲁棒性较差。针对以上挑战,刘洋结合研究组工作,介绍了他们在知识驱动[21]、可视化和可解释性[22]、鲁棒性神经网络机器翻译[23]方面的最新进展。谈及未来工作,刘洋认为,基于规则的翻译模型需要设计规则,统计机器翻译需要设计特征,神经网络机器翻译需要设计架构,未来是否能让机器自动设计神经网络架构,是一个非常有价值的研究方向。

机器同传近年来成为人工智能领域一个前沿研究方向。百度人工智能技术委员会主席何中军详细介绍了机器同传面临的主要技术挑战,并结合百度在机器同传上的一系列技术创新介绍了该方向的前沿进展。值得一提的是,何中军的全场报告采用了百度翻译最新研发的AI同传小程序进行端到端的语音翻译,只需要手机扫描会议二维码,就可以实时收听到翻译后的语音。新产品集成了百度在机器同传上的最新技术,如噪声容错、自动断句、可控时延[24]、篇章翻译[25]、端到端翻译[26]等。针对目前的挑战,何中军也指出机器同传未来的三个发展方向:模型方面,研发更加鲁棒的同传模型;数据方面,建设大规模、高质量同传数据;评价方面,研究和建立面向同传的评价体系和评价标准。



计算机语言:Java、JavaScript、PHP、Python、C#、Android、Objective-C、Go语言、c/C++、NodeJS、Swift、R语言。

       左医科技
       智能医疗问答系统
       智能用药管家
       智能问药
       智能预问诊
       智能导诊
       智能医生培训
       智能辅助问诊
       智能患者自诊
       护照照片检测
       夜间老鼠识别
       下划线去噪
       裸露土堆识别
       魔幻换脸
       国旗绘脸