自然语言处理的应用

肖像与数字操作代表机器学习和人工智能

利亚姆·诺里斯/盖蒂图片

是自然语言处理或NLP的一个分支人工智能这对计算机和人类的互动方式有很多重要的影响。人类语言,发展了数千年,已经成为一种微妙的交流形式,它携带着丰富的信息,往往超过了文字本身。自然语言处理技术将成为弥合人类交流与数字数据之间差距的重要技术。以下是自然语言处理在未来几年将被使用的5种方式。

机器翻译

随着全世界的信息在线,让这些数据可访问的任务变得越来越重要。让每个人都能跨越语言障碍获取世界上的信息,这一挑战已经超出了人工翻译的能力。像Duolingo这样的创新型公司希望通过学习一门新语言的同时进行翻译工作来招募大量的人才。但是机器翻译提供了一个更可扩展的选择来协调世界信息。谷歌是一家处于机器翻译前沿的公司,使用专有的统计引擎提供谷歌翻译服务。机器翻译技术的挑战不是翻译单词,而是保存句子的意思,这是一个复杂的技术问题,也是自然语言处理的核心。

打击垃圾邮件

垃圾邮件过滤器已成为重要的第一道防线,以防止日益增长的问题,不需要的电子邮件。但几乎所有广泛使用电子邮件的人都曾经历过不希望收到的电子邮件,或重要的电子邮件被过滤器意外捕获的痛苦。垃圾邮件过滤器的假阳性和假阴性问题是NLP技术的核心,再次归结为从文本字符串中提取意义的挑战。一项备受关注的技术是贝叶斯垃圾邮件过滤,一种统计技术,用垃圾邮件和非垃圾邮件的语料库中单词的典型发生率来衡量电子邮件中的单词发生率。

信息提取

金融市场的许多重要决策正日益远离人类的监督和控制。算法交易正变得越来越流行,这是一种完全由技术控制的金融投资形式。但很多金融决策都受到新闻的影响,受到仍然以英语为主的新闻的影响。因此,NLP的主要任务是提取这些明文公告,并以一种可以纳入算法交易决策的格式提取相关信息。例如,公司之间的合并新闻可能会对交易决策产生重大影响,而合并的细节、参与者、价格、收购对象以及谁能被纳入交易算法的速度,可能会对数百万美元的利润产生影响。

摘要

在我们的数字时代,信息超载是一个真实的现象,我们获取知识和信息的能力已经远远超过了我们理解它的能力。这一趋势丝毫没有放缓的迹象,因此总结文档和信息含义的能力变得越来越重要。这很重要,不仅仅是让我们有能力从大量数据中识别和吸收相关信息。另一个期望的结果是理解更深层次的情感含义,例如,基于汇总的数据社交媒体,公司能否确定其最新产品的市场人气?这个NLP分支将成为越来越有用的有价值的营销资产。

问题回答

搜索引擎将世界上丰富的信息放在我们的指尖,但在回答人类提出的具体问题时,通常仍然相当原始。谷歌已经看到了这给用户带来的挫折,他们经常需要尝试许多不同的搜索结果来找到他们想要的答案。谷歌在自然语言处理方面的一大重点是识别自然语言问题、提取含义并提供答案,谷歌结果页面的演变显示了这一重点。虽然改进了,但这仍然是搜索引擎面临的主要挑战,也是自然语言处理研究的主要应用之一。

这个页面有用吗?