谷歌的嗡嗡声如何搜索作品

唔。唔。嗯。

关键的外卖

  • 谷歌推出了一个新工具,允许用户通过哼唱,唱歌或吹口哨搜索歌曲。
  • 新工具使用机器学习匹配嗡嗡声的轨道,数据库不断更新的半千万歌曲。
  • 谷歌用户问哪首歌曲每月近100次。
使用她的手机的射击妇女,当在家时放松
拉法勒/盖蒂图像

谷歌推出了一个名为“哼是搜索“解决一个令人沮丧的问题:让一首歌曲困在你的脑海里,不能弄清楚它被叫的东西。

哼唱着歌唱的想法似乎令人难以置信的简单,为什么谷歌只在2020年推出这个功能?嗯,事实证明,这种方式识别歌曲实际上是非常复杂的,部分原因是我们的嗡嗡声往往与原始轨道相当不同。在其AI博客上最近的帖子中,谷歌解释了它如何使用机器学习为了解决这个问题,最终帮助人们通过嗡嗡声,吹口哨或唱歌的歌曲,即使它们的再现不到准确。

“我们为HUM的重点搜索是帮助人们识别并找到困境的音乐,”谷歌发言人告诉乐动体育赞助在电子邮件中。

只是开始哼唱

谷歌用户每月询问哪首歌曲近1亿次,Aparna Chennapragada,谷歌副总裁兼消费者购物总经理,说过视频介绍几个新的搜索功能。现在有一种方法可以找到答案。

这 ”哼是搜索“功能是内置于Google的移动应用程序,Google搜索小部件和Google助手中的。要通过应用程序访问它,请点击麦克风图标并说出”这首歌是什么?“选择”搜索歌曲“按钮也有效。

正常工作,该功能要求您哼到至少10-15秒。Android用户可以嗡嗡声可以查找20多种语言的歌曲,而只有英语歌曲在iPhone上工作。该工具并不总能立即识别一首歌曲,但一旦它确实如此,结果非常好。

“我们的算法识别出一组广泛变量的一半以上的一半歌曲,但当然,准确性取决于嗡嗡声的质量,歌曲的类型等等,“谷歌发言人告诉乐动体育赞助在电子邮件中。“但一旦被认可,五个答案中大约四个是正确的。”

然而,这不是哼唱中首次在识别应用程序中使用的嗡嗡声。soundhound.提供类似的功能,如上所述CNN业务,也可在Android和iOS上提供。根据谷歌发言人,新功能不会提高任何隐私问题,也没有“改变谷歌处理基于音频的交互”,他们告诉他们乐动体育赞助在电子邮件中。

机器学习

尽管概念的简单性,但哼了一下曲调,找到工作室录音在技术上非常困难。这有几个原因,谷歌研究的基督教弗兰克解释了11月12日博客帖子。首先,歌曲的歌曲版本可能与实际录音有很大差异,使得难以匹配两种。所以,虽然shazam和a大量其他应用程序已经存在,以确定您在餐厅或其他公共场所中听到的歌曲,使用嗡嗡声的旋律作为该搜索的基础可能是棘手的。

“伴随着歌词,背景声乐和仪器,音乐或工作室录音的音频可能与嗡嗡声的曲调有很大不同,”弗兰克写道。“通过错误或设计,当有人哼唱他们对歌曲的解释时,通常俯仰,钥匙,节奏或节奏可能会略有不同甚至显着。”

谷歌在匹配的Studio录制旁边的嗡嗡声的剪辑可视化。
谷歌

因为嗡嗡声版本的歌曲可能与原件如此不同,因为弗兰克指出,许多过去的方法都需要使用只有旋律的歌曲或包括嗡嗡声的歌曲的歌曲匹配。这使得真实的使用案例具有挑战性,因为具有这些歌曲的数据库可以限制,并且需要手动更新。

谷歌解释说,对于嗡嗡声来搜索功能,它使用机器学习模型将音频转换为代表歌曲的旋律 - 它所说的是一个“指纹”。

更用户友好

在谷歌的HUM中使用机器学习来搜索功能最终使工具在现实世界中更容易使用。由于HUM要搜索匹配搜索者与实际歌曲的Hummed调整,因此该工具能够与新歌曲一起使用,因为它们被释放而不是常常使用每个轨道的嗡嗡声版本更新的数据库。此外,您不需要完美的音高来使用它。

“目前的系统在歌曲数据库上达到了高度的准确性,其中包含超过一半的歌曲我们不断更新,”谷歌在其嗡嗡声中向公告说明了。“这首歌的语料库仍然有空间,以包括更多世界的许多旋律。”

此页面是否有帮助?