谷歌上马神经网络百名PhD人工处理数据_IT

搜索“世界上最快的鸟是什么？”谷歌会告诉你：“游隼。根据 YouTube，游隼被记录下最高 389 km/h 的时速。”这的确是正确答案，但它并非来自于谷歌的数据库。当你输入这个问题的时候，谷歌搜索引擎找出了一个描述世界上五种最快鸟儿的 Youtube 视频。然后它只把最快的“一种”鸟儿的信息提取出来，不提及另外四种。

这是谷歌搜索最新的技术进展。为了回答这些问题，谷歌需要借助深度神经网络。作为 AI 技术之一，它不仅正在重塑谷歌搜索引擎，还在革新谷歌全套人工智能服务。其它互联网巨头当然也受到波及，例如 Facebook 和微软。

深度神经网络是一种模式识别系统。它能通过分析海量数据，学习如何处理特定任务。这个例子中，它学会了怎么在网络上的长篇文字中找出相关的一句或一段话，然后提取其中的要点呈现给你。

移动端谷歌搜索刚刚上线这种“句子压缩算法”（sentence compression algorithms）。这个对人类来说很简单，但对传统的机器来说很难的任务，终于能被 AI 系统完成。这说明，深度学习正在促进自然语言理解这门艺术（理解并回应人类语言）的发展。

谷歌研发产品经理 David Orr 说：“对于“句子压缩”，你不得不使用神经网络算法，因为这是目前我们发现的唯一方法。”

为了训练神经网络算法，谷歌在全世界聘用了约百名语言学博士处理数据，对它们人工筛选。事实上，谷歌的系统是从人类那里学习，怎么在大段文字中提取有用信息。而这过程需要一遍遍地重复——这是深度学习一个很大的限制。雇佣大批语言学家不停地筛选数据既麻烦又极其昂贵，但短期内谷歌没有别的办法。

“黄金数据”和“白银数据”

谷歌也使用过期的新闻来训练 AI 问答系统。这使 AI 逐渐理解，新闻标题是如何对文章主体进行归纳的。但这并不意味着谷歌不需要成批语言学家了。他们不仅示范句子压缩，还要对语句的不同部分做标记，以帮助神经网络理解人类语言是如何工作的。David Orr 把谷歌语言学家团队处理的数据称为“黄金数据”，过期新闻则是“白银数据”。“白银数据”作用不小，因为它的体量很大。但价值最大的还是“黄金数据”，它们是 AI 训练的核心。语言学家团队的负责人 Linne Ha 透露，在可见的将来，语言学家队伍仍会继续扩大。

这类需要人工辅助的 AI 学习便是“监督学习”（supervised learning），目前，神经网络都是这么运作的。有时候公司会把这个业务进行众包，有时候它会自发地进行。比方说，全世界的网民已经为数百万的猫咪照片添加了“猫咪”标签，这会让神经网络学习识别猫咪变得很简单——训练数据已经处理好了。但很多情况下，研究人员们别无选择，只能自己一次次为数据添加标签。

深度学习初创公司Skymind 的创始人 Chris Nicholson 认为，长远来看，人工标注数据是不可行的。他说：“将来一定不会是这样。这是极度枯燥的活儿。我想不出比这更无聊的 PhD 工作了。”

监督学习的缺陷远不止如此：除非谷歌聘请所有语言的语言学家，否则这个系统无法在其他语言中运转。现在，语言学家团队的工作横跨了 20 至 30 种语言。谷歌必须在将来的某一天，采取更自动化的 AI 训练方式，即“无监督学习”（unsupervised learning）。

到了那时，机器将能够从未经人工标注的数据中学习。互联网上海量的数字信息可以被直接用于神经网络学习。 Google、Facebook 和 OpenAI这样的巨头们已经开始这个领域的研究，但它的实际应用仍然非常遥远。现在，AI 学习仍然需要幕后的大批语言学家队伍。

谷歌上马神经网络百名PhD人工处理数据

该说再见？英国版Lumia950/XL自10月份缺货至今

离岸天堂的新麻烦，黑客攻破列支敦士登银行账户

随便看看

IT巨头齐聚2019智博会同台分享科技与未来新思考

小白必看——台式机选购指南

杭州北大青鸟：2019年学IT前景如何？入门难吗？

Gartner：三季度PC市场持续萎缩，苹果同比下滑5.6%

微软推出新工具，让用户更容易从Mac切换到Surface

由于原材料成本上涨三星Galaxy S8价格可能增加高达20％

揭秘：智能机信号为啥不如功能机

苹果要进入韩国：计划开设第一家Apple Store

北塔软件创新打造IT运维方案，助力金融行业新发展

曙光服务器打破性能和性价比双项世界纪录实现全球第一

谷歌上马神经网络 百名PhD人工处理数据

该说再见？英国版Lumia950/XL自10月份缺货至今

离岸天堂的新麻烦，黑客攻破列支敦士登银行账户

猜你喜欢

谷歌净利润增长211% 二季度到底发生了什么？

澳大利亚盯上科技巨头 FB谷歌推荐算法要受审查

移动游戏直播平台触手宣布完成D轮融资 谷歌参投

谷歌的AI布局：机器学习是重心 继续在中国招人

苹果、谷歌、亚马逊 谁将率先成为市值万亿公司

谷歌的印度本地化战略——走自己的路，让别人无路可走？

随便看看

谷歌上马神经网络百名PhD人工处理数据

移动游戏直播平台触手宣布完成D轮融资谷歌参投

谷歌的AI布局：机器学习是重心继续在中国招人

苹果、谷歌、亚马逊谁将率先成为市值万亿公司