249 弱小(4k)(4/6)

  【重塑千禧年代】小说免费阅读,请收藏 零点小说【0xs.net】,如果无法弹起阅读主题设置栏,请闭关器浏览告广蔽屏能功即可。

  “而且,自注意力模型必然因为序列中每对元素计算的注意力权重而有巨大的参数量,这极可能导致过拟合。”

  他这边刚说话,谷歌自家DL的席尔瓦也反驳了乌思克尔特提出的新路线,其中一个重要原因在于RNN的循环结构太符合大家对序列数据处理的理解,即当前状态依赖于过去的信息,而自注意力的全局依赖一看就不如RNN直观。

  易科与谷歌的两大领导者都批评了自注意力Self-attention,但乌思克尔特并不服气,他直接登台阐述自己更多的想法。

  而且,针对吴恩达与席尔瓦抨击的缺点也给出一些解决思路,比如,引入位置编码,比如,进行多头注意力的研究。

  有人觉得眼前一亮,有人觉得异想天开,还有人现场进行快速的分析和演算。

  第一排的方卓极其茫然,他扭头询问旁边沉思的英伟达掌门人黄仁勋:“他们在讨论什么?”

  “乌思克尔特说, GPU是最适合深度学习技术的硬件。”黄仁勋给出一句总结。

  方卓:“???”

  他纳闷道:“我怎么完全没听到类似的表述?”

  “因为自注意力Self-Attention更加强调并行处理,这是GPU更擅长的。”黄仁勋笑道,“至于其他的,不重要,我们只要提取对我们有利的就好。”

  方卓观察着现场的气氛,这已经不是知识的交流,更像是知识的火拼了。

  他默默的收起自己在这种场合本就不多的存在感。

  只是,等到晚上,方卓还是当面询问了这次参与辩论的吴恩达,想知道这场面红耳赤的讨论都有些什么东西。

  吴恩达真的很难和方总解释发生了什么。

  “方总,等我们想一想再写一份报告吧。”他思考许久之后由衷的说道,“这样的交流或许应该多来几次,他那个自注意力,我现在想想,缺点也不是不能解决。”

  方卓耐心的询问:“那我们应该做些什么?”

  吴恩达回味今天的整场辩论,思考着不同人提出的不同想法,喃喃道:“或许,我们需要先试试一种新型软件,让它可以和计算机对话。”

  方卓“嗯”了一声,表达一贯的支持:“行,开始吧。”

 

 

本章未完,点击[下一页]继续阅读-->