谷歌,Facebook和其他公司的研究人员正在努力使用人工智能来了解视频中正在发生的内容以及在图片中以及演讲中的内容。今天,谷歌展示了其在研究中的最新突破,涉及一种叫做深度学习的时尚类型的AI。

这种方法往往涉及将许多数据摄取到培训称为神经网络的系统,然后将新数据馈送到这些系统并以响应的接收预测。

在谷歌的情况下,研究人员测试了几种方法,以便正确地识别对象并解释运动中的视频:经常性神经网络和特征池网络,与广泛使用的卷积神经网络相结合。

“我们通过观察到概念非常不同,最大池和经常性神经网络方法在使用两种图像和光学流程时表现得同样,”谷歌软件工程师乔治·托德里奇和Sudheendra Vijayanarasimhan今天写在他们的工作中,将在6月份在波士顿的计算机愿景和模式识别会议上呈现。

您可以阅读学术纸张,或者,以获得谷歌的最新视频处理能力的感觉,只需观看此视频: