当前位置:澳门新莆京娱乐 > 网络知识 > 新莆京娱乐手机网站-科普:深度学习如何使计算机获得视觉?
201901/12

新莆京娱乐手机网站-科普:深度学习如何使计算机获得视觉?

admin 网络知识 如何学电脑(3) Comments 围观:

  Claire Bretton是daco.io的联合创始人之一。dico.io是一家创业公司,目前正在研究一种独特的工具。此前,她是一家位于巴黎的顶级战略咨询公司的经理,有欧洲管理学院硕士学位。

  二十一世纪的最大挑战之一是使计算机能够更像人类的大脑。我们想让计算机说话、理解问题并解决问题,现在我们想让计算机获得视觉并辨别图像。

  了解机器学习很容易,它的主要想法是在大型数据库上训练算法,让它们能用新的数据预测结果。

  有一个简单的例子:我们想根据一棵树的直径来预测它的年龄。该数据库只包含三种数据:输入(X,树的直径),输出(Y,树的年龄)和特征(A,新莆京娱乐手机网站B:树的类型,森林的位置……)。一旦这个训练阶段完成,计算机将能够根据任意的新的直径(x)预测树的正确年龄(Y)。

  对于一台电脑来说,一张图片是数以百万计的像素,这是大量的数据,对于一个算法来说也是庞大的输入。研究人员不得不去寻找一条捷径。新莆京娱乐手机网站第一个解决方案是定义中介特征。想象你想让计算机识别一只猫。首先,你必须定义一只猫的所有主要特征:一个圆圆的脑袋,两只锋利的耳朵,一个口鼻。一旦关键特征定义完成,训练得很好的神经网络算法将具有足够的精度水平,能够进行分析并确定这张图片是否是一只猫。

  你将会遇到使用机器学习来进行图像识别的第一个限制:我们往往无法定义出具有接近百分百识别可能性的不同特征。

  在本世纪初,斯坦福大学人工智能实验室和视觉实验室主任Fei-Fei Li,就感悟到:孩子们如何学习一个物品的名称?他们如何能认出一只猫或一件衣服?父母并不会通过描述特征来教会孩子这些,而是每当孩子们看到一个物品或动物时就告诉他们它的名字。他们通过视觉的例子来培养孩子。为什么我们不能在计算机上做同样的事情?

  首先,我们如何得到一个足够大的数据库来“教计算机如何看”? 为了解决这个问题,Li和她的团队于2007推出了图像网络项目。2009年,新莆京娱乐手机网站在全球180个国家的50000多人的合作下,新莆京娱乐手机网站他们创造了世界上最大的图像数据库:1500万个已命名和已分类图像,涵盖22000大类。

  现在,计算机可以在没有人为干预的前提下,在海量的图像数据库上训练自己,来获得识别关键特征的能力。就像一个三岁的孩子一样,电脑会看到数以百万计的已命名图像,并且靠他们自己来理解每个图像的主要特点。这些复杂的特征提取算法使用的是深度神经网络,这需要成千上万的节点。

  这只是深度学习的开始:我们设法让电脑像一个3岁的孩子一样去看,但是正如Li在TED演讲中所说的,“真正的挑战是未来:我们如何帮助计算机将他们的识别能力实现从三岁到十三岁的跨越?“


文章作者:admin
本文地址:
版权所有 © 未注明“转载”的博文一律为原创,转载时必须以链接形式注明作者和原始出处!
如果你觉得文章不错,您可以推荐给你的朋友哦!

发表评论:                              


验证码:点击我更换图片

来看看其他人说了些什么?-----------------------------------------------------------------> 进入详细评论页