计算机视觉已超越人类眼睛?腾讯优图与《科学》杂志全面解读-尊龙凯时平台入口

[原创文章:www.pp00.com]

来源:  研究院

[原文来自:www.pp00.com]

摘要:是认知世界的重要组成部分,而计算机视觉作为人工智能的核心技术之一,近几年的发展现状如何?


视觉是人类认知世界的重要组成部分,而计算机视觉作为人工智能的核心技术之一,近几年的发展现状如何?


在目前的人类生活中有这样的应用?是否已经人类的?未来又将有怎样的发展前景?


近日,腾讯优图与《》(science)共同发布《seeing is believing: r&d applications of computer vision》(眼见为实:计算机视觉的研发和应用)主题报告,通过全球计算机视觉领域的专家访谈,为大众带来当下计算机视觉技术发展的解读,也为即将到来的计算机视觉峰会拉开序幕。


眼见为实:计算机视觉研发和应用

 

人工智能 (ai) 曾经只是一种存在于科幻领域的科技,而现在,研究实验室已经不断研发出了各种应用ai 的日常产品。


ai技术的进步很大程度上得益于计算机视觉的发展。计算机视觉技术关注的是构建能够收集和处理视觉信息的软件。应用计算机视觉可以识别照片中的人物、读取x光片、进行工厂机器人系统的智能升级,但它的影响范围远不止于此。


大多数人都对自己的视觉习以为常,殊不知要拿起叉子或接住球,我们的大脑要进行大量的运算。计算机变得足够快速、强大和小巧来实现计算机视觉的实际应用,不过是这几年的事情。


最先进的计算机视觉技术要运用到深度学习,而深度学习是ai的一大领域,灵感来自于人脑。深度学习算法使用的人工神经网络(ann),是指能够分析并相互传递信息的互相连接的节点层,与神经元的通信机制类似。


如果我们向神经网络展示一张自拍照,一层神经元将会识别类似于面部轮廓的粗线条;另一层神经元会关注五官之间的区域,例如眼睛到嘴巴的距离;还有其他神经元会负责观察耳朵的形状。藉此,该算法可判断出这是不是一张人物照片,甚至看出这人是谁。


“在大多数计算机视觉任务当中,神经网络都能轻而易举地生成最佳算法,”腾讯优图实验室杰出科学家贾佳亚说道。腾讯总部位于中国深圳,是互联网服务和产品、娱乐及人工智能的全球领导者。



像人工神经网络一样,计算机视觉技术工程师也在试图模仿人类视觉系统的运作机制。但是机器比人更有优势的一处是,它不需要像人类那样依赖可见光,还能使用传感器更清楚地看到世界。


“在人脸识别、图像分类等众多任务中,计算机视觉能比人类视觉完成的更优秀。但在其他需要推理的任务,计算机视觉还有很长的路要走。”贾佳亚表示,“人类能轻易明白物体彼此之间的关联,我们看到一张图就能编出一个故事。但计算机还远不能达到这种程度的理解能力和想象力。”


随着计算机视觉技术的不断发展,它将会带来更多新的发现。计算机视觉和 ai 都处于各自发展的初始阶段,还有很多东西值得探索。


计算机视觉技术的进步可能会推动ai 的迅猛发展,把科幻小说的情节全部变成现实——比如无人车、机器人管家,甚至远距离太空旅行。


在实践中学习:ai 的工作原理


跟大多数 ai 系统类似,计算机视觉需要学习浩如烟海的数据。研究人员查阅数据并根据其特征仔细为数据添加标签,这些特征就是他们希望 ai 去理解的东西。


就计算机视觉的任务而言,研究人员会收集成百上千的照片用于分析。加标签的数据会成为范例,据此训练 ai 进行分类或寻找规律。为了测试 ai 的学习效果,研究人员会展示新的、未加标签的图像,测试其是否能够正确分类。


除了要在收集、标注和筹备庞大资料的工作中投入人力外,另一个重要障碍就是运行训练算法需要的大量计算能力。


费用低廉的在线服务,让研究人员可以在云端训练算法,而无需为强大的计算机投入数千美元,不过,要得出训练结果仍需数小时甚至数日。


对着镜头微笑:图像和视频识别

 

人工神经网络领域最重要的进展之一出自 imagenet。imagenet收集了 1400 万标签图像并于2009年发布。


imagenet挑战赛要求参赛者设计一个能够跟人类一样对照片进行分类的算法,但一直没有出现获胜者。直到2012年,一个使用深度学习算法的参赛队伍取得了显著优于以往尝试的结果。


人们与计算机视觉产生交互的最常见的几种方式包括图像自动标记和拍照面部识别等,都是基于imagenet获胜的技术。这些应用有助进行网上购物可视化搜索、自动标注社交媒体照片等特定任务。


除了图像识别外,这项新科技也推动了照片编辑技术的发展。图像分割算法是计算机视觉的组成部分,可以帮助机器将一张图片分成不同的部分,例如识别背景和前景中的人物。用户可迅速编辑照片,达到专业修图的效果。


视觉识别能力目前也应用于视频。计算机视觉算法可以查看摄像机的视频流,并且标记重要部分,这样人们就无需反复回看长达数小时的视频。


了解视频中人物的情绪是一项研究人员正在开展的工作,不过有些机构已经率先采用了这类技术。例如坐落在中国东部浙江省的杭州第十一中学,正在尝试用摄像头追踪学生的课堂行为,这些摄像头被称为“慧眼”。



让机器人拥有正常视力

 

将2d 图像转化成3d 数据,带来了一系列不同的挑战以及众多的新机遇。给机器人赋予计算机视觉就是一个正在展现出前景的领域。


机器人在 20世纪 60年代开始投入制造业使用,这些装置可以提升重物,执行重复性任务,并且可以一次进行数小时的精确测量,从而轻松地胜过人类。


斯德哥尔摩 kth 皇家理工学院的机器人学教授 danica kragic 说:“这一领域始终关注的是建造出那些可以完成人类无法完成任务的机器人。”


kragic表示,因为人类有40% 的大脑致力于处理视觉信息,如果要创造能够模仿并参与我们世界的机器,了解它们在多大程度上需要视觉信息是非常重要的。“我们人类在做任何事情时都会自然而然地使用视觉反馈,” kargic说。


能够处理视觉信息的机器可以在工厂中完成更复杂的工作,甚至进入了我们的家庭。某些技能(例如,拾取会因压力而改变形状的柔软物品)对机器人来说仍然是遥不可及的。


这是因为人类在观察时,获得的不仅仅是视觉信息;我们还会获得有关物体物理属性的线索,以及与之交互所需要的物理知识。机器需要能够收集这类信息,才能像人类一样毫不费力地穿行在物理世界中。


“在五官感觉当中,视觉是最重要的,因为它赋予了人类理解这个复杂世界的能力。”贾佳亚说,“同样地,计算机视觉就是为了让计算机能够像人类一样观察环境并能跟环境互动。”


赋予机器人能够更好地了解世界的传感器是该技术的下一个迭代,它可能让机器人完成在今天尚无法实现的任务。

    1
标签:超越腾讯
  1. 上一篇:
  2. 下一篇:
自媒体微信号:pp00扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. no.1 中国男女比例2019(最新中国男女比例揭晓)

    人口地理学主要研究一定历史条件下的人口分布、人口变动、人口构成(年龄构成、性别构成等)、人口增长的空间变化,以及与自然和人文环境相

  2. no.2 一线女星,章子怡只能排第5?

    原来外表光鲜的当红女星,背后竟是这些不为人知的辛酸!

  3. no.3 屌丝男被女主播,拉到洗手间...

    色漫画:在旅馆打工的屌丝男主,无意间撞上了“血红色的月亮”,从此他的人生发生了巨大的变化...第1话 你是谁

  4. no.4 蒙牛纯牛奶怎么样,蒙牛和伊利哪个质量好?

    看哪种奶好,主要看一下三点: 1、看配料多少: 配料表中的配料越少越好,从下图可以看出,纯牛奶配料最少,只有生牛乳,其次为有机奶,配料

  5. no.5 女生迷途知返

    污漫画:继母所生隐居不出的妹妹,迷途知返的哥哥,当父母双亲身亡后,二者又如何将这复杂的关系进行下去?第1话

  6. no.6 正能量第1章 孤独的爱第2章

    正能量第1章 孤独的爱第2章 被威胁了由于微信篇幅限制,只能发到这里啦! 点击下方阅读原文,后续剧情高潮不

  7. no.7 【独家】“先锋系”水落石将出 旗下金融机构或面临风险处置

    这家类“明天系”、“德隆系”的民营金融控股集团,在复杂隐蔽的大量关联交易之下,诸多投资失败,核心上市公司股票被沽空,财务危机爆发,

  8. no.8 实录:100位瘾者的自述

    来人间走一趟,要晒晒太阳,和心爱的人,走在大街上。

尊龙凯时平台入口 copyright 2023.皮皮自媒体资讯站,让大家及时掌握各行各业第一手资讯新闻!

网站地图