美科学家“训练”电脑分析录像内容
时间:2017-12-08

  科学网 - 美国科学家“培训”计算机视频内容分析

  模式识别最常见的形式是识别指纹。点击

  保罗制造了可以观看视频的机器人

  电脑已经能够帮助人们观看视频!最近,加利福尼亚理工学院的科学家们训练计算机自动分析录像中的果蝇战和求偶行为,开辟了大规模研究基因控制行为的新途径。

  1基础工作

  电脑将观看视频

  这个程序允许电脑自动检测一个半小时的果蝇之间的相互作用的视频,自动描述一个新培养的果蝇组的行为模式,大约半小时,人类做同样的工作。 100个小时。

  该项目由加州理工学院电气工程教授Pietro Perona和该学院的生物学教授David Anderson共同主持。

  安德森说:每个人都想知道基因如何控制行为,但是如果你想对复杂的社会行为(如侵略和求爱)进行遗传分析,你需要精确的方法来衡量或计算这些行为。

  过去,唯一的办法就是让学生一遍又一遍地看视频,每次都是一次行为。用这种方法计算大量果蝇的飞行:刺中,扭动,追逐,包裹,交配,甚至决定一只苍蝇的身体和翅膀的动作,当它遇到另一只苍蝇时,学生反复观看视频,每次确定一对苍蝇的行动。如果确定遗传变异对攻击性行为的影响,我们需要分析大约2000对果蝇,如果没有研究生团队,我们根本做不到。

  那一刻,保罗和博士后Heiko Dankert及时出现了使用机器视觉和其他新的工程成就来训练计算机来查看和识别攻击和求爱。因此,一个自动系统可以在几分钟内计算出相互作用的果蝇的各种行为。

  Paolo说:机器视觉已经使用了多年。通过选择现有的机器视觉技术,我们可以建立一个比过去已经验证的更有效的系统。

  2个发展目标

  研究人员的最终目标

  这个团队首先喂食了果蝇行为的计算机专用视频,例如推,,苍蝇首先缩短了身体,然后突然自己跳起来,从其他苍蝇跳起几厘米。

  当电脑抓住这些细节时,研究人员将同一个视频机器分析的结果与手动分析的结果进行比较。安德森说:我们必须看看电脑有多少次被捕,有多少次我们错过了。通过查看计算机发出的错误,我们可以更好地细化描述以创建更准确的系统。最后,这个自称自动程序比手工统计更准确!

  然而,Piperlana说,在以前的实验中,实验视频中只有100到1000个图像,而在当前的实验视频中只有10万个。以前的实验在计数上犯了很多错误,我们犯的错误很少。可以给出非常准确的统计。

  安德森说下一步,他们将统计方法的自动行为扩展到大鼠实验。哺乳动物比苍蝇更模糊,机械识别的可能性更小。你为什么要这个费用?因为科学家不只是想了解基因对果蝇行为的影响,他们最终还得了解基因对人类行为的影响,所以一定要研究小鼠的行为。

  皮罗说:我们的视觉系统可以告诉我们很多关于别人在做什么的信息。谁在吃饭,谁在殴打,谁是脸红,谁进入女孩或钩男孩,我们的计算机视觉领域的最后目标是设计一个机器,可以检测和理解人的动机和行为。为了实现这个目标,我们需要从简单的生活形式开始。安德森向我展示了果蝇的行为多么丰富有趣,所以我们开始合作。

  Andersson补充说:“现在我们可以从这些视频中榨取大量信息,帮助我们理解控制果蝇社交互动的因素,使我们现在可以研究以前不可能的事情。

  3相关技术

  模式识别是关键

  机器视觉是用于工业生产和其他实际操作的计算机视觉方法。计算机视觉主要侧重于基于计算机的图像处理。机器视觉通常需要数字输入/输出设备和计算机网络来控制其他设备,例如机器人手臂。机器视觉结合了计算机技术,光学,机械工程和工业自动化。机器视觉可以做的更简单的事情包括快速验证罐头的生产,是否可以接受针头,快速读取零件上的代码,找到落在机器后面的螺丝等等。在果蝇的情况下,机器视觉的重点仍然应该放在计算机视觉领域。

  机器视觉与两个概念密切相关,一个是计算机视觉,另一个是图像处理。三者紧密相连,两者之间的界限十分模糊,经常混淆不清。事实上,在果蝇研究中训练计算机的例子中,所有三个领域的结果都是至关重要的,研究人员说机器视觉在采访中是一个简单的陈述。

  图像处理是指利用计算机对图像进行分析处理,达到预期效果的技术。图像处理包括图像压缩,图像增强和修复,以及这三部分的图像匹配,描述和识别。北京理工大学模式识别系副教授吴晓兵表示,为了实现机器视觉,首先要对图像进行增强,去噪和定向滤波。在好莱坞电影中,我们看到代理商迅速将模糊的视频快照转换为肖像的清晰写照。吴小兵说,这是对图像的锐化,是一种图像处理。当然,电影夸张机器的能力,锐化只能部分提高画质,不可能达到如此好的效果,图像处理的前沿是模式识别,在一个定义中,模式识别是一种技术通过过去的知识对数据进行分类,或者从模式中提取常量。

  听起来很难理解,但其实模式识别在我们的生活中不时需要使用,有一个简单的点,比如一堆豆找到破豆,也比较难,比如说加入在接待人群中找到Object。可以说模式识别是一种基本的人类智能,但是让机器学习这个技能可以是后劲。吴小兵说:模式识别是告诉你目标图像是什么。

  4实际应用

  脸部识别是典型的

  人脸识别是最典型的模式识别。吴小兵说。首先要做的是在一个图像中找到脸部。脸部一般都是椭圆形的,机器容易识别,然后找到脸部,眼睛,鼻子,嘴巴等器官。这些器官与其他东西的对比是不一样的,而且位置相对固定,所以很容易找到。即使脸部有些模糊,或者角度稍微有点儿,机器也可以识别出来。

  下一步是确定谁面对这张脸。该机器可以通过矩阵运算比较图片上的人脸与目标库的人脸的像素相似度,并与选取的特征点进行比较。但是,现在人脸识别并不是特别广泛,除了奥运安保等特殊场合以外,这种技术还不常用。这是因为面部比较复杂,识别图片比较杂乱时经常被误识别的情况,比如把树皮误认为人脸等,并不容易。事实上,这种现象经常发生在人类的视野中。至于美国着名戏剧“越狱”,现在还不可能通过卫星图像来确定一个人的脸部,相比之下,指纹识别是一种较为简单的模式识别。人类发现识别人脸比识别人类更容易识别人的指纹,但计算机视图是相反的,所以指纹被广泛使用。

  那么,电脑能否识别出人们的表情呢?吴小兵说,这个技术在建立人脸各种表情数据库的前提下,对于一个特定的人来说很容易实现。然而,用机器识别任何人的面部表情仍然是不可能的。

  至于加州理工学院对机器视觉的使用,吴小兵说这不是太困难。计算机可以通过比较一幅图像和最后一幅图像来确定运动的趋势,这在一个受控的实验室环境中是非常容易实现的。北京理工大学已经实验性地开发了一个足球视频搜索系统,可以自动找到分数段,使用类似的技术。

  机器视觉的未来是什么?吴小兵说,未来想要达到的是机器对图像的理解,比如机器人看到楼梯的时候,理解它们之间的空间关系,决定是否上楼,当然这已经是已经包含人工智能组件。