360首次披露人工智能路线图:端上智能化+硬件自主学习 6501

在4月15日举办的2016中国企业服务峰会上,国际知名人工智能专家颜水成教授就人工智能现状和未来做了专题演讲,这是他担任360人工智能研究院院长、首席科学家之后的首次对外演讲。本次演讲首次向外界披露了360在人工智能领域的三大神秘进展。

  以下为演讲实录:

  非常高兴有机会和大家分享360人工智能方面的一些状况和进展。

  360是一家从安全起家的互联网公司,在过去的11年中,安全一直是360最基本的基因。

  因为互联网时代的发展,我们可以看到360的业务正在从电脑安全逐渐拓展到手机安全、企业安全领域。并且,360也在从传统的线上安全,延伸至线下安全,在此背景下,360逐渐进入了泛安全或者是大安全的时代。

  线下安全业务360主要有三个方向的考虑:

  第一、面向儿童安全,主要是可穿戴设备儿童手表业务;

  第二、关注家庭和家人的安全,主要是关注智能家居及其安全问题;

  第三、关注出行的安全,主要是跟车辆有关的各种安全问题,比如说信息安全,车联网的安全以及驾驶的安全。

  当所有东西合在一起,我们希望让每个人都有一种安全的感觉。

  在这种泛安全策略上,公司慢慢地希望把人工智能作为安全的磐石,希望在这种大安全的前端需求下,逐步打造面向大安全的安全智能。

  对一个公司来说,如果希望人工智能有很好的应用,那么有三个要素非常关键:一个是需要有大的标注的数据,另外一个需要有人工智能的前沿的算法,还有一个是需要有大的计算平台。

  总的来说,360的人工智能有两个阶段,第一个阶段我们希望能够实现从0到1,也就是说希望能在不同的产品线上有一些使用。第二个阶段我们认为是从1到N,意思是希望这些人工智能技术不只是可以开始用了,也可以产生一定的技术的意义。

  360当前的业务产品分为两种,一种是互联网软件产品,另外一种是面向线下安全的智能硬件产品。

  为了让这些产品更好的智能化,过去一段时间360已经在人工智能方面着手进行研发工作,比如说人脸识别方面我们做了不少工作,我们在车辆和人体的分析方面也有一些比较好的进展。其它应用领域,包括语音分析以及面向企业安全网络流的分析,我们都有涉足。

  360人脸识别技术已经进入实际应用

  人脸识别技术在我们很多业务中是非常重要的,比如说360智能摄像机,它需要有很好的监控能力。比如说识别家人和陌生人,以及识别他们的行为是不是正常的。人脸分析方面,我们做了很多的研究,在过去半年我们对这些技术进行了很好的打磨。因为360的人工智能团队在算法精构方面有很好的经验,所以在过去半年里,我们主要是如何让以前高性能的算法快速地跑起来,也就是说能够以非常快的速度在产品中使用起来。

  在人脸检测方面,我们主要解决两个问题,一个问题是人脸有很多的方面,比如说遮挡、模糊、姿态和光照。团队当前主要是针对有遮挡的脸,提出了专门的模型。同时在加速方面,也保证了人脸检测能在当前的产品,比如360智能摄像机上的运用有比较好的应用。

  在关键脸检测方面也是人脸检测的非常关键的一步,我们的算法上主要是想解决人脸上有很多点被遮挡的情况。CN的模型加上STM,人工智能做这种点的检测就可以做遮挡的解析。当前在300W的人脸分析上也取得了非常不错的结果。

  人脸识别领域目前的发展非常不错,但是当前人脸识别的场景化非常关键,比如说,有的是针对互联网图片上的人脸识别,有的可能是对互联网金融方面拍摄的照片和身份证照片的匹对。这两种场景和360的应用场景有比较大的差别,我们比较关心的是在360智能摄像机上,在家庭摄像机中的人脸识别,做场景化的定制,是人脸识别非常关键的环节。

  图像识别在车联网领域的应用

  图像识别在车联网领域的应用也是360在关注的,我们做车辆和行人识别的团队在物体的检测和识别方面都取得了很不错的成绩,他们曾在号称计算机世界杯的竞赛上五年内七次获得冠军和亚军奖项。

  经过团队对图像识别算法进行打磨,由于模糊问题无法识别的比例已经从74%降低到了9.6%。在人和车非常复杂的情况下,我们已经可以借助高清摄像头对路上的车和人有比较清晰的定位。

  在360行车记录仪上的应用就是希望通过行车记录仪的人工智能技术,为用户提供辅助驾驶。具体来说,就是通过由行车记录仪等设备拍摄下的行车场景,实现对周围物体的识别,并实时将照片中的物体分为多个类别,例如路面、路标、行人、建筑物以及骑自行车的人等,辅助汽车进行自主判断。

  语音云识别错字率在1%以下

  刚才说视觉感知方面我们有了一些进展,因为我们要面向智能家居。但对于智能家居来说,只是视觉感知还是不够的,因为不仅要能看得到,还需要听得懂。

  因此我们在语音识别和语义理解方面也有动作,比如说我们一个系统部的同事开发了一个系统,在当前保证云识别的错字率能降到1%的情况下,它能比较好地支持语音输入场景,比如说语音搜索和基于语音的对话。

  另外一个也是今后学习的方向,就是语音唤醒。因为对于智能硬件,像智能手表、智能摄像机还有其它智能设备来讲,语音唤醒非常重要。

  任意网络数据流或将可识别

  在大数据方面,我们也有已经很好的积累和铺垫。比如说我们企业安全部的同事,他们用堆栈式的服务,实现对网络上的数据流进行协议的识别和应用的识别。比如说在网站上随意截取到一个网络流,是不是可以预测出它是用什么样的协议发送的,是不是可以预测出它是用什么样的运程发送的。这种基于互联网的信息是非常有价值的。

  

360人工智能研究院院长 颜水成

  360人工智能的未来

  人工智能,尤其是机遇深度学习的人工智能,目前由于训练平台已经比较普及,所以实现从0到1的应用已经不难。对于360来说,未来人工智能的发展有两个重点。

  发展端上智能化的两个方向

  第一个是我们将重点发展端上的智能,因为端上的量肯定比云上的量高很多,而且以后会不断出现新的端类产品。

  要发展端上的智能化有两种方式,第一种方式是可以用编译的专用芯片。但在中国当前智能硬件低价的大环境下,如果用编译的专用芯片这种方式,总的来说肯定会让产品的价格有大幅度提升。

  我们认为编译的专业芯片绝对不应该是唯一途径,也就是说要在端上真的建立技术壁垒,还需要在算法上真正意义上降低计算量。在有损失的情况下减少计算量,在工业级上应用的可能比较少,但是在端上微损是可以接受的。

  另外一方面其实这种端上的小的模型,可能它的精度上会有损失,但是如果企业的拥有很多大数据的话,那么大数据在某种程度上就能弥补这种精度的损失。当然,这些信息绝对不会成为技术壁垒,真正的技术壁垒是任何方向都不减少技术的情况下有精度的提升。这也是360人工智能研究院极力发展的方向,这是非常高技术壁垒的方向。

  但是我觉得对于中国的这种特定的环境是非常重要的,也就是说奔跑在CPU上的编译绝对是以后端上非常重要的发展方向。

  人工智能系统自主学习

  除了发展端上的智能化,我们另外一个非常重要的方向,是怎么样让人工智能的系统具备自学习的能力。

  首先,面对很多的应用,真的是没有办法标注。比如说自动驾驶,一般的企业来说没有办法真正搜集到各种场景下的数据。如果系统在运行的过程中能够自我自主地学习、自主地搜集信息的话,那么它的性能肯定就可以逐步增强。另外一个方面,在端上我们只能有轻量级的计算,如果我们能自主学习的话,之后就可以保证在端上可以达到实时计算,因为个性化服务不是服务所有的人,这样的话小模型就有比较好的针对性。

  另外自主学习完全有自主性,一方面当一辆车在路上行驶的时候,我可以根据上下文推导出哪些是人,哪些是车,进行车辆检测。对于家庭机器人来说,现在通常机器人可能一开始应用的时候就需要负担家里所有的,但是如果能实现逐步积累一些位置检测出一个人,如果能把这些样本当做增益样本的话,机器人的性能就会更加自主地增强。

  我们的目的是希望最终这些物联网的产品有自学习的功能,最后变成懂我的互联网的产品。

  最后做一个小的总结,现在360的人工智能技术已经逐步运用到公司的很多产品中,同时也进一步证明了人工智能这种技术有很多新的产品形态值得打磨,我也敬请大家期待360有更多的人工智能的产品服务于普通的老百姓。