分享

《最强大脑》人机大战最后一场来了 谁会笑到最后

 昵称22998329 2017-01-21

今晚,在江苏卫视的综艺节目《最强大脑》中,百度机器人“小度”将和该节目的明星选手、擅长微观识别的王昱珩一起进入人机大赛的第三场,也是最后一场。首次出场就以“辨水”惊倒全场而闻名的王昱珩,半年前其实就和与蚂蚁金服的人工智能“蚂可”较量过。那场比赛,人类取得了胜利。但显然,最近频频展现其人工智能技术的百度这次是有备而来。前两场比赛,“小度”以一胜一平的成绩领先人类。

两周前,《最强大脑》第四季第一期,也就是“人机大战”第一场比赛播出后的第二天,百度深度学习实验室主任林元庆就发了一条朋友圈。他提到,《最强大脑》节目组对人机大战比赛有所删减,在第二部分“小学毕业照”的3局比拼中,小度错了1局,人类选手错了2局。在第一期的5局比赛中,小度一共答对4局,王峰答对2局。林元庆在朋友圈里表示:“从科学实验的角度,希望有一天能让大众看到完整的无删减版。”

数月前,《最强大脑》栏目组带着图片识别和声纹识别的节目设想和8组试验数据来到百度,邀请“小度”参加新一季节目的人机对战。

从2013年开始,百度设置了基于人脸识别功能的公众人物图片搜索引擎,之后又在人脸识别国际测评中获得第一名。在《最强大脑》带来的8组“小学毕业照识人”数据中,百度的人工智能机器答对了7组。

在这之后,针对《最强大脑》人脸识别项目,百度搜集了200万人的2亿张照片训练深度神经网络,以夯实人机大战比赛的技术基础。第一场比赛的难度在于,要从20到1000个人中完成一个人和其童年照的匹配。儿时毕业照的分辨率不高,艺人带浓妆上台,有的甚至可能经历过整容,这些困难,无论对于机器还是人类都是不小的挑战。在比赛前,针对第一期跨年龄识别的挑战,百度又搜集了几千人的跨年龄数据,对机器优化。

“在训练模型时,我们会在脸上取重要的特征,这些特征随着年龄增大,不会有很大的变化。”林元庆对《第一财经周刊》说。

计算机通过学习一个非线性映射函数,把图像空间投影到一个128维度的特征空间中。深度学习要实现的是,对于同一个人的两张照片,它们会映射到这128唯独特征空间的两个点,不管年龄差距有多大,这两个点都会离得很近;但对于不同人的两张照片,即使他们年龄相近,这两个特征点都会离得足够远。百度下一步希望能在更大的年龄跨度中实现同样的效果。

而在第二期的声纹识别比赛中,据林元庆透露,虽然“小度”在三局比拼中只答对了最后一道题,与人类选手打成了平手,但它背后工作的两个计算机模型,各答对了两道题。

这场比赛,百度使用的是判别模型(Discriminative Model)和生成模型(Generative Model),前者答对了第一题和第三题,后者答对了第二题和第三题。两个模型在判别声音时,会对每一位歌唱演员的声音做出信任度评分(Confidence Score),最后将两种模型的评分相加,得出评分最高的结果。

生成模型建模更积极,它将一段语音分为内容和声腔两部分,在比赛中提取与声腔有关的信号,缺点在于比较敏感,容易受噪声影响,需要判别模型的优势来补足——判别模型不关心声音是怎么产生的,更善于抽取人跟人之间不同的声音特征。

在前期测试中,百度发现同时使用两种模型比单独使用一种模型具有更大的优势。但比赛的难点在于,合唱团的专业歌者在长期的训练和合作中,已经形成了默契,虽然说话时不一样,但唱起歌来声音却能趋于一致。再加上所给的样本声音只是片段,时长过短,也给比赛增加了难度。

虽然节目中呈现出“小度”在声纹识别方面错误率更高,但在人工智能领域,声纹识别其实比图像识别的技术更完善。

不过,目前有着更广阔商业前景的还是今天将要比拼的人脸识别。

对于很多人来说,印象最深的也许是支付宝人脸识别登录账号的功能。林元庆也认为,人脸识别技术对于互联网金融有重要的意义:“与实体金融不同,互联网金融在操作过程中,要知道手机或电脑前的人是谁,如果不能做准确的身份判定,互联网金融很难继续普及。”

除了金融领域,门禁系统是百度人脸识别技术希望输出的另一个应用场景。这个系统已经在百度科技园的大楼中投入使用。百度的5万名员工中,已有1万名注册了门禁系统。注册员工的人脸信息记录在数据库里,员工经过门禁闸机时,不需要工卡,单靠刷脸,就能进入大楼。

这个闸机的难点在于,既要让员工在进出门禁时有流畅快速的体验,又要精准识别非注册人员,在技术上还有很大提升空间。这样的闸机样本乌镇也有一个。

目前,火车站、景区等场景基本上使用的是1:1的人脸识别或指纹识别技术。这意味着,需要通过身份证和公安系统提取游客的人脸和指纹信息,或临时录入指纹比对。百度门禁系统使用了1:N的人脸比对,不用身份证提取,直接从储存了N个人脸的数据库中寻找镜头前的1个人脸。

“用1:N人脸对比的方式通过门禁,不仅省去了掏身份证的麻烦,速度还更快。”林元庆介绍,“刷身份证大约需10秒一个人,而人脸识别只需1到2秒”。他同时也坦言,要保证人脸识别技术在场景应用中的安全性,对技术的精度有更高的要求。百度将在今年4月推出并投产这样的闸机,今年下半年,在全国30多个景区内推广。

刚刚成立的百度AR(增强现实)实验室,是从百度深度学习实验室(IDL)独立出来的第二个部门。第一个部门——无人驾驶事业部于2015年12月宣布成立。百度希望通过这样的机制,在实验室中创新,当技术相对成熟、市场比较广阔时,将一个特定的方向拿出来,让这一方向的新技术有更大的拓展空间。“人脸识别很有可能是下一个从深度学习实验室孕育出来的方向。”林元庆说。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多