赵晓悦 龚曙光 追捕目标的特工逆行在人群中,目之所及,每位旅客的个人信息,不断被他的隐形眼镜识别和显示——电影《碟中谍4》中经典的一幕,让人印象深刻。 MH370迷航的第一周,当乘客持假护照登机的消息传出时,满怀猜疑的人们希望电影场景里的迅捷反应,能够出现在真实的身份认证中:从机场录像上及时辨认出乘客的脸部信息,再实时地从云端的人脸数据库内调取匹配的那一个。 现实中,马航寻人的速度无法与电影相提并论。而在此时,对人脸识别的关注,已悄然催长了汉王科技(002362)、佳都科技(600728)等数只相关概念的个股。人脸识别技术被寄望为安检加码,提高机场、车站等公共场所的安全防范水准。 这项诞生良久的技术,随着互联网化的加深,早已不再是一项孤立存在的技术,而是几大步骤上下协同的“流水线作业”:第一步是人脸检测,通俗地说,就是确定位置,找到人脸“在哪里”;第二部为关键点检测,找准五官做进一步分析;第三步才是基于大规模数据的人脸识别。 通过设备传递,人脸识别技术将过去不能被设备理解的图片信息,逐渐变成可以被机器理解分析的结构化数据,从而大大提高机器对人的了解,为人提供更准确的推荐、提高各种信息服务的有效性能。 针对这场“三部曲”,国际上分别有一套公认的评测体系,即人脸检测FDDB评测、人脸关键点定位300-W评测和人脸识别LFW评测。 过去六个月的时间里,诞生于清华校园的创业团队Face++(北京旷视科技有限公司)接连拿下了这三项检测的世界第一。3月19日、20日,LFW评测集上,Face++与facebook先后宣布获得97.27%和97.25%的性能,Face++以0.02%的优势暂时领先。 但Face++联合创始人唐文斌回应21世纪经济报道记者,“大家对人脸识别的预期到了大学生的水平,而我们所做的其实只达到了初中生的阶段。”在投资者的关注和期待下,这项技术的成熟度和商业化前景却尚待观察。 极客重返技术路 “之所以创业,一方面看自己擅长什么,一方面看什么有价值。我们学习的都与机器学习和视觉强相关,对这一块比较有把握。”清华大学计算机系2006级、2007级的本科生中,唐文斌专攻图像搜索,印奇擅于视觉识别,杨沐则在数据挖掘方面见长。 2011年,拿到人生中第一台iPhone的唐文斌,琢磨着能不能通过自拍的前置摄像头,做些有创意的产品。恰逢体感游戏机风靡之际,唐文斌约住在楼上宿舍的印奇,用视觉技术方面的积累一起做开发。“一开始没想创业,做更多好玩的东西,顺便赚点钱”,抱着这两条原始简单的想法,他们开始了第一波创造实践。 最后的成品是一款名叫《乌鸦来了》(Crows Coming)的体感游戏,玩家通过摇晃头部控制游戏里的稻草人,拦截从天而降偷食庄稼的乌鸦。这款小游戏一度冲上App Store排行榜的前五名,尽管在91助手上下载量表现不俗,但全部获利仅有270多美元。 面对没有成功变现的几十万下载量,他们打算重返技术之路。但转轨的深层原因在于兴趣本身:手游不是唐文斌和印奇的真正乐趣所在,“自己不是用户的话,玩这个是很危险的;团队的基因在技术,把技术做到最好才有成就感”。 而更为本质地说来,这几位青年人都笃信,把机器变得更加智能一定是大趋势所在。“让机器听懂语音、看懂视频,这点不会错,至于我们会成为先驱还是先烈就要再看了”印奇说,“而在视觉信息里,人脸信息是最有信息量的。”2011年,当谢尔盖·布林佩戴着Google Glass出现在谷歌I/O大会上时,他们看到新的机会正在展开。 就在Face++团队的年轻人踟蹰的6月,另一硅谷巨头Facebook宣布收购来自以色列的人脸识别技术公司Face.com,把它的核心技术团队悉数搬到硅谷,并很快关闭了应用开放接口(API)。 Face.com入口的关闭正是Face++的机会,两家公司技术原理类似,当前者被纳入巨头的怀抱,后者选择开放服务,在云端面向开发者提供技术服务,不失为一种差异化的选择。 创造者遇见投资人 当Face++的团队还在做手机小游戏时,与清华园一街之隔的联想之星已经“盯上”了这支连旷视科技公司都尚未创立的学生团队。 对于定位在早期天使的联想之星来说,与清华等高校的系统接触,发掘技术领先的项目,是投资遵循的基本路径之一。而云时代的人脸识别恰是联想之星投资副总裁刘维的重点关注领域。 刘维曾这样表述看好的理由:“一个听上去很传统的领域,随着移动设备、云端计算能力的普及和识别算法的大突破,开始真正进入了临爆点。过不了几年,人脸登录、人脸搜索都将成为现实,届时人脸将是最自然、信息量最大的入口,手机也好,新一代的眼镜、智能家庭、智能城市也好,有广阔的应用场景。” 然而,人脸识别的有效性远远比不上它在电影中神乎其技的表现。唐文斌对21世纪经济报道记者打了一个比方,“大家对人脸识别的预期到了大学生的水平,而我们所做的其实只达到了初中生的阶段”。 这项远不成熟的前沿技术,让Google、Facebook为代表的世界级团队竞相在其间一较高下。不过,选择中国学生领衔的Face++也因此有了更加充分的理由:“在偏向算法的领域,中国人有自己的优势,这也算投资跑道的一种。”刘维表示。与Face++同期,他还主导了对语音识别公司思必驰的投资。 通过唐文斌的一位学长介绍,刘维接近了Face++团队。除行业跑道和技术优势之外,联想之星的投资决策还有其他理由。刘维告诉21世纪经济报道记者,唐文斌的组织能力也是一大“加分项”:不仅自己拿到过信息学奥林匹克的金牌,在正式创业前还担任着国家信息学奥林匹克集训队总教练职务。而他所率领的Face++团队里,有20名全职员工和20位来自清华的实习生相互协作,他们当中的七人曾经拿到过国际金牌。 在联想之星的50多个已投项目中,280万人民币注资的Face++无疑是最具天使色彩的。天使投资后,李开复和创新工场以数百万美元接力了旷视科技的A轮融资。 人脸识别下一站? “你一直主张做平台,这是一个致命的问题,你为中国的开发者服务,中国的开发者又是最穷的。”在2012年黑马大赛总决赛的赛场,奇虎360总裁周鸿祎曾向唐文斌抛出三个问题,这是其中之一。 被联想之星和李开复支持的“不赚钱平台”却正好构成了Face++的一道“护城河”。被印奇称作“类人脑神经元算法”的深度学习算法是Face++与全球同行们比拼的核心战场。而这一战场的门槛,远不是有着人脸识别概念的传统公司能够轻易逾越的--在它背后,结构化大数据、庞大系统支持、与具体领域相关的算法,三者缺一不可。 从2011年9月上线至今,Faceplusplus.com平台已经吸纳了2万多开发者,这些享受免费服务的开发者每天为平台提供200多万张图片。在保护隐私、不作商用的前提下,Face++借用这些图片及其标注信息进行算法学习, 基于上述数据和技术的积累,在更加显性的层面,Face++也开始尝试一些应用的制作。为世纪佳缘设计的人脸识别场景中,用户可根据自己对另一半长相的需求,从网站的数据库中搜索相似外貌的用户。这个应用未来可以扩展向其他社交网络,甚至通用搜索引擎的数据库。 此外,Face++与360搜索达成了合作。一种试水阶段的图片搜索应用,能为360搜索的用户提供类似“美女搜索”之类的简单服务。 凭借这类针对B端的技术服务,Face++团队已开始有营收,在去年11月初离开创新工场的工位,搬到走出了小米等一批创业公司的银谷大厦自立门户。 在接待21世纪经济报道记者探访的午后,印奇和唐文斌赶往一场与某互联网巨头的会谈。随着技术的迭代突破,Face++逐渐成为更多互联网公司的业务合作甚至潜在并购对象。 “一个公司走到现在这个时点,有一定的成绩,也是危险的时刻,”对于Face++面临的现实诱惑,刘维不无审慎地对21世纪经济报道记者说道,“我们总是讨论技术如何产业化,但Face++恰恰相反;短期内能获得流量、赚到钱,却会分散应付核心技术的经历,丧失掉未来更大的商业前景。这不是我们想要的。” “我们现在做技术服务,但未来一定不是卖技术的公司。”唐文斌确定地说。他眼中的人脸识别技术,指向高度互联网化的运用场景,并能够解决人脸识别的核心需求——非配合式的身份认证系统。“如果不了解核心需求,只是做一些非常小的产品,实现不了核心的价值。”在他看来,公司的当务之急,仍是技术性能的提升。 而显然,要在中关村内述说一个硅谷式的“大故事”,这家初创公司在稳住技术团队的同时,还需要与风险投资的更多交合。 |