人民网
人民网>>知识产权

13项发明专利 人脸识别技术突破不用再“立定对脸”

2015年07月23日09:18 | 来源:解放日报
小字号

普通的金属框眼镜、普通的细条纹衬衫、瘦瘦高高。见到朱珑,第一印象——典型IT 男。

1978年出生的他,说话也是IT男特有的直白:“对,就是这个意思”;“不,不赞同”。

也就是在这个IT男带领下,一家名叫依图科技的创业企业,不声不响,获得了真格基金创始人徐小平100万美元天使投资,又用不到三年时间悄悄带上了“全球唯一能同时精确识别人脸和车辆”的头衔,随后完成了红杉资本领投的A轮融资,估值差不多千万美元。

人脸识别,那么有诱惑?

“人脸识别”有多神奇

踏入依图办公室的那一刻,就能知道这家公司主打人脸识别:一个高挂的摄像头捕捉着每个来访者的脸部,迅速与公司人像库中的照片进行比对,一两秒钟就能判断出来访者究竟在不在人像库中。记者注意到,这一人脸识别系统并不需要被识别者立定或摆正脸部,而是完全由机器自动捕捉动态的人脸;即便是一个低头的角度,系统也能作出判断。

朱珑介绍说,这是一个被动式的人脸识别系统,可以应用在公共场所的安保工作中,系统能自动对人流的脸部进行搜索、辨别和排查,并能根据排查要求及时发布提醒。在第53届世乒赛以及去年的珠海航展中,都应用过这套系统。

依图的另一研究方向是计算机自动进行车辆识别,办公室一台电视在播放装有识别系统的摄像头记录的监控视频:每一辆被摄像头捕捉到的车辆被打上框,旁边有文字迅速显示车辆的品牌、车型、牌照;一旦发现有车辆违章调头,说明文字也立刻跳出提醒。识别系统还同步记录了车流量。

但车辆识别并不仅仅是为了记录车流量,还能帮助警方打击套牌车或实现“以图搜车”。朱珑解释,车辆识别也可以看作是“车脸识别”,计算机通过对车辆品牌、型号、颜色,乃至车辆挡风玻璃上粘贴的各种标志的数量、位置,可以把每一辆车看作一张独一无二的“脸”。如果将摄像头捕捉到的“车脸”与车辆登记部门提供的数据比对,就能自动发现路面上的套牌车;如果警方破案时需要对没有车牌号或车牌号为虚假的车辆进行跟踪时,这一技术能帮助迅速找到目标车辆。

其实,人脸识别并非全新领域。去年,马云在德国汉诺威电子展上用“人脸支付”网购了一张邮票,让人看到“原来自己的脸就是最好的账户密码”;被众多网友追捧的互动网站how-old.net,用的是微软的人脸识别技术,能够对网友上传的照片进行性别、年龄等判断。还有腾讯的天天P图,用人脸识别技术帮助用户自动美容;百度的“识图”应用同样是人脸识别技术,帮助用户从海量图片信息中找到相似的那一小部分……

行业欢迎“用技术说话”

当然,人脸识别远非吃饭付个钱、上传照片测个年龄等那么简单。之所以BAT、微软等行业巨头都参与角逐,是因为该技术属于最新最前沿的人工智能领域,在无需过多人工干预的情况下,就能在城市管理、公安侦测、金融安全领域发挥巨大作用,应用场景广阔。比如,人脸识别可以对人口的流动进行有效监控,“车脸”识别则能自动监督车辆规范行驶,还有金融领域的远程开户、无卡无密交易等,也需要人脸识别。

虽然人脸识别有很多高深的技术指标,但简而言之,市场对两个字最看重,那就是“快”和“高”——人脸捕捉速度要快、识别速度要快、识别准确率要高。即便是新公司,只要识别的速度够快、结果准确率够高,市场仍旧会给予机会。比如马云“刷脸支付”背后的人脸识别技术,其实并非阿里巴巴的原创,而是来自合作伙伴Face++,后者也是一家年轻的本土创业企业。

换句话说,人脸识别技术的兴起,不仅在识别人、识别车,其实也在识别究竟哪些企业真正能“用技术说话”。

依图的发展,也是对人脸识别“用技术说话”的注解。

追究起来,朱珑算得上霍金的“徒孙”,因为在加州大学洛杉矶分校(UCLA)读统计学博士时,导师正是霍金的得意门生艾伦·尤尔。艾伦·尤尔是最早一批介入计算机视觉领域的专家之一,所以朱珑的研究方向也是计算机视觉的统计建模和计算研究。博士毕业后,他又在麻省理工学院人工智能实验室担任博士后研究员。但2012年,朱珑决定回国创业,理由很简单:“想让自己的理论知识能用起来。”他找到了高中同学、当时在阿里云担任技术总监的林晨曦,后者同样对人工智能感兴趣。两个年轻人一拍即合,一个回国、一个辞职,共同创立了依图科技。

但刚成立的依图只有朱珑和林晨曦的理论功底和技术力量,缺乏相应的产品。为了开拓市场,朱珑动用了自己在国内所有的人际关系,最终只获得了在某个公安系统会议的茶歇时间与一名负责人交流3分钟的机会。这名负责人看到他递上的名片就泼了冷水:“名牌大学的博士、教授、留学生我见多了,光说没用。”朱珑能够给出的回答只是:“您要什么就说,我就给您做;如果做不到,我也会告诉您。”最后的交流结果是,对方愿意让朱珑试一试计算机车辆识别系统,因为当时计算机的车辆自动识别准确率不到30%,对方希望提升到70%。

好在“霍金徒孙”真有两把刷子,在接到“任务书”的两个月后,依图第一套车辆识别系统诞生,识别准确率达到了90%。依图也由此获得成立后的第一单业务。

在发展中,依图靠的还是“用技术说话”。苏州公安部门用依图的人脸识别系统,将全国在逃犯罪嫌疑人库内的图像与苏州1300万总人口的图像进行自动比对。系统用不到1天时间对25人给出了预警。经过人工甄别,有17人被确定为嫌疑人,后9人排除嫌疑。在锁定的8人中,有5人离开苏州,其余3个在苏州的嫌疑人则被一举捕获。这一尝试,让苏州公安部门对人脸识别技术的高效率大为惊叹;对企业来说,则看到了“用技术说话”的未来。

投资人爱“低调的腔调”

人脸识别行业欢迎“让技术说话”,依图也不乏各种技术成果:发明专利有13项,包括基于图像的车辆品牌识别方法和系统、一种嫌疑套牌车捕获方法、一种基于局部视觉特征的精确比对方法、一种道路拥堵检测方法等,此外还有9项软件著作权。但记者留意到,朱珑并不主动与记者讨论技术,只有问起了,才简单回答一二。他解释说,就人脸识别而言,“能用公众理解的指标评价的技术,都很容易被替代,行业竞争其实是在公众看不见也看不懂的地方。”至于依图公司在行业中的位置,朱珑的自我评价很有IT男个性:“别人用的都是人工智能里的‘深度学习’模式,但我们没有采取这种模式——懂的人一眼就能明白它的价值。”

事实上,比起互联网里的其他领域,有关人脸识别的信息相对较少,直到这一两年时间才逐步受到公众关注。在此之前,不论是公众还是投资人,对人脸世界的了解度并不高;即便是行业巨头,也很少谈及人脸识别。原因很简单:一是技术不成熟,拿不出手;二是各家都把包括人脸识别在内的人工智能技术作为“秘密武器”,谁都不愿被竞争对手抢占先机,很少主动曝光。此外,人脸识别的技术要求高,大部分技术人才又都比较低调和务实。

于是,在涌动着“一个商业模式可换来数百万投资额”的互联网创业圈中,人脸识别成为另类的低调存在。

这种行业氛围,反而为依图、Face++这样的技术型创业企业提供了专注的创业环境。当其他互联网创业企业在吹捧商业模式、攀比公司估值、乃至“烧钱”抢占地盘的时候,选择人脸识别技术研发的企业仍有机会在喧闹的行业中,安静地从事研究,为一鸣惊人积蓄能力。

但也有投资人早早看到了这种低调的腔调。

作为依图的天使投资人,徐小平接触公司时,正是朱珑和林晨曦没有产品、没有商业模式、只有理论和技术的阶段。照理说,这是很难说服投资人的。但打动他的是两个年轻人“改变世界”的梦想以及IT男特有的朴实态度。徐小平围绕“计算机视觉”这一他完全不了解的领域,与朱珑和林晨曦足足交流了十几个小时,从下午茶到晚饭再到夜宵,最后决定投资当时真格基金总资金的7%、即200万美元,支持依图发展。可戏剧性的是,这个投资额遭到了朱珑的讨价还价:“100万美元就够了,我不想卖公司。”

即便到今天,朱珑也不觉得拒绝徐小平一半的投资额有什么遗憾。“创业还是要有一点梦想,我们的梦想不是销售额多高、规模多大,而是让计算机视觉帮到人类,给世界带来一些变化。”

人脸之外的“识别”

随着交流的深入,记者发现,依图的员工并不是只会埋头写代码的 IT 男,他们也会对一些细节特别注意。在依图的发展中,除了识别人脸、“车脸”,其实也在对上海的创业氛围进行“识别”。朱珑们的一些想法,或许能引来其他创业者的共鸣。

比如,被问及为何选择闵行区虹桥镇德必易园作为办公场所,朱珑的答案居然是一个水槽:“你看,我们有独立的水槽,围绕水槽有了公共厨房和餐厅,这样员工的伙食选择面可以广一些,生活能够方便些。”

他解释,看过不少写字楼,虽然硬件条件不错,有的还有创业扶持政策,但太呆板,不适合加班频繁的技术性的创业公司——一个楼层只有厕所有水龙头,洗个碗还得到厕所间;中央空调确实舒服,但开关都有统一时间,加班用空调还要支付额外电费,成本太高……所以,当看到德必易园几近毛坯却可以拥有独立水槽的办公室时,朱珑很快做出决定:“就是这里,和硅谷的创业空间很像,看起来简单,却能自己作主。”

还有的园区,各种扶持政策,包括补贴租金的、鼓励创新的,送上门的不少。但依图最终并没有享用,不是因为没有资质不够条件,而是没有完成申请表格。“几张表似乎填起来很快,可说实话,我们真没时间填。作为技术型创业企业,我连商业策划书都没有写过,和投资人、客户见面,也是面对面交流,几乎不提供文字材料。”对于那些“求贤若渴”的创业园区,或许也能从中获得启示:扶持创业创新的政策在落地过程中,手续再简单一点,给企业的实际帮助可能更大。记者 任翀

(责编:马丽、赵竹青)

分享让更多人看到

返回顶部