人民網
人民網>>知識產權

13項發明專利 人臉識別技術突破不用再“立定對臉”

2015年07月23日09:18 | 來源:解放日報
小字號

普通的金屬框眼鏡、普通的細條紋襯衫、瘦瘦高高。見到朱瓏,第一印象——典型IT 男。

1978年出生的他,說話也是IT男特有的直白:“對,就是這個意思”﹔“不,不贊同”。

也就是在這個IT男帶領下,一家名叫依圖科技的創業企業,不聲不響,獲得了真格基金創始人徐小平100萬美元天使投資,又用不到三年時間悄悄帶上了“全球唯一能同時精確識別人臉和車輛”的頭銜,隨后完成了紅杉資本領投的A輪融資,估值差不多千萬美元。

人臉識別,那麼有誘惑?

“人臉識別”有多神奇

踏入依圖辦公室的那一刻,就能知道這家公司主打人臉識別:一個高挂的攝像頭捕捉著每個來訪者的臉部,迅速與公司人像庫中的照片進行比對,一兩秒鐘就能判斷出來訪者究竟在不在人像庫中。記者注意到,這一人臉識別系統並不需要被識別者立定或擺正臉部,而是完全由機器自動捕捉動態的人臉﹔即便是一個低頭的角度,系統也能作出判斷。

朱瓏介紹說,這是一個被動式的人臉識別系統,可以應用在公共場所的安保工作中,系統能自動對人流的臉部進行搜索、辨別和排查,並能根據排查要求及時發布提醒。在第53屆世乒賽以及去年的珠海航展中,都應用過這套系統。

依圖的另一研究方向是計算機自動進行車輛識別,辦公室一台電視在播放裝有識別系統的攝像頭記錄的監控視頻:每一輛被攝像頭捕捉到的車輛被打上框,旁邊有文字迅速顯示車輛的品牌、車型、牌照﹔一旦發現有車輛違章調頭,說明文字也立刻跳出提醒。識別系統還同步記錄了車流量。

但車輛識別並不僅僅是為了記錄車流量,還能幫助警方打擊套牌車或實現“以圖搜車”。朱瓏解釋,車輛識別也可以看作是“車臉識別”,計算機通過對車輛品牌、型號、顏色,乃至車輛擋風玻璃上粘貼的各種標志的數量、位置,可以把每一輛車看作一張獨一無二的“臉”。如果將攝像頭捕捉到的“車臉”與車輛登記部門提供的數據比對,就能自動發現路面上的套牌車﹔如果警方破案時需要對沒有車牌號或車牌號為虛假的車輛進行跟蹤時,這一技術能幫助迅速找到目標車輛。

其實,人臉識別並非全新領域。去年,馬雲在德國漢諾威電子展上用“人臉支付”網購了一張郵票,讓人看到“原來自己的臉就是最好的賬戶密碼”﹔被眾多網友追捧的互動網站how-old.net,用的是微軟的人臉識別技術,能夠對網友上傳的照片進行性別、年齡等判斷。還有騰訊的天天P圖,用人臉識別技術幫助用戶自動美容﹔百度的“識圖”應用同樣是人臉識別技術,幫助用戶從海量圖片信息中找到相似的那一小部分……

行業歡迎“用技術說話”

當然,人臉識別遠非吃飯付個錢、上傳照片測個年齡等那麼簡單。之所以BAT、微軟等行業巨頭都參與角逐,是因為該技術屬於最新最前沿的人工智能領域,在無需過多人工干預的情況下,就能在城市管理、公安偵測、金融安全領域發揮巨大作用,應用場景廣闊。比如,人臉識別可以對人口的流動進行有效監控,“車臉”識別則能自動監督車輛規范行駛,還有金融領域的遠程開戶、無卡無密交易等,也需要人臉識別。

雖然人臉識別有很多高深的技術指標,但簡而言之,市場對兩個字最看重,那就是“快”和“高”——人臉捕捉速度要快、識別速度要快、識別准確率要高。即便是新公司,隻要識別的速度夠快、結果准確率夠高,市場仍舊會給予機會。比如馬雲“刷臉支付”背后的人臉識別技術,其實並非阿裡巴巴的原創,而是來自合作伙伴Face++,后者也是一家年輕的本土創業企業。

換句話說,人臉識別技術的興起,不僅在識別人、識別車,其實也在識別究竟哪些企業真正能“用技術說話”。

依圖的發展,也是對人臉識別“用技術說話”的注解。

追究起來,朱瓏算得上霍金的“徒孫”,因為在加州大學洛杉磯分校(UCLA)讀統計學博士時,導師正是霍金的得意門生艾倫·尤爾。艾倫·尤爾是最早一批介入計算機視覺領域的專家之一,所以朱瓏的研究方向也是計算機視覺的統計建模和計算研究。博士畢業后,他又在麻省理工學院人工智能實驗室擔任博士后研究員。但2012年,朱瓏決定回國創業,理由很簡單:“想讓自己的理論知識能用起來。”他找到了高中同學、當時在阿裡雲擔任技術總監的林晨曦,后者同樣對人工智能感興趣。兩個年輕人一拍即合,一個回國、一個辭職,共同創立了依圖科技。

但剛成立的依圖隻有朱瓏和林晨曦的理論功底和技術力量,缺乏相應的產品。為了開拓市場,朱瓏動用了自己在國內所有的人際關系,最終隻獲得了在某個公安系統會議的茶歇時間與一名負責人交流3分鐘的機會。這名負責人看到他遞上的名片就潑了冷水:“名牌大學的博士、教授、留學生我見多了,光說沒用。”朱瓏能夠給出的回答只是:“您要什麼就說,我就給您做﹔如果做不到,我也會告訴您。”最后的交流結果是,對方願意讓朱瓏試一試計算機車輛識別系統,因為當時計算機的車輛自動識別准確率不到30%,對方希望提升到70%。

好在“霍金徒孫”真有兩把刷子,在接到“任務書”的兩個月后,依圖第一套車輛識別系統誕生,識別准確率達到了90%。依圖也由此獲得成立后的第一單業務。

在發展中,依圖靠的還是“用技術說話”。蘇州公安部門用依圖的人臉識別系統,將全國在逃犯罪嫌疑人庫內的圖像與蘇州1300萬總人口的圖像進行自動比對。系統用不到1天時間對25人給出了預警。經過人工甄別,有17人被確定為嫌疑人,后9人排除嫌疑。在鎖定的8人中,有5人離開蘇州,其余3個在蘇州的嫌疑人則被一舉捕獲。這一嘗試,讓蘇州公安部門對人臉識別技術的高效率大為驚嘆﹔對企業來說,則看到了“用技術說話”的未來。

投資人愛“低調的腔調”

人臉識別行業歡迎“讓技術說話”,依圖也不乏各種技術成果:發明專利有13項,包括基於圖像的車輛品牌識別方法和系統、一種嫌疑套牌車捕獲方法、一種基於局部視覺特征的精確比對方法、一種道路擁堵檢測方法等,此外還有9項軟件著作權。但記者留意到,朱瓏並不主動與記者討論技術,隻有問起了,才簡單回答一二。他解釋說,就人臉識別而言,“能用公眾理解的指標評價的技術,都很容易被替代,行業競爭其實是在公眾看不見也看不懂的地方。”至於依圖公司在行業中的位置,朱瓏的自我評價很有IT男個性:“別人用的都是人工智能裡的‘深度學習’模式,但我們沒有採取這種模式——懂的人一眼就能明白它的價值。”

事實上,比起互聯網裡的其他領域,有關人臉識別的信息相對較少,直到這一兩年時間才逐步受到公眾關注。在此之前,不論是公眾還是投資人,對人臉世界的了解度並不高﹔即便是行業巨頭,也很少談及人臉識別。原因很簡單:一是技術不成熟,拿不出手﹔二是各家都把包括人臉識別在內的人工智能技術作為“秘密武器”,誰都不願被競爭對手搶佔先機,很少主動曝光。此外,人臉識別的技術要求高,大部分技術人才又都比較低調和務實。

於是,在涌動著“一個商業模式可換來數百萬投資額”的互聯網創業圈中,人臉識別成為另類的低調存在。

這種行業氛圍,反而為依圖、Face++這樣的技術型創業企業提供了專注的創業環境。當其他互聯網創業企業在吹捧商業模式、攀比公司估值、乃至“燒錢”搶佔地盤的時候,選擇人臉識別技術研發的企業仍有機會在喧鬧的行業中,安靜地從事研究,為一鳴驚人積蓄能力。

但也有投資人早早看到了這種低調的腔調。

作為依圖的天使投資人,徐小平接觸公司時,正是朱瓏和林晨曦沒有產品、沒有商業模式、隻有理論和技術的階段。照理說,這是很難說服投資人的。但打動他的是兩個年輕人“改變世界”的夢想以及IT男特有的朴實態度。徐小平圍繞“計算機視覺”這一他完全不了解的領域,與朱瓏和林晨曦足足交流了十幾個小時,從下午茶到晚飯再到夜宵,最后決定投資當時真格基金總資金的7%、即200萬美元,支持依圖發展。可戲劇性的是,這個投資額遭到了朱瓏的討價還價:“100萬美元就夠了,我不想賣公司。”

即便到今天,朱瓏也不覺得拒絕徐小平一半的投資額有什麼遺憾。“創業還是要有一點夢想,我們的夢想不是銷售額多高、規模多大,而是讓計算機視覺幫到人類,給世界帶來一些變化。”

人臉之外的“識別”

隨著交流的深入,記者發現,依圖的員工並不是隻會埋頭寫代碼的 IT 男,他們也會對一些細節特別注意。在依圖的發展中,除了識別人臉、“車臉”,其實也在對上海的創業氛圍進行“識別”。朱瓏們的一些想法,或許能引來其他創業者的共鳴。

比如,被問及為何選擇閔行區虹橋鎮德必易園作為辦公場所,朱瓏的答案居然是一個水槽:“你看,我們有獨立的水槽,圍繞水槽有了公共廚房和餐廳,這樣員工的伙食選擇面可以廣一些,生活能夠方便些。”

他解釋,看過不少寫字樓,雖然硬件條件不錯,有的還有創業扶持政策,但太呆板,不適合加班頻繁的技術性的創業公司——一個樓層隻有廁所有水龍頭,洗個碗還得到廁所間﹔中央空調確實舒服,但開關都有統一時間,加班用空調還要支付額外電費,成本太高……所以,當看到德必易園幾近毛坯卻可以擁有獨立水槽的辦公室時,朱瓏很快做出決定:“就是這裡,和硅谷的創業空間很像,看起來簡單,卻能自己作主。”

還有的園區,各種扶持政策,包括補貼租金的、鼓勵創新的,送上門的不少。但依圖最終並沒有享用,不是因為沒有資質不夠條件,而是沒有完成申請表格。“幾張表似乎填起來很快,可說實話,我們真沒時間填。作為技術型創業企業,我連商業策劃書都沒有寫過,和投資人、客戶見面,也是面對面交流,幾乎不提供文字材料。”對於那些“求賢若渴”的創業園區,或許也能從中獲得啟示:扶持創業創新的政策在落地過程中,手續再簡單一點,給企業的實際幫助可能更大。記者 任翀

(責編:馬麗、趙竹青)

分享讓更多人看到

返回頂部