劉海龍:人臉識別用的特征BABO(音)比較多,像你說表情、情緒,特征變化有多大,表情肯定屬于一種內類的變化,肯定使你人臉特征發生變化,肯定有影響。
提問:以前有一種全新影像的特征提取跟咱們平面圖象的特征提取是不是有什么不一樣的地方?
劉海龍:這個我不太了解。
主持人劉江:進入今天最后一個環節,圓桌討論,請海龍和陳波。今天話題很有意思,加上我們上次活動,其實核心綜合起來就是自然用戶界面,NUI,國外學術界也都在說這個話題。他包括其實觸屏也算,手勢、語音、體感、還有腦波。大家想之前微軟研究院其實觸屏方面研究,我們現在說的自然用戶界面意味著什么?鍵盤、鼠標是不自然的,他說過如果未來有一天也許過了若干千年、萬年,一臺電腦,一臺PC被后人挖出來,發現是這么復雜的鍵盤,后人肯定想這是什么生物在用,是有很多手指,鍵盤是很不自然的用戶界面。只不過因為我們技術上有局限,只能做成這樣。
劉海龍:我做支付識別,做博士論文很長時間,針對一個很特定領域要做很深,需要花很多精力,做很多努力。我覺得看你自己的需要,如果想比較快速做一個什么事情,沒必要鉆那么深,用現有技術可以的。如果想把某個地方做好,肯定要去讀大量文件,看人家做的東西,自己想哪個地方可以再改進一些。做的好要鉆進去,這是肯定的。
下面再提一個問題,是不是現在從產品研發角度來講這是不是一個趨勢,算法本身也許不是那么重要,數據其實更重要?
劉海龍:模式識別數據是很重要,算法改進費很大力氣,數據有了,性能自然就上來了。
主持人劉江:你對你特定領域有一些東西總結比算法還要有效一些。之前他們推薦算法也有研究,像亞馬遜(微博)包括電子商務網站,他們搞得更好,更匹配。包括豆瓣(微博)網絡,跟你更相似的人,更相似的書等等。用戶體驗、界面方面把用戶行為改一改更好的可以收集數據。
劉海龍:算法也是一直不斷往前走才可以。
主持人劉江:科大訊飛已經做到了方言轉為普通話,可以做到。
劉海龍:發型和年齡識別,因為發型不算是一個人臉決定,我們取人臉區域是從眼睛往下這么一個區域,人臉特征的區域。發型隨時可以改變,現在識別出來可能跟發型有關系,我覺得這個不應該作為識別成這個人或者是那個人的判據。至于年齡,我覺得有什么好方法這個……
主持人劉江:以前研究人工智能就是機器,現在互聯網就是人臉網,SNS這么發達,國外也在說集體智慧。你可以更多用人的智慧,對你算法整個系統智能化提高很有用。
提問:我聽騰訊嘉賓說他們一直培訓這個系統,訓練他們做這些事情。介紹你們底層的東西。
劉海龍:神經網絡已經熱很多年了,大家對他的使用也很長時間,只是分類方法中其中一種,有其好處也有其缺點,好處就是不用操心那么多,有網絡模型之后送到輸入神經元,等訓練就可以了,不用擔心參數。比如對于漢字識別,幾千個類別的識別問題,目前現在用神經網絡做的效果不是很好。因為里面各種因素比較大,神經網絡規模比較大的時候,訓練各種問題比較多。有些真正實用的可能并不是聽起來比較炫的。有些比較簡單的如果加以合適訓練方法可以達到很好算法,在時間和空間代價上會更好。
主持人劉江:你剛才說漢字識別用的什么分類器?
劉海龍:二次分類器。
主持人劉江:現在你們主要用的除了剛才說的神經網絡,還主要用什么多?
劉海龍:可以舉個例子,手寫識別因為要放在手機上,他對資源容忍度特別低,這個空間不能超過兩三兆有這樣的要求。識別速度要很快,在手機上可以達到很快,這種情況下用分類器越簡單越好。你在訓練過程中再去調整,都能達到你的目的。
提問:國外也是關于識別技術,IBM今年還是去年發明沃森(音),他們美國知識競賽回答問題,像你們語音識別還有文字識別有沒有自我學習,把它完善。
劉海龍:肯定有的,服務上線之后定期把新的樣本、新的語調拿過來,有一個反饋系統訓練,得到新的模型會用來更新之前的線上舊的模型,這樣經過定期迭代,性能逐漸出聲的。這個要做成自動,人不用干預他,后臺自己學習和更新,應該是這樣。
提問:我是來自自動化所,我想跟劉研究員問一個問題,你們人臉識別系統里面一般只能采集傳統網絡只能采集一兩個人臉數據。在你這一兩個數據庫里面,只有我的人臉一兩個數據庫,你在識別的時候我可能有不同的姿勢,還有不同的光照情況,還有一些表情,你怎么處理這些問題?
劉海龍:很多應用中你用一張人臉做一個你的模板,這個人會有很多變化,可能會側身,怎么辦?要靠離線樣本,他代表了人臉整個變化的情況。當你離線樣本有幾千、幾萬的時候,有不同照片,不同光照不同表情的照片。可以足夠代替整個統一人臉模式的變化,你自己的內類變化也能被訓練出來的內類變化所涵蓋。
提問:你們采用技術是先在離線狀況下把模型提取出來,用我的人臉套用在這個模型上進行識別。
劉海龍:對,只能采用這個方法,在線用戶圖象肯定不夠,只有一兩張,必須靠離線樣本。
提問:我是自動化所的,有一個小想法,咱們有訓練樣本,那么大,沒有辦法想去模擬一些訓練樣本。
劉海龍:可以,有一些虛擬樣本可以做,但這是虛擬,但你沒有真實樣本的情況下可以采用這個路。
提問:我有一個想法,現在三維攝像,能不能用生物技術去模擬人臉表情變化得到一個樣本去做訓練樣本。
提問:我是優酷,騰訊兩位嘉賓兩個小問題,一個是人臉識別方面,騰訊有沒有在姿態校正、眼鏡摘除、ASM這種應用對人臉算法有改善,有這個的話改善效果怎么樣?
第二個問題,現在圖象模式識別方面非常大,騰訊有沒有做圖象模式識別方面實踐。
劉海龍:ASM這塊有一些業務需要這些算法和這些模型,比如我們QQ秀,用戶上傳圖象之后把真臉部分扣出來給你一個卡通臉,需要對臉定位,需要用ASM這方面算法。我們跟清華大學合作,我們自己也積累技術,也要改進這部分的技術,定位更好,也會促使我們業務往前發展。
眼鏡摘除我們還沒有這部分的工作,淺色眼鏡影響很小,對人臉識別比較大還是黑框眼鏡,對人臉改變比較多,很容易錯。這方面技術我們沒有做。
提問:我之前沒有做過模式識別的東西,聽了各位嘉賓演講,模式識別系統可以理解成抽象特征級的系統,有一些數據輸入進來進行學習。在識別的時候給一個數據進來。一個這樣通用的模式識別簡單系統這樣是不是可行?特征值需要自己定義,剩下里邊提供一些抽象算法來,自己把這些特征值如何運算,告訴系統,系統進行運算,得出一個結果。
推薦閱讀
第一財經日報:《桃姐》乍一看很像紀錄片,余力為的攝影也很樸實無華。采用這樣的方式,是不是為了凸顯情感的真實性? 許鞍華:主要是因為可以拍得很快,而且便于抓拍到養老院當時的狀況和其他老人的反應。劇組拍攝的>>>詳細閱讀
本文標題:騰訊研究院劉海龍:當模式識別遇上云計算
地址:http://m.sdlzkt.com/a/kandian/20120305/36909.html