9月10日下午,在中國科學院計算技術研究所一層報告廳,CSDN(微博)舉辦的“TUP第十四期:模式識別項目實戰(zhàn)”活動上,騰訊研究院人機交互中心的研究員劉海龍,與大家一起分享了兩大互聯(lián)網(wǎng)巨頭在模式識別與云計算、新型終端結合所帶來的實踐心得。對于模式識別技術的云服務,他從兩個方面做了介紹:1)什么是模式識別的云服務?云服務會給模式識別的應用帶來什么樣的好處。2)從手寫識別、語音識別、人臉識別的模式識別領域來分別介紹一下騰訊研究院來搭建模式識別云服務的實踐。

以下是騰訊研究院人機交互中心研究員劉海龍的主題演講實錄:
我非常高興能有這個機會來到TUP論壇跟大家做交流和分享。我的工作內容分為兩部分,一部分是模式識別里面一些成熟技術和好的研究成果用于騰訊現(xiàn)有產(chǎn)品,來提升這些產(chǎn)品的用戶體驗。另外一部分要探索一些比較有意思,有創(chuàng)新性的模式識別的應用。
云計算
這個詞現(xiàn)在非常火了,走到哪都能聽到云存儲、云殺毒、云輸入等各式各樣概念。現(xiàn)在趨勢就是將來互聯(lián)網(wǎng)大部分的應用都要向云計算的方向發(fā)展。廣義云計算有一個定義,指的是服務的交互與使用,指的是通過網(wǎng)絡以按需易擴展方式來獲得所需的服務。具體到我們領域,模式識別云服務就是通過云端計算方式,提供模式識別的服務。具體來講終端主要負責采集輸入數(shù)據(jù)以及接收識別到的結果,模式識別其他的步驟,像特征提取,具體分類我們全部在云端來完成。從模式識別技術發(fā)展角度來講,它也需要從傳統(tǒng)的單機應用走向網(wǎng)絡應用,跟云端這樣的海量數(shù)據(jù)相結合,才能得到更好的應用發(fā)展。
關于云服務帶給模式識別應用什么樣的好處?
這里想舉一個實際例子說明,這是工業(yè)界的例子,不是互聯(lián)網(wǎng)的例子,我加入騰訊之前我在一家外企的郵政通話部門工作過很長時間,對這樣的例子比較熟悉,今天跟大家分享一下。不知道大家有沒有去過郵局分點中心,去過想象可以看到圖上這些機器,我們寫這些信到了郵局在機器上掃描裝置,把郵件圖象掃描下來,然后進行OCR識別。這個郵件圖象經(jīng)過OCR識別,加上上面信息,包括郵編、地址識別出來,然后分揀到各個地區(qū),然后投遞各個地方去。最初的時候有很多分揀機,包括分揀的數(shù)據(jù)都是放在本機上,這是單機分揀的形式。這樣的形式有一些弊端,首先各個分揀機上它郵件的負荷不一樣,經(jīng)常有的比較忙,有的比較閑,計算資源不平衡,沒有得到充分的利用。另外某一臺OCR服務器宕機的時候,跟它相連的分揀機無法工作。后來想到把OCR服務器拆除下來,集中在一起形成OCR的識讀池,來共同為為分揀機服務。這樣的好處一是計算資源得到有效利用,這個各負載要做均衡。一旦某一臺OCR服務器出現(xiàn)故障之后,其他的服務器會相應分擔故障服務器的負載,保證識別功能一直具有高可用性。一旦分揀中心業(yè)務要進行擴展,分揀機數(shù)目增加,在識讀池里面資源相應增加,按需擴展,不超前,不浪費。由于在分揀機和識讀服務池之間數(shù)據(jù)傳輸是標準,是圖象傳遞和識別標準傳遞,無論什么類型終端可以比較方便集成到系統(tǒng)當中,終端適配比較靈活。
再往后發(fā)展不僅是分揀中心當中各臺分揀實現(xiàn)了資源調度,各個國家的這些分揀中心資源可以利用起來,所有分揀中心互聯(lián)互通,形成開放式的識讀架構,形成一種云OCR服務。當我們OCR識讀器性能有所改進,想進行升級或者是地圖數(shù)據(jù)有更新,需要變動的時候,你可以很方便的進行集中的升級維護。從剛才介紹這些特點可以看出來,實際上模式識別云服務,這是云OCR服務,實際上具有云計算的普遍優(yōu)點,它是按需服務,資源利用率比較高。另外他冗余可靠性比較好,維護成本比較低,可擴展性能比較強。
針對模式識別問題,云服務還有很多更為重要的三條優(yōu)點
第一個優(yōu)點:模式識別需要大量樣本,通過云服務可以收集到大量樣本,更為重要是通過終端用戶一些簡單交互,比如對識別結果確認或者選擇,可以得到很多有標簽的。
第二個優(yōu)點:對某一些模式識別任務而言,語音識別任務,云端提供終端不具備的計算和存儲能力。現(xiàn)在發(fā)展趨勢移動終端越來越成為主流,移動終端上計算資源和存儲資源被弱化,還要考慮移動終端電池續(xù)航能力,很復雜的能力不能放終端,而是放到云端。
第三個優(yōu)點:很多模式識別任務,人臉識別的任務,識別本身就在云端,所以數(shù)據(jù)本身存儲在云端也是自然而然的事情。
云OCR服務
再往后發(fā)展不僅是分揀中心當中各臺分揀實現(xiàn)了資源調度,各個國家的這些分揀中心資源可以利用起來,所有分揀中心互聯(lián)互通,形成開放式的識讀架構,形成一種云云OCR服務。
當我們OCR識讀器性能有所改進,想進行升級或者是地圖數(shù)據(jù)有更新,需要變動的時候,你可以很方便的進行集中的升級維護。從剛才介紹這些特點可以看出來,實際上模式識別云服務,這是云OCR服務,實際上具有云計算的普遍優(yōu)點,1)按需服務,資源利用率比較高。2)冗余可靠性比較好,維護成本比較低,可擴展性能比較強。除了這些普遍優(yōu)點之外,針對模式識別問題。
云服務還有很多更為重要的優(yōu)點
1.模式識別需要大量樣本,通過云服務可以收集到大量樣本,更為重要是通過終端用戶一些簡單交互,比如對識別結果確認或者選擇,可以得到很多有標簽的。在剛才的例子當中,一旦有字符,識別度不高的情況下到人工標碼處,這樣長此以往積累越來越多,可以使我們識別性能不斷往上提升。
2.對某一些模式識別任務而言,語音識別任務,云端提供終端不具備的計算和存儲能力。現(xiàn)在發(fā)展趨勢移動終端越來越成為主流,移動終端上計算資源和存儲資源被弱化,還要考慮移動終端電池續(xù)航能力,很復雜的能力不能放終端,而是放到云端。
3.很多模式識別任務,人臉識別的任務,識別本身就在云端,所以數(shù)據(jù)本身存儲在云端也是自然而然的事情。
騰訊研究院搭建模式識別云服務的實踐
騰訊產(chǎn)品線非常豐富,無論是在桌面產(chǎn)品這部分還是無線產(chǎn)品這部分,這么多產(chǎn)品里面模式識別技術有很多可以發(fā)揮得地方,有很多用武之地。作為一個技術研究部門,騰訊研究院可以經(jīng)常接觸到從業(yè)務部門到來這些關于模式識別這些需求。以前在得到這些需求給業(yè)務部門做技術支持的時候,我們經(jīng)常以提供算法庫的形式做的,這樣做有弊端,這樣做是一次性的事情,不利于我們長遠提高我們技術能力和算法性能。現(xiàn)在我們思路有所轉變,向業(yè)務端提供算法庫思路轉變提供云服務的思路。
推薦閱讀
第一財經(jīng)日報:《桃姐》乍一看很像紀錄片,余力為的攝影也很樸實無華。采用這樣的方式,是不是為了凸顯情感的真實性? 許鞍華:主要是因為可以拍得很快,而且便于抓拍到養(yǎng)老院當時的狀況和其他老人的反應。劇組拍攝的>>>詳細閱讀
本文標題:騰訊研究院劉海龍:當模式識別遇上云計算
地址:http://m.sdlzkt.com/a/kandian/20120305/36909.html