【IT商業新聞網訊】(記者 艾米)對著手機大聲說出你想要找的,不管是倫敦奧運金牌榜還是今天天氣如何,話音剛落,搜索結果很快出現在屏幕上。如果你想輸入短信,那就讓讓手指歇歇,說出來就行。想聽歌也同樣直接,告訴它“我要聽《月亮代表我的心》”,在線播放器自動準備就緒,你點一下就在線播放了。即便手機丟了,也不必擔心別人看到你的手機內容,有了聲紋解鎖,只有你的聲音和正確的話語才能啟用手機……一系列只要“動動嘴”就行的生活場景,日前在百度多媒體部的語音技術環節對外曝光。據了解,這是百度多媒體研發團隊首度對外公開亮相,展示其在語音、圖像等多媒體技術的最新成果。
預見到在移動時代,語音和圖像會成為重要的交互內容,語音必將成為重要入口之一,百度早在兩年多以前就低調進行多媒體技術研究。百度多媒體部正是百度為此抽調精兵強將,在全球范圍內廣攬頂尖技術人才組建的一支“特種部隊”。這支團隊在內部以“入選嚴、水準高、能打硬仗”而著稱,其領軍人物為國際知名人工智能技術專家,既有在斯坦福大學授課的學術背景,亦有在知名科技企業研究院率隊研發十余年的工業背景。在其帶領下,優中選優的數十人多媒體團隊實現多地協同研發,專注于百度在語音和視覺等多媒體交互的技術研發。
在語音方面,圍繞語音識別與智能理解,百度語音團隊已經獨立開發和掌握了海量語言模型、復雜聲學建模和高速解碼等關鍵技術。深厚的技術積累讓百度多媒體技術厚積薄發,進入高產期。目前,多項語音技術已經實現了產品端應用,主要用于語言輸入和語音搜索,百度語音輸入法、百度語音搜索等產品中的語音識別功能就源自百度多媒體部的研發成果。而類似于聲紋解鎖等一系列全新應用技術也正處于產品排期當中。
作為全球最大的中文搜索引擎,百度發展語音技術有著得天獨厚的優勢,搜索與語音結合是智能語音最自然的應用場景,更像是互聯網搜索的自然演化。百度擁有頂尖語音技術人才,對中文自然語言處理和用戶需求理解的長期技術積累為發展語音技術提供了優越土壤,而百度長期投入產業鏈建設,如框計算、開放平臺、海量數據等,更是為智能語音搜索提供了強大的后臺資源。
與蘋果Siri滿足人們娛樂交互需求的出發點不同,百度語音技術更為貼近搜索本身,通過使用語音技術來縮短人們獲取信息的過程,實現“即說即得”的全新搜索體驗。目前,百度語音搜索功能主要內嵌于掌上百度,百度搜索手機客戶端,百度手機地圖、百度手機瀏覽器等產品中。百度內部和第三方測試結果顯示,在語音搜索的效果方面,百度的中文語音搜索識別率已達到業界最高水平。下一步,百度語音技術將從提高單個詞語言識別的準確率到語義理解的轉變,屆時更多的百度語音產品將變得更加智能。
多媒體技術是移動時代用戶與移動終端交互的底層技術,通過掌握這項核心技術,百度不僅自身可以更好地滿足移動終端用戶的需求,持續改善搜索體驗,更重要的是,百度還可以將多媒體相關技術作為百度云開放平臺的重要技術模塊,實現能力輸出。目前,百度已計劃將多媒體技術通過API接口逐步開放給第三方開發者,幫助開發者引入這項技術進行創新應用開發,進而促進移動互聯網的生態繁榮。
推薦閱讀
事實上,除了商家服務不到位的問題,團購價格的上漲也是其“失寵”的一大重要原因。業內人士略顯隱憂,“當線上銷售喪失低價優勢,必然會導致一部分用戶流失,而團購網民規模的銳減將會極大影響O2O的發展”。 O2O(O>>>詳細閱讀
地址:http://m.sdlzkt.com/a/guandian/yejie/20120301/116909.html