智能語音之殤:我們為什么還不能和手機交談

作者: 來源:未知 2013-04-22 09:15:02 閱讀 我要評論 直達商品

  四十多年前,專家們曾宣稱,語音識別將在“五到十年內”發展為一項成熟的技術。可多年過后,他們依然重復著一模一樣的說辭。

  語音識別的發展確實費了不少工夫——好在,時隔多年以后,我們總算開發出了一套質量過硬的識別技術。不僅如此,我們還把這玩意應用到了移動設備上(盡管還得靠服務器提供一大堆技術支持)。

  然后問題就來了——有了這樣的技術,我們為什么還是得整天瞅著自己的手機屏幕鼓搗來鼓搗去,卻無法直接開口跟自己的手機對話交談?

  回答這個問題的關鍵,在于提供一個語音交互界面,遠比理解一打單詞來得復雜——尤其是對手機而言。我們還必須得理解用戶的“意圖”。要知道,除了語音技術本身以外,人機語音交流中還有其他因素在作怪——輸出方式,互動形式還有語境。

  多元化的輸出:既能秀,也能說

  如今投入使用的語音系統,識別的效果一般都過于極端化——要么一字不差,要么謬以千里。事實上,當我們查詢一條去某大街的路線時,要是系統能精確無誤地從數據庫的上千個條目中識別出我們想要的那一條,還是挺令人稱奇的。不幸的是,如果識別有誤或者街名不準,我們的搜索就只能乖乖從頭再來。

  要想在現有的語音技術上有所突破,我們必須得認識到一點:我們現有的系統,不過就是最原始的識別技術而已——識別技術本身沒啥問題;但除了這套技術以外,我們的系統只是一個空殼罷了。而我們需要的,其實是創造一個語音交互界面——說白了,就是一整套基于語音的互動模式。

  理解用戶的“意圖”,意味著系統要判斷出用戶真正需要的事物,而這通常得依靠交談來實現。這就是說,系統要了解用戶為什么問這個問題——一般來說,這就要求系統去知曉對方在做什么;與此同時,這也要求系統根據用戶所處的情形合理應答。這可決不是一項輕松的任務——畢竟,用戶只是把移動設備握在手中而已,他們可能有著大把的事情,要忙著分神去處理。

  互動是一種雙向的溝通,意味著我們在提供輸入的同時還得留意輸出;而這些能發聲的應用是怎么回答我們的呢?最常見的方式,是直接向用戶回復他們所想要的信息。那些提供實時駕駛指南的“殺手級應用”就是個典型的例子:用戶雙眼注視路況,雙手把好方向盤,然后嚴格按照語音提示說的做就行——這種情況下,這樣的應答方式也確實管用。

  但另一些時候,這招就不那么靈了。比如,當我們詢問下班公交什么時候到站時,讓系統自顧自地把整張時刻表背下來就是個不折不扣的餿主意。即使它只是回復一句“下班車9點12分到站”,效果也好不到哪去——這時候,說“下班車12分鐘內到站”才是王道。

  這其中的關鍵在于,語音只是瞬時性的——一句話,說完就完了。要是我們一時不小心分神了,或者一下子沒來得及把消息印到腦子里,我們就得再問一遍。說不定還得問上一遍又一遍。

  這就是我們不應該拋棄用戶界面的原因:它好歹能幫我們少占用一些記憶容量。未來的語音技術所迫切需要的,是多元化的輸出:既能秀,也能說。舉個例子,如果我正忙著趕路的話,何不讓移動設備既在屏幕上給我秀一下時刻表,也在耳邊跟我說一聲“下班車12分鐘后到站”?

  理解背后的“意圖”

  這也引出了未來的語音技術所需的第三個,也是最重要的一個因素:語境。人們的對話里包含著豐富的語境信息:詞匯表達的意思,代詞指代的對象,還有那些被重讀的單詞。這其中牽涉到一系列細微的語言模式(心理語言學家赫伯·克拉克稱其為“定位”),使得一句像“你懂了沒?”這樣的短問句,就足以暗示一段微妙、共有的經歷——因為對話中的另一方清楚你所暗指的是什么。

  而這些語境,正是手機可以大展身手的場合,尤其是考慮到語音技術發展的現狀與未來的話:手機知道它自己身處何處;它能夠識記我在不在上班、在哪里上班;它清楚我都跟誰打過電話,誰是對我更重要的人。

  如果我用的是清一色的安卓或者iOS應用的話,手機還能掌握我的郵件信息、日程安排,還有我的興趣愛好。于是,當我問“公交是幾點來著?”的時候,手機就會聽懂我說的是哪趟車、哪一站、哪個方向,甚至還包括我要將花多久才能趕到車站。事實上,說不定在我發問之前,手機里的鬧鐘就會自動響起,提醒我該起身出門趕車去了,還能順帶一句“別忘帶雨傘哦”——就像一個稱職的管家一樣。

  對語境的分析,不僅有助于我們理解一詞一句,更能幫我們理解其背后的“意圖”。盡管在一些手機應用中,我們多多少少已經體驗到了這些功能;但就語音而言,相關技術還遠未成熟。至少目前看來還言之尚早。畢竟,我們不能忽視社會因素的影響:在公共場合,我們未必會和手機“交談”,可能是因為我們不想打擾他人,也可能是因為我們不愿暴露隱私。

  但事情總是在變化的。我是美國最早用上第一代手機(摩托羅拉MicroTac)的人之一。當年我打著大哥大走在馬路上的時候,周圍的人看我就像看個瘋子一樣——即使是在MIT這樣遍地技術狂的校園里也毫不例外。而現在,看到那些戴著藍牙耳機自顧自聊天的路人,我們都已經見怪不怪了——要知道,從前這可都是瘋子的標志呢。

【想看更多互聯網新聞和深度報道請關注樂購網官方微信。(微信號:樂購網)】


  推薦閱讀

  社交通訊應用普及 運營商需探索更多商業模式

北京時間4月22日消息,據國外媒體報道,獨立電信分析公司Ovum表示,目前,大批用戶正在向免費或較劃算的社交通信應用程序遷移。這種情況的出現抑制了電信運營商短信業務的營收增長,并致使運營商們對信息服務的盈利產>>>詳細閱讀


本文標題:智能語音之殤:我們為什么還不能和手機交談

地址:http://m.sdlzkt.com/a/01/20130422/266332.html

樂購科技部分新聞及文章轉載自互聯網,供讀者交流和學習,若有涉及作者版權等問題請及時與我們聯系,以便更正、刪除或按規定辦理。感謝所有提供資訊的網站,歡迎各類媒體與樂購科技進行文章共享合作。

網友點評
我的評論: 人參與評論
驗證碼: 匿名回答
網友評論(點擊查看更多條評論)
友情提示: 登錄后發表評論,可以直接從評論中的用戶名進入您的個人空間,讓更多網友認識您。
自媒體專欄

評論

熱度

主站蜘蛛池模板: 国产成人综合美国十次| 综合558欧美成人永久网站| 亚洲国产成人久久三区| 成人久久久久久| 国内成人精品亚洲日本语音| 亚洲天堂成人网| 国产成人无码A区在线观看导航 | 2021国产成人精品国产| 久久久久AV综合网成人| 免费国产成人高清视频网站| 四虎成人精品无码| 久久久久AV综合网成人| 成人免费在线看片| 四虎永久成人免费| 揄拍成人国产精品视频| 国产成人在线观看网站| 青青国产成人久久91| 国产成人av乱码在线观看| 日韩成人在线免费视频| 国产乱色精品成人免费视频| 日韩欧美成人乱码一在线| 亚洲精品成人a在线观看| 91成人精品视频| 四虎成人精品免费影院| 亚洲色成人网一二三区| 成人免费看吃奶视频网站| 亚洲最大成人网色| 成人性一级视频在线观看| 亚洲精品无码乱码成人| 成人免费看黄20分钟| 欧美日韩国产成人综合在线| 亚洲欧美成人综合久久久| 成人au免费视频影院| 成人免费视频网| 色窝窝无码一区二区三区成人网站| 国产成人亚洲精品播放器下载| 成人午夜免费福利| 成人性一级视频在线观看| www成人在线观看| 8x成人在线电影| 欧美成人全部视频|