去年,微軟推出了體感游戲設備Kinect。它建立在此前Xbox游戲平臺的基礎上。和之前大紅大紫的Wii相比,Kinect的玩家不需要任何握住的東西,也不需要任何按鈕,就可以讓屏幕中的人物按照自己需要的方式來運動了。至今,Kinect已售出了1000萬臺。如今,開發這套系統的科學家就業內猜測紛紛的背后技術發表了一份論文,詳細解密了Kinect所使用的技術。最近的《新科學家》雜志網站對此進行了報道。
借助Kinect游戲設備,游戲玩家空手就可以進行操縱。在屏幕的一側,裝有三部攝像傳感器,可以快速準確地在深度成像上預知人體關節的三維位置,然后在屏幕上再現動作。另外,四臺麥克風可以傳達系統識別語音命令,幫助玩家在更大的范圍內運動。最近微軟劍橋研究中心和“Xbox孵化所”的科研人員在計算機視覺及模式識別國際會議上公開了相關技術。
開發人員邀請了15名志愿者在攝像機前進行運動,系統的成像會對人體進行分類,將人體特征分為幾組變量。這些變量是人們日常生活中常見的,比如“基本特點”對對象的性別、年齡、身高、胖瘦程度等進行辨別;“姿勢”對人體的主要姿態進行辨別。其他還有諸如“旋轉三維”、“頭發和衣服”、“體重和高度變量”等多個類別組。Kinect每次可以追蹤兩個人的動態,每個人可以追蹤到高達20組的細節。
Kinect在成像時可以同時通過三種方式來實現:彩色影像、3D深度影像和聲音訊號。成像的最開始,計算機會首先獲得一個綠色背景下的模糊的人體影像。每一個人體部分,在任何姿勢的時候,都有大量的變量。連上攝像機以后,攝像機會對人體所有部分成像,每個像素都進入了“骨骼追蹤算法”系統之中。Kinect還帶有一個紅外感應裝置,因此,這個人影每一個骨骼節點的深度是可知的,就可以形成深度影像。
隨后,計算機會對每一個像素進行分析評估,比如判斷它是在人體的哪個部位。再接下來,每一個像素的特征變量都會在一個叫做“隨機決定庫”里進行搜索,看這個有著特定性質的像素是否符合一個特定的身體部位。
在這個過程中,游戲系統會收集到大量的運動捕捉數據———在最初的研究中,像哪怕跳舞、踢球或跑步這樣的運動,都會產生50萬的數據幀。研究者后來將數據幀數量限制在10萬左右。
當設備辨別出人體部位之后,這個系統就開始計算每個人體節點的三維位置所在,Xbox系統每秒鐘要做出200次的算法,比之前的人體識別技術快上10倍。這樣,玩家的運動也可以被識別得更快。
數據庫并不能代表所有的人體行為,而只是常見的一些行為,因此,在系統中,Kinect帶上了機器學習技術,對于不常見的一些行為可以學習并放入圖像資料庫中。接下來Kinect要做的,就是增加機器識別的準確性,這可能需要更大的數據庫,以及更快的運算速度。
推薦閱讀
由于Android3.0操作系統目前仍然有很多問題不能立刻解決,而這些問題使得這個操作系統的表現非常不穩定。這就使得即將即將在第二季度發售搭載自家webOS操作系統的TouchPad平板電腦的惠普公司、馬上就要在4月中旬發售>>>詳細閱讀
本文標題:微軟體感游戲設備Kinect背后技術解析
地址:http://m.sdlzkt.com/a/xie/20111230/181498.html