
美國一些計算機科學研究人員表示,此前已開始對Twitter用戶所發布同流感有關的信息加以匯總分析,然后據推斷出哪些地區有可能爆發流感,以便政府部門及醫療機構能夠拿出應對措施。早在2008年,谷歌曾推出了其著名的流感趨勢網站。
Twitter流感信息來源分布示意圖(騰訊科技配圖)
該網站假定的前提是:如果用戶患上了流感,則他們會搜索更多同流感相關的信息。如此一來,如果對任何一個國家或地區有關流感的搜索量進行統計,就能較好推斷出某個國家或地區是否正爆發流感。
事實上,谷歌的這項統計數據被證實很有效。谷歌的相應數據,同美國疾病控制與預防中心(CDC)等政府機構所統計的數據非常接近。在某些情況下,谷歌甚至能夠比CDC提前一周預測出哪些地區將爆發流感。這種預測的重要意義不言而喻:如果能夠提前預測可能出現的流行疾病,政府部門就能及時向公眾發出提醒以及采取其他應對措施。
由此人們也就提出了另外一個很有意思的問題:其他網絡服務尤其是社交媒體,是否也能像谷歌搜索那樣預測流感甚至預測效果更好?今天我們已經獲得了相應答案:美國卡內基梅隆大學研究人員李繼偉(音譯:Jiwei Li)以及康奈爾大學研究人員克萊爾·卡迪(Claire Cardie)通過對相應Twitter信息加以匯總和分析,就能成功推斷哪些地區出現了流感爆發的初期癥狀。
李繼偉和卡迪的數據統計及分析方式,其實與谷歌的統計方法有很多類似之處。他們對Twitter數據流加以過濾,只留下與流感相關的信息,并為這些信息加上地理位置標簽。通過這種方式,這兩位研究人員就能創建出一幅流感爆發地區地圖,以顯示相關流感Twitter信息來自哪兒,以及這些信息在一定時間段內的變化情況。
這兩位研究人員還為流感爆發創建了一個動態模式,并提供了一些很有意思的細節內容。在這個新模式中,流感爆發可分為四個階段:尚未爆發期、感染人員數量增長期、感染人群數量穩定期和感染人員數量下降期。
這種新型方式,還試圖提前預測出流感從一個地區轉向另一個地區的趨勢。為測試這種方法的有效性,李繼偉和卡迪共統計了360萬條同流感相關的Twitter信息,涉及用戶約100萬,信息發布時間在2008年6月到2010年6月之間。在得出相應分析結果后,他們將分析結果同CDC的相應數據進行了對比。李繼偉和卡迪說:“我們的研究表明,Twitter的流感信息同CDC提供的流感爆發數據之間呈高度正相關性。”
由此看來,李繼偉和卡迪的上述最新研究方式,無疑為公眾應對流感提供了另一條有效工具,它能夠使我們提前預測到某個地區流感即將到來。如果將這些預測同谷歌流感趨勢、CDC的相應預測進行對比,無疑也將是件很有意思的事情。
全球每年約10%~15%的人群會患上流感,受感染人群約5000萬人,死亡人數約50萬。這可不是個小數字。如果我們能夠盡早提前預測到流感即將爆發,無疑將使全球公眾都將受益:政府和醫療機構提前拿出應對措施,就能挽救大量生命。
推薦閱讀
科學家們在對火星東半球的高原和山地壓力數據進行研究時,發現了能證>>>詳細閱讀
地址:http://m.sdlzkt.com/a/05/20131014/290571.html