Chinese Christian Herald Crusades UK

所聞所感: 大數據的來臨及其應用

2015年12月
文/陸志光    克蘭菲爾德(Cranfield) 大學電機工程教授

 

 

在十月,中國最高領導人習近平及其夫人在密集的訪英行程中,不忘把握機會,到訪倫敦帝國學院的數據研究所。習夫人當天還收到一件以「大數據」技術設計而成的外套作為紀念品──研究人員分析了習夫人在各公開場合的700張照片後,推斷出最適合她身型、顏色及風格的設計,最後製造出這件外套作為禮物。

 

 

 

 

 

 

 

 

 

今時今日,所有在資訊科技界的人,包括研究人員,以至於企業董事人員,都在談及「大數據」。很多人相信,若應用得宜,「大數據」能為企業提升實力及價值。同樣,科研圈也在討論「大數據」很可能為人類所面對的許多難題帶來出路。不過,究竟「大數據」包括了什麼?它又從何而來?

 

 

 

 

◎什麼是大數據?

 

 

我們處於資訊爆炸的年代。有估計指出,人類有史以來的所有數據當中,超過九成的資料都是在過去數年內產生的。也有人說,到了2020年,我們擁有的數據會比今天的超出五十倍。我們創造及儲存數據的能力達到了前所未有的水平。單單Google,每天就要處理24千兆(24後加上15個0)的數據量。現時世界互聯網的人口已達三十億人,全球很快就會有超過一半人口使用互聯網。每一分鐘,互聯網用戶在臉書上就分享了超過250萬則內容、在推特(Tweeter)社群網路發放了30萬條消息,還有傳送超過兩億通短訊。不但如此,若你還記得在上一篇「物聯網」講過,一旦物聯網開始普及,數據量就會更加快速地增長,那時會有約200-300億樣物件被聯接起來。相比起互聯網,物聯網將產生更多的數據,把汽車、冰箱和中央暖氣等統統聯接起來。現時先進的資料儲存叫數據增長得以成事,也令數據的生產、傳遞及儲存成本更低。

 

 

「大數據」的定義包括了三個特點(也就是大數據的3V):

 

‧高量(High Volume):數據量是以億兆計,傳統電腦的表格不可能分析得了。

 

 

‧多樣(Large Variety):大數據分析不同渠道的數據,包括了互聯網和物聯網。數據可以來自傳感器、檔案、公共網站、社交媒體,甚至大自然。因此,這些數據將會非常混雜,需要大量資源去篩選及整理。

 

 

‧高速(High Velocity):大量數據每時每刻都在不斷快速變更,因此講求立時整理。大量的數據代表著無盡的機會,但同時也代表著史無前例的挑戰。如果我們能有效地分析這些數據,那就能創造無盡的機會。要分析這些高量、多樣及高速的數據,就需要我們能從中整理出有用的資訊。

 

 

針對這三種新的特徵,各國的研究員已發展出不同的數學模型,來處理這些傳統工具不能做到的分析工作。

 

 

 

 

 

 

 

 

◎應用範圍

 

 

最近,我應邀為一家中小企提建議,幫助他們研發一項能儲下身體運動能量的科技,把所收集的能量為穿戴的保健設備提供能源,使用家可以定期地收到健康數據,包括體溫、血壓、心跳及他們的所在地等。他們計劃出售數以百萬計這種穿戴設備。試想像,這些設備所產生的數據及數據潛在的價值──例如,醫生可根據這些設備提供最合適的診斷;在社區層面,這些即時的數據將有助預防流感或疫情爆發。

 

 

至於零售業及網購,大數據能改善網購的過程,同時透過更完善的市場營銷策略來加速增長。舉例說,亞馬遜的網站會根據用戶的反應而立時回應,有效運用大數據為廣告、交叉銷售及銷售提供不少機會,也為買家營造更方便及貼心的購物經歷。

 

 

每一天,數以百萬計的Google用戶在搜尋引擎中輸入不同的字眼。在用家還沒完成要輸入的文字或句子前,Google就能透過它們收集來的大數據,估計出用家下一步想要搜尋的字,並提出建議,既方便用家,使搜索更快到位,也提升效率。

 

 

在北卡羅來納州大學的研究人員,使用大數據來研發出電動車應用程式,能更準確地推算電動車的電池是否足夠走完一段路程。他們從不同渠道收集了大量的即時數據和電池情況,叫司機更有信心可準時回到家中,而非因沒電而堵在路上。

 

 

麻省理工大學的研究員用了大量電話數據,去分析人們的位置及交通模式,再將數據套用在城市規劃上。

 

 

◎挑戰重重

 

 

雖然大數據的應用是無窮無盡的,但它和其他新科技一樣,都潛在一定的危機。2013年,Google成立了一個新的項目,名叫Google FluTrend,嘗試叫用戶報告流感案例,再用大數據去推測全球流感的趨勢;但由於數據處理及分析不當,加上數據太過複雜,該項目終告失敗,項目的網站甚至很快就關閉了。

 

 

撇開這些危機,研究人員從失敗中汲取大量經驗,我們看到大數據的應用有飛躍式的增長。而可以確定的是,我們都目睹了「大數據時代」的開始──一個邁步跨出的劃時代!

 

 

參考資料:adayinbigdata.com、www.adweek.com