長達九天的春節連假裡,IBM Taiwan專頁裡的一則文章攫取了我的注意力,標題是「Big Data’s Surprising Uses: From Lady Gaga To CIA」(海量資料令人意想不到的應用:從女神卡卡到CIA)。
我想,十之八九的讀者都和我一樣好奇,女神卡卡和Big Data之間究竟有什麼關係?在流行樂界,女神卡卡不僅是全球粉絲最多的歌手,也是本世紀以來最具話題性的演藝「產品」,包括哈佛商學院、歐洲管理和技術學院(European School of Management and Technology)、安特衛普大學管理學院(UAMS)都曾經將她當作創意產業的MBA課程研究案例。
Big Data以這樣的速度逼近到我們面前。如果我們把兩年以前的文明累積基數以兩百年為限,意味著我們只用了近百分之一的時間,就創造了九成以上的資料。速度快到我們甚至來不及找出一個確定的中文翻譯,叫做:巨量資料、大數據、大資料、還是海量資料。我們就急於需要這些新的理解、新的應用,面對新的可能,還要面對新的危險。
早在幾年前,海量資料(Big Data)的相關話題就已在科技界發酵,當時大家著重的是技術層面,希望開發更先進的軟硬體,更有效的儲存、利用這些因應網路時代而不斷產生的資料。但是,海量資料(Big Data)之所以重要,絕不是更先進的數據資料採集而已,因此每當討論這個議題時,我總是一再地強調,我們要探討的主題叫做「海量資料分析」(Big Data Analytics)。