推薦序
最有趣的大數據提問,最誠實的數位田野調查
「know thyself」(γν?θι σεαυτ?ν,認識你自己),相傳是刻在希臘德爾斐的阿波羅神廟的三句箴言之一,也是其中最有名的一句。
臉書剛風行時,許多朋友除了玩開心農場,另一個上臉書的目的是玩心理測驗,是為了更瞭解自己,還是讓朋友來瞭解呢?然而,因為種種的社會規範,我們即使是在做暱名或自己才看得到答案的心理測驗,可能心中想的和表現出的,是一個自己希望成為的人,而非真實的自己。
萬萬沒想到,在臉書背後玩大數據的資料科學家,可能早就能從我們按讚的模式,判斷出一個人是外內還是內向,是開放還是保守,是否是異性戀或是同性戀等等,彷彿那些演算法,比我們自己還瞭解自己。
沒外人真正清楚臉書等社群網站背後真正且完整的商業動機和模式,不過收集大數據來瞭解人類的行為,肯定是其中一項,這是司馬昭之心。至少,有個交友網站OkCupid的創立,除了讓無數寂寞難耐的男女能夠找到人生另一半,另一個目的就是為了寫這本書吧,真是一魚二吃啊。
不否認,我也是OkCupid的註冊會員,當時是讀了一本書說,有個交友網站能用各種問題來判斷兩人是否適合交往,裡頭可供會員回答幾百個問題,從嗜愛興趣到生活習慣和宗教政治都有,可是其中最準確的居然是喜不喜歡看恐怖片(我不愛)等等看似無關緊要的小問題。
身為一個好奇心旺盛的人,我當然立馬去試,一口氣回答了上百個問題,可是送出異性的訊息大多石沉大海……後來就興趣缺缺了。沒想到,在OkCupid成立十年來龐大的資料,卻讓資料科學家發崛出一大堆極為有興趣的現象。這本書就是OkCupid的創始者之一克里斯汀.魯德 (Christian Rudder)的現身說法。玩大數據的大企業不少,包括谷歌、蘋果、亞馬遜、臉書等等都是箇中佼佼者,只是大多數資料是商業機密,像克里斯汀.魯德成立一個部落格OkTrends,用一手資料來討論並出書的不多。
從大數據瞭解我們的行為,只是個開始