推薦序
大多數天鵝是白的
這本書探討以量化資料預測人類行為,在各方面得到的應用成果。其實,早在二次大戰時,美軍就率先利用這種預測分析。1940年時,「模控學」(cybernetics)之父維納(Norbert Wiener)開始嘗試預測德國軍機的行蹤,目標是擊落德國軍機。他的方法是利用先前觀察取得的軍機移動資料,預測軍機可能的飛行路徑,考慮飛行員最可能採取的閃避方式,預測軍機接下來可能移動的位置,這樣就能把軍機擊落。可惜,維納只能預測軍機下一秒的動作,但是要擊落軍機,卻需要預測二十秒內的飛行路徑。
不過,在席格這本書裡,你會知道許多預測工作其實相當成功。畢竟,從維納那個時代以來,電腦的處理速度突飛猛進,我們能收集的資料也越來越多。因此,銀行、零售業者、選戰活動、醫生和醫院、以及許多組織最近在預測特定人群行為時,全都獲得豐碩的成果。他們對預測分析投入心力,協助自己贏得顧客青睞、打贏選戰並戰勝疾病。
依我所見(我想席格也這麼認為),整體來說,預測分析對人類是有利的。從健保、犯罪和恐怖主義這些方面來說,預測分析可以拯救性命;對廣告業來說,利用預測既能提高效率,也能落實環保(減少寄送直銷郵件和型錄的數量),同時不會浪費收件者的寶貴時間和關注心力。而對政界來說,重視這種科學方法的候選人,似乎都能在選戰中成為贏家(或許有些人不認同這種說法,但我認為預測分析確實對打贏選戰有幫助)。
不過,就像席格在這本書裡開宗明義地指出,這些方法也可能用在一些不好的地方。席格對此坦率直言,讓我十分欽佩,他引述電影《蜘蛛人》中的一句台詞:「權力越強,責任越大。」換言之,身為社會的一分子,我們在使用預測模型時必須審慎小心,在應用方面有些禁忌要列入考量,不能為了一己之私就犧牲他人的權益。跟其他強效技術或破壞性創新一樣,預測分析基本上跟道德無關,能用來為善,也能用來作惡。不過,為了避免預測分析被拿來做壞事,了解這個方法究竟能做什麼,當然再重要不過。如果繼續看下去,你就會知道預測分析的效力有多強大。
這本書的探討重點就是預測分析,預測分析不但是一種分析類型,也是最有趣、最重要的分析類型。我不認為我們需要更多只講敘述性分析(descriptive analytics)的書籍,因為那種分析只描述過去,沒有針對事件起因提出任何見解。我常把自己的論述比喻成第三種分析,也就是規範分析(prescriptive analytics),這種分析告訴使用者,透過控制實驗或最適化要做什麼。不過,這類量化方法不像預測分析這樣廣受採用。
這本書及其所依據的構想跟塔雷伯(Nassim Nicholas Taleb)的研究,剛好形成很好的對比。塔雷伯在《黑天鵝效應》和其他著作中提出的論點是,由於隨機性和複雜事件本身的不可預測性,讓人們為預測所做的努力注定徒勞無功。塔雷伯說得沒錯,有些事件是無法預測的黑天鵝;但事實上,大多數人類行為都有跡可尋,既固定又可以預測。席格在這本書裡提出許多成功預測的實例,都提醒我們這項事實——大多數天鵝是白的。
席格也抗拒目前對「大數據」風潮的推崇,雖然他在書中提及的一些實例確實屬於這一類,也就是資料龐大又缺乏結構,很難用傳統那種關係資料庫加以管理。但是,預測分析的重點不是資料數量大小或控制難易程度,重點是拿資料來做什麼用途。我自己就發現「大數據通常用途少」,許多實際拿大數據做分析的人,只是拿數據設計一些引人注目的視覺分析,這樣做他們就很滿意了。相較之下,這樣做當然不像設計預測模型那樣有價值。
席格這本書以深入淺出的方式,敘述預測分析的重要,讓一般讀者都能看懂這項複雜高深的技術。書中不但穿插有趣的故事和圖解,還以生動的文筆,讓一般讀者能輕鬆閱讀。就算數學讓你很傷腦筋,你也該看看這本好書,因為在這個數據為王的時代裡,每個人(包括你在內)從出生到死亡的一舉一動,都受到預測。而且很可能的情況是,大多數人在職場上會更加需要考慮預測模型,或用預測模型進行評估,並依據預測模型的結果採取行動。
簡單講,我們生活在凡事講究預測的社會裡,要在這種社會出人頭地的上策就是,了解預測模型的目標、技術和限制。而且,要做到這一點的速效方式很簡單,那就是趕快把這本書好好看完。
湯瑪斯.戴文波特(Thomas H. Davenport)
哈佛大學商學院訪問教授
國際分析學院(International Institute for Analytics)共同創辦人