自序
自從比奈測驗(Binet Test)於1905年發展以來,也是正式宣告心理計量學(psychometrics)誕生的時刻。心理計量學這門談論測驗(量)理論、測量工具(測驗及量表)、實徵研究(empirical study)方法(研究設計、統計分析及電腦程式應用),以用來描述個體個別差異行為的心理學支派,隨著電腦及數位科技的跳躍式進展,實徵研究方法的不斷推陳出新,近40年來,它已經應用到各個社會及行為科學研究的子領域,並且邁向一個蓬勃發展的新紀元。
綜觀40年來的發展,試題反應理論(item response theory, IRT)的誕生與成長茁壯,是心理計量學中最明顯進步的學說。它的進展,不光只是提出創新見解的理論學說而已,更是全面翻新傳統的古典測驗理論(classical test theory, CTT)說法,甚至全面取而代之。過去,社會及行為科學的研究不被自然科學界的學者視為是一種科學研究,乃因為它的測量精準度實在差太多了,也就是說「測量誤差」(measurement errors)過於龐大,不容易被視為是精確的科學研究。固然社會及行為科學界的研究標的物,通常都屬不易清楚定義的「潛在變項」(latent variables, LV)概念,即使研究者盡力去定義清楚了,但對它的測量仍然未必符合「客觀測量」(objective measurement)的假設,甚至也不滿足所適用統計分析模型的基本要求條件。但是隨著IRT理論的誕生,一群熱心學者的推廣,再加上方便易學的軟體程式不斷更新改版,已逐漸讓社會及行為科學研究的學者與從業人員們,不再那麼害怕難以親近、不易理解與未知其應用價值的IRT理論,轉而逐漸將它發揚光大,落實應用在各個研究子領域裡。因為追求客觀測量與採用嚴謹科學的實徵研究方法,是社會及行為科學界人員的共同研究信念。然而,要推廣此研究信念到所有子領域的研究從業人員身上,卻有賴於他們在研究所教育養成階段裡,即接受過類似方法學課程的訓練,具有嚴謹科學研究的認知與態度,才能讓他們在未來的研究生涯中,持續不斷秉持客觀測量的信念,採用科學嚴謹的實徵研究方法,改善測量的精準度,精進研究結果與結論,才能讓社會及行為科學研究也能媲美自然科學,都是一種「科學性的研究」(scientific research)。
因此,本書的撰寫動機即是秉持如此的研究信念,企圖為深奧難懂的IRT理論,及其如何在實務研究中落實客觀測量的認知與方法,建立起一座聯繫雙方的橋樑,為促進社會及行為科學研究也是一種「科學性的研究」而努力。
本書分成十二章,分別介紹社會及行為科學領域中常使用的測量工具——量表(scale),該如何編製與發展的方法,進而說明該如何應用IRT的Rasch測量模型(Rasch measurement models)於該等工具蒐集資料的分析上,並以ConQuest軟體程式為例,列舉實例演練說明該程式的用法,同時也歸納文獻說明國內Rasch測量模型於發展測量工具上的應用情形(本書所附程式範例的連線網址為https://reurl.cc/5geM1G,解壓縮密碼為9789861919010)。展望此客觀測量研究信念的推廣與實徵方法學的未來發展趨勢,筆者企圖朝此方向做持續努力,並為促進其成為「科學性的研究」目標,貢獻一己綿薄的力量。
本書的完成,筆者首先要感謝國立政治大學教學發展中心及文學院,為推廣第二屆仲尼獎獲獎人陳芳明講座教授的教學理念,推動「研究→教學→出版專書」的學思歷程發展計畫,所酌予局部經費的補助。筆者於政大任教近三十年來的學思歷程,不約而同的與陳芳明講座教授的理念相似。本書的誕生,也是筆者先進行研究二十多年後,再累積每年的授課資料與研究心得,並於因緣成熟時,得以聚集出版成專書。
其次,筆者要感謝心理出版社總編輯林敬堯先生的慨允出版,以及全體心理出版社幕後編輯團隊的辛勞付出與精湛的排版技巧;同時,也要感謝筆者當期的研究助理群 政大教育系熊師瑤、許雅涵、翁雅芸等人的團隊合作與協助校稿;最後,更要感恩內子沈恂如,她默默在背後給予無限的關懷、支持與鼓勵,使得筆者在漫長的撰稿期間,得以心無旁騖一氣呵成,讓本書得以如期出版。
筆者才疏學淺,著述立論經驗尚待增長磨練。本書雖經校對再三,如仍有疏漏之處,筆者當負全部責任,並懇請學界各方先進,不吝給予指正。
2019年9月13日中秋節於政大教育學院井塘樓研究室
余民寧 謹誌