【明報專訊】 統計學是探討不確定性(uncertainty)問題最好的方法,可是,絕大部分的統計方法是研究相關性(correlation)問題,絕少談及因果關係(cause and effect)。這篇文章是介紹一種新的思考因果關係的方法,由我「獨創」。 日常生活中,非常多人會把相關的事物看成是因果關係。其實,這種做法很多時是錯誤的,相關不代表因果;反之,因果(事件)一定是相關(事件)的,顯淺不過。其中一個著名的例子是:女性裙腳愈高,恒生指數也愈高,相關性強,當中當然沒有因果關係。另一例子是鞋子愈大愈聰明——當你穿的鞋愈穿愈大,你便愈來愈聰明了,怪不得媽媽幫孩子買鞋,永遠買大兩三碼。 去年,中大一名教授(也是醫生,應該穿XL鞋)公布了一個很科學化的研究結果(用上雙能X射線吸收量度儀器,掃描長者的脂肪分佈,研究長達6年),得出了「驚」人的結論——男長者愈肥愈長命,其結果更在什麼美國老年醫學期刊發表,真厲害!他還說:最低死亡率組別的男性長者,其平均腰圍38吋。本人看了報道後十分開心,每天放肆地大吃大喝,現僅差半吋。其實,他的研究設計有很大問題,另外,相關 ≠因果! 在日常生活上,我們希望探求因果關係,可是,我們經常看到的卻是相關而非因果。由於在現實中,經常出現不少混雜因素(confounders),影響我們的判斷,導致看不清因果的關係。其實,因果關係是一個非常困難的課題,就算現代統計學奠基人費沙爵士(Sir Ronald Fisher),基於多種原因,至死都一直強烈反對吸煙致癌這因果關係。我10年前做過這個課題,略懂一二,所以共發表了3篇文章,其中一篇被一份頂級期刊接納時,當中一位評審專家給出一個接納的原因,是:「就讓統計學家多點認識因果關係的研究吧。」 虛擬事實模型(counter- factual model)是研究因果關係的一種常用方法。我相信在統計界少於1%的人聽過這模型,遠低於1%的人做過這方面的研究。原來的虛擬事實模型是一個統計╱數學模型,非常複雜,我想,何不把這個模型去數學化,讓它變成一種思考方法。以下,我會用4個例子,來介紹這種方法。 五四運動的錯 上月我在本報發表了一篇名為〈大學的悲哀〉的文章,收到了不少朋友的電郵鼓勵,其中一位不認識的朋友、一位中大教授,慨嘆說:「為何香港學術界衰落至現今這個地步」(Why Hong Kong academia has...