0105hokkaido_139

北海道洞耶湖邊的白天鵝


《黑天鵝》(“The Black Swan”) ,Nassim Nicholas Taleb成名作,自成一家討論「罕有但重大事件」。Taleb新書”Antifragile” 將於年底出版,期待中不妨重溫《黑天鵝》,反正他常常抱怨傳媒誤解他的論點。

黑天鵝是認知的邊緣

Taleb以一句話總結他的《黑天鵝》想法:“Theories fail most in the tails; some domains are more vulnerable to tail events.”

就算預知罕有事件會出現,亦很難預知後果有多嚴重,一來因其罕有,二來涉及「倖存者偏見」(“survivorship bias”)。例如,恐龍滅絕當由非常重大事件引發,以至沒有恐龍活著告訴我們發生過甚麼事。馬雅人、北美Anasazi印弟安人在短時間內消失,只留下遺跡,當然沒人告訴我們發生過甚麼。如果明天我們遇上小行星撞地球,人類文明一定在短期內消失:人口銳減、社會崩潰、知識失傳,小行星撞地球的記憶很可能只剩神話一個。後人(如果還有的話)無從得知小行星撞地球的結果有多重大,就算他們重新發明統計學,亦無補於事。如Taleb言,問題重點不在重大事件發生之或然率有多小,而在發生的話引起的影響有多嚴重[1]。

於是乎,所有關於罕有事件影響的預測,無一不落空:沒有最大鑊、只有更大鑊[2] 。

關於或然率

擲毫公、字出現的或然率可以界定(如:擲一萬次出現公、字的次數比例),但大亞灣核電廠明年發生巨大核事故的或然率則不可。從或然率的意義看,後者可能毫無意義[3]。我們能見到事件,但不能見到背後的或然率分佈(如果有的話)。換個角度,罕有事件出現的頻率太少(罕有嘛),難以猜中適用的或然率分佈。

「高斯分佈」即「正態分佈」,是統計學常用的或然率分佈模型,凡學過基本統計學的都認識其兩端矮、中間高的「鐘形曲線」(“bell curve”)[4]。但高斯分佈絕非唯一的或然率分佈模型,其現實應用能有多廣泛,實為重要實證研究問題。例如,Taleb指出金融數據便呈現”fat-tail”特徵,即極端數值出現的機會其實高於高斯分佈的預測[5][6]。但眾多金融計量理論、模型皆建基於高斯分佈。

於是乎,隨便用bell curve,隨時會出事:罕有事件的或然率和影響同遭低估,罕有事件影響的預期值當然更大幅低估[7]。Taleb認為,銀行業最大問題,正是以錯誤模型進行「風險管理」,結果每隔一段時間都把過去賺的錢賠光、賠突。

理論與模型

理論是綜合經驗、推測未來的工具。一般的說法是,由觀察綜合出理論,再以理論推測未來。由於經驗觀察必然有限,得出來的理論必不包含極端事件(見上文關於無倖存者偏誤)。由理論建立的模型,誤差可能因世事互為影響而變得非常複雜。假如有一系統,其中一個變數的現況(如:你現時愛現任女友的程度)要視乎其過去的狀況(如:你過去愛現任女友的程度)、其他變數(如:你遇見幾多個一百巴仙的女孩、現任女友愛你的程度)的現況和過去狀況、且變數與變數之間的關連呈非線性(如:你愛女友的程度在你遇見一百巴仙的女孩時指數衰減[8]),問題便會相當複雜[9]。這類型的系統,若其中一個變數細微轉變,可能引發系統的大變;而些微的量度誤差,會令預測大幅偏離現實。很要命。

如何避免成為傻瓜[10]

不要把建基於有限事實的理論當成不易真理。江湖郎中傳說,某特區政府委任研究人員,研究洗腦教育爭議對幾個月後的立法機關選舉有沒有影響。研究人員用當時的數據進行分析(當然不可能有未來的數據),認為沒有影響。幾個月後,立法機關選舉前,群情洶湧,數正萬計該特區的市民每天下班都到該特區的政府總部一遊,整整一個星期。好一個現代版刻舟求劍。[11]




抱歉,礙於篇幅、功力,只能寫那麼多,且未有排除我的偏見、誤讀。經驗之談:這類知識對升職加薪、飛黃騰達、吸引美女無大幫助,但可是happy hour吹水上佳材料,有利(男性)同儕互相廝殺於啤酒杯之間(但要小心選擇對象)。如有時間及耐性,還是應一讀《黑天鵝》。因此,買一本放在當眼處,最好是英文版。不要買電子版:誰能看穿你Kindle裡的內容?

推介:

2009年,NNT在「社會科學研究網絡」(“Social Science Research Network”)放了一篇短文,綜合回應對《黑天鵝》的若干批評[12]。想瞭解NNT的說法,但又不願啃掉整本《黑天鵝》,這篇2009年的短文是捷徑。

附註:

[1] 有些事情,猜不中亦無傷大雅,因為後果不嚴重 (“Mediocristan” ,如異乎常人的身高) ,但些事猜不準則後果非常嚴重(“Extremistan” ,如08今融海嘯、一戰造成的損失)。

[2] Taleb的用語是,嚴重事件的影響沒有”asymptote ceiling” 。簡而言之,即嚴重程度無上限。回想一下2011年3月11日東日本大地震後福島核電廠事故。事發後幾乎所有關於事故影響,如輻射洩漏程度等,事後都顯得太樂觀。

[3] 廿年前我就這樣寫過,廿年前當然無人讀我的東西。

[4] 即 “Gaussian distribution”或”normal distribution”。 Taleb在《黑天鵝》把「高斯分佈」說成「最大學術騙局」(”the greatest intellectual fraud”,簡稱”GIF”)。

[5] 以統計語言說罕有事件,就是”tail event”,意指出現在概率分佈兩端(“tail”)的事件。在正態分佈(normal distribution),偏離平均值兩個標準差(standard deviation)的事件出現的概率非常低。

[6] Taleb 2009 “Errors, Robustness, and the Fourth Quadrant” Social Science Research Network http://ssrn.com/abstract=1343042

[7] 預期值即”expected value”,為或然率乘以事件出現的影響。

[8] “exponential decay”,遞減速度遞增,總之是減得很快就是。

[9] 這是Taleb對”complex system”的簡化論述,其實可以更複雜。

[10] Taleb之言:”How to avoid to be a sucker”

[11] 如有雷同,實屬巧合。

[12] Taleb 2009 “Common Errors in Interpreting the Ideas of The Black Swan and Associated Papers” Social Science Research Network http://ssrn.com/abstract=1490769





創作者介紹

羊氏物語

cybercynic 發表在 痞客邦 PIXNET 留言(2) 人氣()


留言列表 (2)

發表留言
  • miao
  • 最近懶得上網,一上來就看到這個東東,很晚了,待我明天不累再來請教
  • 悄悄話
找更多相關文章與討論