2023年9月13日 星期三

科普「500年一遇」兼勘誤(鳴謝渠記)

魔術師在前文《抽刀斷水水更流 明朝散髮弄扁舟》寫話基哥宣稱遇上「500年一遇」覺得「浮誇」,主要係因為即使可以以現今數據做 extraploration,但根本無數據可供 backtest 驗證自己的 model 是否正確,而且當場署理天文台台長發言時又無 endorse 過「500年一遇」,之後比卡超更話係「百年一遇」(見 FB 及伸延閱讀正苦新聞稿),感覺上口徑說法不太協調:

老實說,魔術師近年返工被玩到謝,嘗試做一些精準計算卻被自稱自己「好膚淺」,唔肯聽深入分析的上司打回頭,於是開始 downgrade 自己變成 layman 思維;而且年紀大好多時啲算式理論(例如 Poisson Distribution)都俾返哂老師,時常會有諗錯隔離之誤,就好似呢個「500年一遇」的講法咁。

魔術師是夜返到屋企睇返正苦新聞稿才知道基哥在開場白是沒有講到「500年一遇」,天文台無 endorsement 亦屬正常,反而係署理渠務署署長帶出「重現期超過500年」的概念,然後基哥才在 Q&A 時間重覆講「500年一遇」,加上又懶得自己搵搵資料計一次,單靠 preception is my reality 便質疑基哥,實在有欠穩當。

成件事結果就係俾傳霉覆述報導時調亂了次序,同埋不斷 loop 基哥發言,所以以為始作俑者係基哥(亦證明魔術師的 attention to details 退步咗,明明睇直播睇到渠務署講完才轉台的...)

為求溫故知新,在網上查找,見 Yahoo 新聞有篇文講「N年一遇」的科普:

五百年一遇暴雨有無根據? 一文解釋「N 年一遇」重現期概念|世紀豪雨

Yahoo 新聞 更新日期: 2023年9月9日週六 下午1:29

【Yahoo 新聞報道】世紀豪雨終告平息,今次的大雨創下了多個紀錄,包括生效時數最長的黑色暴雨警告信號(16 小時 35 分鐘)等,另外天文台總部在 9 月 7 日晚上 11 時至午夜 12 時,錄得的一小時雨量為 158.1 毫米,是自 1884 年有記錄以來的最高紀錄;在政府跨部門記者會上,政務司司長陳國基和署理渠務署署長徐仕基就以「500 年一遇」形容事件(特首李家超則在另一場合以「百年一遇」形容),但隨即引起不少人質疑:我們有 500 年前的雨量紀錄嗎?為何會講出「500 年一遇」?不可以說成「200 年一遇」、「1,000 年一遇」嗎?其實「500 年一遇」,以至其他「N 年一遇」是牽涉統計學概念,稱之為「重現期」(Return Period);以今次事件為例,「500 年一遇」不代表 500 年才遇一次,而是平均 500 年才遇一次。到底甚麼是「重現期」呢?

文字記者:溫朗鈞

「重現期」基本介紹

「N 年一遇」或者重現期,常見在自然災害的相關統計當中,例如水災、地震、乾旱等都有機會用到這些形容,同時需要計算出這些災害的重現期。獲得這些統計數據的目的,是為了協助籌備和建造基建設施者,做好他們的基建預算,例如到底要興建多大的蓄洪池、多粗的渠管處理有可能發生的特大洪水等。

如果以最簡單的方式去理解重現期,我們可以將「N」理解成事件發生的機會率(probability),而最簡單的方程式就是:

1 ÷ N%

以下是一個虛構例子:我們計算到一小時內雨量達 100 毫米的機會率是 5%,這個事情的重現期就是 1 ÷ 5%,最後答案為 20,所以上述事情的重現期就是 20 年,亦即可說成是「20 年一遇」;同時亦可以說,在指定時間內(例如 1 年內)發生一小時雨量達 100 毫米的大雨機會是 1/20。

天文台其中一個估算「重現期」的虛構例子。裡面明確表示如果 N 是 2%,事件的重現期就是 1 除以 2%,答案是 50,即是重現期為 50 年。

重現期的關鍵概念:平均

但大家必須注意的是,正如本文首段所言,「N 年一遇」並不代表每隔「N」年才遇一次特定事件。因為重現期是一個平均概念,重現期可以告訴你一次特定事件平均多久發生一次,但不能告訴事件將會在何時發生、中間相隔多久等。事實上,特定事件的發生時間往往是相當隨機,難以預測。

以上述虛構例子為例,我們計算到「一小時內雨量達 100 毫米」這項特定事件的重現期是 20 年,亦即「20 年一遇」,理論上如果今年已經發生了這項特定事件,它平均要到 20 年後才會再發生一次;但既然發生時間是隨機的,它其實可以發展出以下可能:

1)在 20 年後,甚至 30 年後、40 年後,都再未發生這項事件。

2)在往後不足 20 年,甚至只是在下一年,事件已經再次發生。

因此,重現期或者「N 年一遇」,是指平均「N 年」會遇上一次,而並非指在特定的「N 年後」會遇上一次。

署理渠務署署長徐仕基在政府跨部門記者會所言的「500 年一遇」暴雨,就牽涉了「重現期」此概念,實際是指今次破紀錄強度的暴雨,平均 500 年才發生一次。徐仕基又說,市區的排洪設施標準,能應付「200 年一遇」的暴雨,意味着今次發生的暴雨,已經超出排洪設施負荷。(Channel C 直播截圖)

如何計算出「500 年一遇」

回到今次的暴雨事件,渠務署和政務司長都指出今次的事件是「500 年一遇」,那麼「500 年」是如何計算出來?資料顯示,香港天文台是在 1883 年成立,距今都是 140 年,為何會說成 500 年?難道我們有 1523 年,即是明朝嘉靖二年的香港雨量數據嗎?

獲得 500 年前的香港雨量數據,答案必然是否定的。但在統計學理論當中,我們是可以透過「極值理論」(extreme value theory)、「泊松分佈」(Poisson distribution)、二項分佈(Binomial distribution)等方式計算極端事件的重現期,這不需要完全依靠歷史數據才能得出。關於以上 3 項方法的方程式,在此不贅。

《Yahoo 新聞》找到一份渠務署在 2018 年發表的渠務工作技術指南,裡面的附表援引了天文台的雨量數據,最終計算出特定時間內(例如 120 分鐘、60 分鐘、30 分鐘等)之每小時降雨量的重現期。附表當中顯示,在 60 分鐘時段內,每小時 156 毫米降雨量的重現期為 500 年,亦即是「500 年一遇」,平均 500 年才會遇上一次,或者可以說成 1 年內發生上述事件的機會是 1/500,即 0.2%。今次天文台總部錄得的最高一小時雨量為 158.1 毫米,跟附表內 500 年重現期的數據相近,因此「500 年一遇」的說法,亦非全無根據。

渠務署在 2018 年發表的渠務工作技術指南,裡面的附表援引了天文台的雨量數據,最終計算出特定時間內(例如 120 分鐘、60 分鐘、30 分鐘等)之每小時降雨量的重現期。附表提及,在指定 60 分鐘內,每小時降雨量 156 毫米的重現期為 500 年。

計算極端事件重現期的挑戰

雖然我們不需要擁有所有歷史數據,都能夠計算出極端事件的重現期,但在現實層面上,計算極端事件重現期仍然面對着不少挑戰。

首先從統計學層面來說,由於我們不掌握所有歷史數據,所以在面對較大重現期的時候,我們需要利用現有數據作外推估算(extrapolation),例如用 50 年的歷史數據,外推估算重現期 200 年的數據;用 200 年的歷史數據,外推估算重現期 1,000 年的數據等,而透過外推估算得出的數據,必然會存在一定誤差(重現期愈大,誤差愈大);例如計算降雨量的時候,愈大的重現期可以得出愈大的降雨量誤差,隨時多達數百毫米。

另一方面,由於極端事件的發生次數並不多,因此只要在現實中出現多一次,甚至多幾次的極端事件,對於日後的重現期計算都會造成很大影響;例如某項極端事件比以往更頻繁出現,令其發生的機會率由 1% 提升到 3%,即是 1 ÷ 3% = 33.3,它的重現期就會由「100 年一遇」,下調至「33.3 年一遇」。

氣候變化成關鍵變數

來到這裡,各位或者可以想到在計算氣象事件重現期的時候,氣候變化已經成為了一個不可忽略的因素。天文台前助理台長梁榮武昨日在電台節目已經表示,今次事件已經顯示了氣候變化所帶來的影響,是會令到大規模暴雨等極端天氣愈趨頻繁。

至於天文台前台長林超英亦在 Facebook 專頁表示,渠務署所云的「500 年一遇」,是根據以往雨量紀錄而推算,「問題是近年每小時雨量連續幾次破紀綠,而且上升幅度多達幾成,則統計推算必須反映氣候變化,重新進行」;林超英並向大家表示,「大家不要驚訝,舊時的『極端』會可能變成未來的『正常』,即是所謂『新常態』」。林超英的言論,其實亦是側面反映了極端事件的重現期對數據相當敏感,而且極端降雨的重現期勢將縮短,「極端」也會被取而代之變成「不極端」。

天文台前台長岑智明在 facebook 分享圖表,顯示天文台一小時最高雨量紀錄的變化,可以見到近 30 年雨量破紀錄的情況有「加速」跡象。

總結

今次的暴雨事件反映了「500 年一遇」這個牽涉「重現期」的統計學概念,仍然有很大的推廣和普及認知的空間。亦正正因為外界可能對於「500 年一遇」的理解可能存在差異,因此在公開言論應用「100 年一遇」、「500 年一遇」等字詞時亦宜多加注意,甚至避免使用。至於在氣候變化的現實下,極端天氣例如大規模暴雨、超級颱風吹襲等事件更頻繁發生相信是不可避免,各界需要及早準備應付。

【參考資料】

香港天文台:重現期:「N年一遇」?

香港天氣觀測站:甚麼是「N年一遇」?「千年一遇」等說法是不是空談?

渠務署:Stormwater Drainage Manual - Planning, Design and Management, Fifth Edition, January 2018

岑智明個人 facebook 帖文

根據 Yahoo 報導,原來係渠務署在 2018 年有發表工作技術指南,以天文台 1947 - 2014 數據計算過每小時降雨量 156 毫米的重現期為 500 年,跟今次降雨量 158.1 毫米相當,所以才會有「500年一遇」之說;而渠記話「在市區主要排洪設施的設計標準為200年一遇」,睇返個表,即係每小時降雨量為 145 毫米。

不過,正如魔術師在前文留言講過「N年一遇」呢種講法容易引導「膚淺的」layman 以歷史數據「數 sample」(Yahoo news 亦認為「公開言論應用『100 年一遇』、『500 年一遇』等字詞時亦宜多加注意,甚至避免使用」),又或者令人聯想到當年華東水災年復一年「百年一遇」的洪水(講得太濫就失去了嚴重性),倒不如實鋪實作講機會率(「500年一遇」是係 0.2%)同埋幾多毫米降雨量。

魔術師亦企圖從天文台網站查找降雨量的數據,但說只搵到「排行榜」,而無 full set data 去 plot probability distribution curve 來做分析嘞。

(圖片來源:香港天文台 最高一小時雨量的排行(1884年 - 2022年), captured on 13 Sep 2023)

就係連 AI 都幫唔到魔術師!想簡單地用 normal distribution 計吓都唔得!

***

伸延閱讀:

抽刀斷水水更流 明朝散髮弄扁舟

政務司司長在應對海葵低壓槽帶來暴雨所致廣泛地區水浸聯合記者會開場發言(只有中文)(香港特別行政區政府 新聞公報 2023年9月8日)

署理天文台台長在應對海葵低壓槽帶來暴雨所致廣泛地區水浸聯合記者會開場發言(只有中文)(香港特別行政區政府 新聞公報 2023年9月8日)

署理渠務署署長在應對海葵低壓槽帶來暴雨所致廣泛地區水浸聯合記者會開場發言(只有中文)(香港特別行政區政府 新聞公報 2023年9月8日)

應對海葵低壓槽帶來暴雨所致廣泛地區水浸聯合記者會答問內容(香港特別行政區政府 新聞公報 2023年9月8日)

行政長官會見傳媒談話全文(只有中文)(香港特別行政區政府 新聞公報 2023年9月8日)

13 則留言:

  1. 所以千年一遇美少女是一年只有0.1%機會率才能遇到。

    回覆刪除
    回覆
    1. 美少女的美麗程度能量化嗎? 要是沒有美麗程度的數值指標, 0.1%這個百份比其實也不知應如何算起 PC

      刪除
    2. 留意「單位」Units - 統計 samples 是「每年最高一小時降雨量」,倒數變 percentage,於是 per year 便成為「N年一遇」。

      將「千年一遇美少女」倒推,則是要將每年遇到的美少女打分,再用最高分者作 sample。由此路進,如果某君所說的「千年一遇美少女」在别人眼中是「不過爾爾」的尋常貨色,則可推定此人人生只見豬扒,不見靚囡了。

      刪除
    3. 其實都係班小黃人攪軟對抗吧。
      當政府用%的時候,小黃人又問返你什麼叫 "每年最高一小時降雨量" 既定義。
      你同佢講 "每小時降雨量為 145 毫米",小黃人又會問 144.9 mm 的機會率呢 .
      自古以來,中國都係講幾多年一遇,一方面大部份人讀書唔多,用幾多年一遇,更容易明。
      再者,李超人做生意,有個概念就得,唔洗太精準...

      刪除
    4. //其實都係班小黃人攪軟對抗吧。

      軟對抗還軟對抗,知識還知識,又唔可以話「反正點講都會有人駁嘴駁舌」就放軟手腳嘅。「為官避禍平生恥」呀!

      //自古以來,中國都係講幾多年一遇,一方面大部份人讀書唔多,用幾多年一遇,更容易明。

      正正就係「自古以來」都係講「幾多年一遇」,所以俾到人「隨口噏」、無統計學根據的感覺。現今社會,傷民教育程度都普遍來說都相當唔錯,可以唔使用「傳統方法」吧。

      //李超人做生意,有個概念就得,唔洗太精準...

      視情況吧,天文台唔精準好易俾人抦。

      刪除
  2. 感謝魔兄高質科普文。
    其實係另外一個角度睇幾落先要成set數再執過。渠記又要幾耐review 過d standard都好值得諗。
    Ps 渠記網頁都介紹左佢地唔少工作,同導賞團可以學下野又可以善用公帑.

    回覆刪除
    回覆
    1. //感謝魔兄高質科普文。

      過獎。近期真係懶散咗好多(也可能是工作太忙),少咗好多認真計算的帖文。

      //渠記又要幾耐review 過d standard都好值得諗。

      上次個份 manual 用嘅 data 都只係去到 2014,update 吓都好應該。

      刪除
  3. //魔術師亦企圖從天文台網站查找降雨量的數據,但說只搵到「排行榜」,而無 full set data 去 plot probability distribution curve 來做分析嘞。

    https://www.hko.gov.hk/en/abouthko/opendata_intro.htm

    -z

    回覆刪除
    回覆
    1. 這是每15分鐘的 API,我唔需要用到 real time data 呀!

      刪除
  4. 你在數學,思維方面上咁叻或咁有想法,你是細個小朋友時已經咁叻?或是有興趣後再自己學習?你幾時發現自己在邊一方面有天份呢?
    我最近在研究幼兒教育~

    回覆刪除
    回覆
    1. 舊 blog 都寫過,小時候老父買給我的讀物是《智力世界》,加上平時因老父工作關係,俾埋好多《三國》、《水滸》等連環圖故事書我睇,呢啲故事好多時都係吹捧「智取XXX」、「智破YYY」...到初中學時期就迷明珠台的《玉面飛龍(MacGyver)》,大學讀的《銀英》,都係崇尚以「怪招」急智取勝。
      姑勿論以上的「案例」是真是假有幾多虛構成份,我被培養出來的認知就係真功夫必定係靈活運用,「無招勝有招」(有啲似獨孤求敗的心法);學校只係岳不群做師父,答案招式要一板一眼跟 model answer,但實戰卻不必如此。
      但實際,直至我大學畢業,都仲係一舊飯咁;係第一份工遇上 一個問題,連資深上司,都鮮決唔到,但就俾我在巴士上一瞬間想到解決方法,從此就「開咗竅」。記得呢件舊事都好似寫過。

      刪除