跳到主要內容

[亂聊] 校正回歸,校正了什麼?回歸了什麼?

 5/22下午兩點,一如往常的打開CDC直播,看到當日的新增案例數為3開頭,還不到八卦版鄉民爆的神秘數字的一版。正要鬆一口氣的時候,忽然看到手板上還有另一個數字:校正回歸400例。一夕之間,校正回歸變成這兩天最火熱的名詞,引爆了各種討論。


什麼是校正回歸?

Google了半天,就是沒有完整的“校正回歸”的解釋,再參照了一些文章的說法,基本上統計學中的中文名詞裡不存在校正回歸這詞,也就是說校正回歸是被“發明”出來的新詞。既然不存在校正回歸這詞,那也只能從詞面上拆解,拆成校正和回歸來繼續探討下去。

校正,校正了什麼?

校正算是一個在各領域都存在的詞彙,沒什麼爭議。因此我們需要探討的是,到底校正了什麼東西,或者反過來想:什麼東西不對?需要校正?

以陳部長5/22 CDC的記者會上指出,案例通報量太大塞車,通報到確診的時間落差很大。為了可以準確分析病例數趨勢,要把這些塞車的案例放回原本對應的日期上,才可以判斷疫情的走勢。

所以,校正就是校正每日的確診數,畢竟當天通報的案例不一定當天就可以確定為確診案例,事後再回過頭來修正我覺得是合理的。

回歸,回歸了什麼

回歸(regression)在統計學上就是不折不扣的專有名詞了。維基百科對於回歸分析的解釋是:

迴歸分析可以幫助人們了解在只有一個自變數變化時應變數的變化量。一般來說,通過迴歸分析我們可以由給出的自變數估計應變數的條件期望

更白話一點,找出一個方式來描述現在變化,或預測未來的變化。回歸的方式有很多種,就以最簡單的線性回歸為例字:



藍點就是實際上資料的分佈,紅線就是我們描述這些點分佈的方式(模型)。這個線性回歸高速我們這些資料分布的趨勢大致上就是在紅線的附近,因此當x的值為100,通過紅線的斜率我們可以推出Y的值大概會落在哪個區間。

所以,什麼是校正回歸?

前面分別描述了校正和回歸,合起來看會是什麼呢?我覺得這一張圖可以很明確的說明什麼是校正回歸:

這張圖明確地畫出了“校正”後的數據,以及用校正後的數去做回歸(預測未來,趨勢下降),我想這就是“校正回歸”這詞所達到的目的。

那不就沒有問題了,結案?

如果是這樣我就不需要花時間來打這篇文章了。對於這兩天收到的資訊,我提出問題的點如下:
1. 以後都不會做校正回歸嗎?不然憑什麼預測趨勢下降
2. 為什麼會需要校正回歸?

其實這兩個問題算是同一個問題,為什麼會需要回頭來修正這些數字?CDC的解釋是通報系統太複雜,現在已經簡化了通報流程並徹夜清案,一次提列出來修正。是這樣嗎?

5/23 20:00在疾管署官網的截圖

從上圖可以看到,通報數和排除數的差值來到4萬多,比較奇怪的是昨日新增的通報數和排除數差值相對非常小。目前沒有看到提高篩檢量的消息(記者會上沒聽到),只是增加案件通報的效率,有辦法消化掉這些待處理案件嗎?我們可以持續關注通報數和排除數的差異,就可以知道整個瓶頸點是不是如CDC所說。

但就目前快4萬多的待處理案件,我想未來繼續校正確診數是免不了的。既然數據不斷的一直在校正,那做“回歸”有意義嗎?

該關注的數字是什麼?

這一年來世界各國都示範過,評估疫情基本上用陽性率(確診數/採檢數)就夠了。當然這個指標要有一定的準確度,採檢數就變得非常重要。在雙北的採檢數量已經趨於穩定,陽性率的外部不確定性也相對降低了許多,呈現出來的就更具有參考價值。


很不幸的,5/19~5/22這幾天的陽性率持續上升,代表疫情仍處於升溫的狀況。而陽性率這個數字的大小代表什麼呢,多少算是高多少算是低呢?我找了去年2020東京的陽性率統計數字:

可以看到東京在去年四月中陽性率一度來到31.7%,隨著採檢數量提升以及緊急事態宣言,確診人數(藍色)在五月初的時候有稍微下降,陽性率也降到5%。不過不要忘了,從去年到今年日本反反覆覆的發布緊急宣言,代表一稍微放鬆疫情整個就捲土重來。


再分享一下美國一年來的陽性率變化,可以看到自從疫苗施打後確診人數明顯下降,陽性率維持在6~7%左右。可以注意的是,美國採檢量能的提升速度是非常恐怖的。

最後,我們能做的

全世界一直示範給我們看,在疫苗施打前一放鬆控管陽性率就上來。除了戴口罩少出門,要徹底解除危機只有一個方法:打疫苗。也在此呼籲當有疫苗就儘量主動去打疫苗,打那些WHO承認的疫苗。

台灣加油,世界加油~

留言

這個網誌中的熱門文章

[投資碎碎念] 總是當韭菜?沒有時間研究絕對不要玩股票?

如果可以時光倒流,回到過去站在剛出社會的自己面前,最想對當時的自己什麼樣的建議?更努力工作,更努力出國玩,更勇敢去追尋自己的夢想? 其實都不是,我會對自己說: 存錢,在股票市場做好長期投資 。

[韭菜向錢衝] #2 擔心無法承受風險?先了解脆弱與反脆弱的概念

  在韭菜向錢衝#1 中說明了複利的重要性,以及時間對複利的加成效果是有多顯著。但是在漫長的投資過程中,要如何維持一個相對穩定的年化報酬率呢?要如何在市場起伏的過程中減少損失,並從中獲得更好的報酬呢? 黑天鵝一書的作者塔雷伯,在他的另一本著作「 反脆弱 」就是在探討脆弱的本質,以及如何運用槓鈴策略設計出一個反脆弱的系統,我也相當推薦各位去讀一下這本書。 今天,我們會先從“脆弱”開始探討,並提供反脆弱的概念。理論的成分會多一點,聊投資的部分會少一點,但我認為反脆弱的概念是一個很好的思考模型,不只是在投資在各個層面都可以加以運用喔~