本文內容整理自醫咖會《樣本量計算的理論+實操》專欄,小咖針對其中關于“為什么估算樣本量”的內容進行了整理,可點擊左下角“閱讀原文”查看完整視頻。
樣本量估算起源于臨床試驗。早期上市試驗的發起方一般為藥企,開始前必須考慮經費、招募規模、足以滿足上市需求的結果評價的成本等等。后來,臨床不同科室、不同專業都會進行臨床研究,其中也包括臨床試驗。
隨著越來越多的臨床試驗的開展,人們逐漸意識到,想要得到一個真實的、有意義的結果,對于研究質量的考量在研究設計階段必不可少。在這個過程中,樣本量估算逐漸受到重視。
樣本量過大或過小都有缺點。樣本量過大時,可能會經費不足,更重要的是實際操作難度較大,比如質控,四大期刊都傾向于多中心研究,其存在具有代表性等諸多優勢,但其質控需要嚴格把控。樣本量大到一定程度,足以獲得統計效能來檢驗組間差異之后,繼續增加樣本量可能就比較浪費。
樣本量過小,操作簡單,但可能檢驗效能低到根本不足以檢出差異。就像一些陰性結果的研究局限性部分,常見其將陰性原因歸咎于樣本量過小,但其實并不一定。
其實,估算樣本量主要是為了克服抽樣誤差。臨床研究一般是想通過抽樣的樣本人群得出結論,然后推廣到總體目標人群,是從樣本到整體的一個過程。而抽樣人群的數據是碰巧存在的,還是真實存在的?這就需要應用統計學來處理。
這種利用樣本信息對相應總體的特征進行的推斷稱為統計推斷。而處理上述問題時,“對所估計的總體首先提出一個假設,然后通過樣本數據去推斷是否拒絕這一假設”的過程,就是常說的假設檢驗。
如果來自同一總體抽取的兩個樣本,其差異是因為抽樣誤差,對應到統計學中即“P>0.05”,無統計學意義。而如果來自兩個總體分別抽取的樣本,其差異是本質不同引起的,對應到統計學中即“P<0.05”,有統計學意義。
![]()
在假設檢驗中,有兩個概念和樣本量估算有關,其一為I類錯誤,也就是假陽性錯誤,常稱棄真假設;II類錯誤為存偽。對應的統計學參數為α和β,前者對應的是可信度,也就是常見的顯著性水平P值預設的0.05;后者1-β對應的是把握度,代表兩總體確實有差別時,差別被檢出的能力。
那么P值有什么意義呢?舉例來講,如果兩組(A vs B)的有效率是固定的,不同樣本量的P值如下圖,第三種情況P<0.05,但處于臨界狀態,稍有變動可能就會出現組間差異不顯著的情況。因此,研究者不應神化P值。
![]()
臨床研究的設計中,樣本量只是統計學解決的問題之一。估算樣本量并不是套公式就可以簡單計算的,而是一個系統的工作,必須對研究者計劃的療效指標、隨訪情況、組內變異、α、β等等都有一定的了解。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.