サンプル数の設定 -どうやって決めるの?-
では、サンプル数設定の続きですね
計算は・・・ソフトがやってくれます 終
身もふたもないんですが、Rというソフトを私は使用しているんですが、そのソフトに
>power.t.test(power=.8, delta=.5, sig.level=.05, type='two.sample')と入れるだけでサンプル数を計算してくれます!
ちなみに、この場合、n=393.4067と出ますので、サンプル数は394人となります。
power は検定力(1-β)
delta は真の平均値の差(実験母集団平均値-対象母集団平均値)
sig.level は有意水準
type は t検定の型 例えば、対応なしの2群なら"two.sample" 対応ありなら"paired" と入れます
計算結果には sd(標準偏差)が出ますが、なんせ試験前でデータはなく、標準偏差など出るはずもないわけで、、、 なんで規定値が1です
前回の記事で出ました効果量は 平均の差の絶対値/2群共通の標準偏差でした
なんで、この場合、標準偏差が1で平均差を0.8と設定しているのでdelta=効果量として扱えるので0.8が入ってます。
この中で前の記事で出てきてないのが検定力:1-β
2種の誤りのβですね 2種の誤りって何か?
有意水準αは 確立α(一般的には5%)でしか帰無仮説(両群差がないという仮説)が起きないんで棄却されるんですよね
でも言い換えるとα(5%)の確立で帰無仮説(両群さがないという仮説)が起きるんですよ
帰無仮説がホントは正しい(という仮定)のに帰無仮説が棄却される確率をα、第1種の誤りと定義しているんです
じゃあ、逆もありますよね
帰無仮説が正しくない(という仮定)のに帰無仮説を採択してしまうこともありますよね
この確率βを第2種の誤りと定義しています
じゃあ、1-β は間違えない確率を表してますよね これを検定力、検出力というそうです
対立仮説が真に正しいときに対立仮説を採択できる確率を表しているんです
で、これも有意水準と同じように懇意的に数値がある程度決まっていて80%以上が妥当だそうです
なんで、論文でαと1-βが出ていれば、サンプル数の推定(あくまで推定です・・・)を出して試験のデザインをしているんだろうな
という判断ができるというわけです
ただ、効果量の設定を示している論文はほとんど見たことがありません
効果量0.2(小さな差)でもそれに適切なサンプル数として出るだけです
やはり臨床的に有意な差というのはそれぞれの患者さんの背景から加味されるものなんでしょうね
では、今回はこれにて。