サンプル数の設定 -効果量って何?-
論文の妥当性を評価する項目として
①ランダム化されているか?
②ITT解析か?
③1次outcomeは明確か?
④真のoutcomeか?
⑥サンプル数は十分か?
等がありますが、⑥が一番わからなかったのでそこを復習
そもそもなぜ サンプル数が十分か? 検定をする必要があるのか? ということを再度確認したいと思います。
サンプル数がなぜ重要か?
例えば、A、Bの2種類の降圧薬を独立した群(統計的には対応がないと言うそうです)に投与してデータが得られたとします。
Aが平均10mmHg Bが平均14mmHg 血圧を下げたとします。
パッと見 Bの方がより血圧を下げているように見えますよね。
でも本当にそうでしょうか?
偶然の可能性はないのでしょうか?
たまたま100例ずつだったからこうなっただけで、人類全員にやれば同じかもしれない。
でも人類全員なんてできませんよね。 だからサンプルからやるしかない。
そこで適切なサンプル数というものがどれくらいかを知る必要があるわけです。
じゃあどうやって適切なサンプル数なんて決められるの?
その前に、そもそもどれくらいの効果が必要なのか?も知る必要がありますよね。
例えば1mmHgしか下げないなら、それ飲む必要無いでしょうということになる。
じゃあどれぐらい下げればいいのか?
ちょっと脱線気味になりますが、それには疫学調査のデータが必要ですね。 どんなデータが必要か?
「○○mmHg 血圧を下げたら、その後の脳出血を起こす確率が50%減りました!」 というデータが疫学調査から得られれば、
その○○だけ下げられるような薬を飲めばいいわけです。
で、開発された薬を飲んだ時と飲まない時で○○mmHgの差があればいいわけですよね
※本当はその薬を飲んで脳出血の発生率の減少を検証すべきだが、十数年後に発生するものを予防する」などのものは
直接それを検証するには開発段階では無理があるのでどうしても代用のoutcomeを使用することになってしまうものもあります
開発した薬が期待通りの○○mmHg減らせるかどうかはやってみないと解らないわけですが、人にやるわけですから
適当な人数に投与して効果が大してなくて、副作用ばっかり出たら会社としては大損ですね
ですから、「平均して○○mmHg減らせる」というデータがほぼ確実なデータが取れるにはどんな計画を立てればいいのか?
を考える必要があるわけです。 ここでサンプル数の設定が出てきます。
○○mmHg減らす期待値 これを効果量(es)というそうです。
効果量の式 効果量=平均の差の絶対値/2群共通の標準偏差 であらわすそうです。
例として、 平均の差が10mmHg 標準偏差が5mmHg なら 効果量は2ですね。 この2は理想値ですね。
実際はもっとばらつきがあるでしょうから2を下回ると思います(理論的には効果量は上限も下限も無限)
で、これは有意水準の0.05、0.01なんかと同じで完全な懇意で設定されているのですが、
小さなさ(es)=0.2 中程度の差(es)=0.5 大きな差(es)=0.8 としているそうです。
じゃあ、まあ、0.5ぐらいならいいじゃないか?と思い立ちます。
この場合、 平均の差が10mmHgで標準偏差が20mmHg
ということになるでしょうか。 まあ、この設定は完全に主観、懇意で設定してますね。
で、ここからどのようにサンプル数を決定するのか?ですが、それはまた次の記事で。 長くなってしまうんで。