実験で使うとこだけ生物統計1・2 決定版

生物統計学のベストセラー『実験で使うとこだけ生物統計』が改訂された。これは7年ぶり、2度目の改訂であり、帯には「決定版」と記されている。
前版の「改訂版」と今回の「決定版」の違いを、AIにキャラクターで表現させた。ナイーブながら希望に満ちてスキルを集めていた若者が「改訂版」、その後多数のパンチを浴びて老猾になり頑健性を増したのが「決定版」だ。「改訂版」までは、クラシックな統計手法に則っていた記述も見られたけれども、いろいろなフィードバックがあったのだろう。決定版はそれらの議論へのアンサーになっている。

「改訂版」と「決定版」をキャラ化(ChatGPTで生成;手の形が変なのはAIのせい)

改訂版と決定版
筆者はバイオロジーの研究者であって、統計学の「ユーザー」だ。統計学にはなんども挫折させられ、苦労しながらもスキルを積んできたと告白する。研究に必要な統計学のエッセンスを労せずにゲットできるようにと、本書は企画された。
実際、この評者も本書の前版の「改訂版」に助けられた。群が3つも4つもあって困っていたとき、多重比較の使い方について詳説されていたテキストは、ほかになかったのだ。

筆者

「さっぱりわからないところから積み上げた」あとがきから(マーカーは評者;以下同様)

「さっと読むだけで本質を理解できるように」はじめに、から
本書の読者はつぎのような人になるだろう:
- 実験研究者
- 統計学を大学の授業や自習で学んだけど挫折させられてばかりだった
- 統計学のことは多少知ってるけど心許ない感じは抜けない
- 統計学用のソフトウェア(SPSSやRなど)にはアクセスがあるので、教えてもらわなくても大丈夫
本書は2巻に分かれている。第1巻が統計学の原理原則、第2巻が検定だ。両巻で多重検定と2元配置分析まで行くのが本書の特徴である。一般的な統計学の入門書では、パラメトリック検定、それもt検定あたりまでしかカバーされないのである。

各巻の内容
1巻の冒頭にチェックリストがあるので、まずここをみてみよう。答えられた部分は読み飛ばせばいいし、答えられなければ読み進めよう。

チェックリスト
学習者が「はて?」と思いがちなことは、ちゃんとカバーされている。不偏分散の分母がなぜn-1なのかとか、有意水準の0.5って誰が決めたんだよ、とか。
いっぽうで、検出力など、筆者にも分かりやすくは説明できないことは、正直にそう書いてある。統計学は数学の天才たちが構築した学問なので、あるポイントから先はそうなっていくのである。「この先危険」と教えてくれるのは、統計学のただのユーザーにはありがたい。

なぜn-1?

検出力のことは筆者にも上手に説明できない!
統計学は歴史のある学問だけれども、ベストプラクティスは変化している。
たとえば、解析に必要なnの見積り。そもそも実験動物を使った研究では、必要以上にnを増やさないことが求められる(文部科学省告示第七十一号:研究機関等における動物実験等の実施に関する基本指針)。「改訂版」では、数式が成り立つ最低数プラス若干、とナイーブな話になっていた。「決定版」では上記のように「効果量」「検出力」にも言及されている。
「等分散」の扱いもアップデートされた。t検定なら最初からWelchを使うとされているし、多重比較ならGames-Howellが紹介されている。
参考(元群馬大学教授・青木 繁伸氏のサイトから):

t検定は最初からWelchで

等分散を仮定しない多重比較
そんなこんなで、本書のいいところは、どういう解析法がメジャーなのか、どういうときにどういう手法が使えるのか、見渡せることだ。
そして、研究の裏話だったり、研究者としての心得がところどころにある。こういうのは、ふつうの統計学のテキストでは得がたいポイントだ。まあ、若者にはちょっと説教くさいかもしれないけれども。

たまたま有意になったのが論文になってるかも

統計学に基づいた実験計画の心得
本書を読んで、統計学を基礎から固めたいと思ったら『基礎から学ぶ統計学』を1〜2周してみよう。研究をやり始めたとかなら、『生物統計コンサルテーション』をチェックしよう。
本書にはソフトウェアの解説はないが、Rを使えるようになりたいなら、『Rをはじめよう生命科学のためのRStudio入門』がオススメだ。本学関係者は、『Rによる統計解析』もゲットし、その筆者のサイトを訪れよう。
医学統計は生物統計とも違い、特殊な手法が多い。『すべての医療従事者のためのRStudioではじめる医療統計』がいい。
当記事における紙面の画像の使用について羊土社より許諾されました(2024/8/31)。
コメントを投稿するにはログインしてください。