推定法とか
非線形混合効果モデルの推定法だったり、各種ソフトウェアの違いはどこが大きいかというと、ほとんどが尤度の扱い方に帰着されると考えられる。ある意味当然といえば当然なのだ。200例のPKデータがあるとし、i.v.1-コンパートメントモデルであるとする。そうすると素直に尤度を考えるとPKパラメータ数×200もの推定をしなければならないことになる。
L(θ, Ω, Σ|ηi, Yobs)を考えるということになるが、各被験者における変量効果ηiは未知だから、この尤度を理論的に考えることはできても現実的ではない。そもそもそれを求めることができないからモデル解析していると考えることができるし、母集団を興味の対象とするのだから、θ、Ωが主役である。個別値を求める必要はなく、分布形がわかればよいのだ。
だからこれを、L(θ,ηi, Σ|Yobs)*L(Ω|ηi)とする。そしてηについて積分してしまう。そうすれば得られた尤度はηに依存しない。全員分、合計してしまうというイメージでもいいかもしれない。これをmarginal likelihood、周辺尤度といっている。多変量正規分布の勉強をしたことがあれば、周辺分布という言葉にはであっているから、その尤度版を想像することは容易だろう。
この積分をいかに行なうか、近似の仕方や積分の仕方が異なっている。それが非線形混合効果モデルのオプションの違いと考えればいい。
線形近似はここに関係している。PKモデルは非線形であり変量効果はその構造上、おもいっきり非線形項として存在する。正規分布を仮定したとすると、尤度はexpのべき乗の部分にさらにPK式が入っている形になり、これは相当にとんでもない。そこで対数尤度とするが、それでもなおてごわい。微分と異なり、積分は必ずしも解析的にできないからだ。学生の頃、簡単そうな積分に苦労した経験は誰しもある。微分は機械的作業なのにだ。
よってTaylor展開することになる。特にη=0の周りで、Maclaurin展開すると積分は容易である。微分係数を求めるのは簡単なので、式はηの1次関数の積分になるから、これは単純だ。η=0でなく、POSTHOC推定値を求めてそれを代入し、η=ηiの周りのTaylor展開としてもよい。
さて、この近似はなかなかナイスなアイディアなのだが、波紋を呼ぶことになる。ηは確率変数である。確率変数の2乗というものは、分散を意味する。正確にはその期待値を分散として代表させるのだが、要はそれを無視していることと1次近似は同じであった。
そこで2次まで近似しようという話もでてくる。これは正しいことではあるが、一般に数値計算の世界では2階微分というのは扱いづらい存在であり計算時間がかかる。なので正しいとはいえ、なかなか使いがたい。
まぁ、こんなかんじでつかんでおけばよいのではないかと思う。ソフトウェアの難しいところは、この推定法というもの以外に、数値計算的なアルゴリズムの話もまざってくるところだ。パラメータ推定を反復計算で実行するが、それ自体はここで示した推定法の話とは違う。反復計算のアルゴリズムを理解することは、目的関数について理解しておくこととは違う。後者は解析のゴールを事実上決める、統計解析の前提であるので重要なのだ。だからテキストなどでは後者を扱っており、前者については記載さえないことがある。一方で線形最小二乗法や非線形最小二乗法では、推定値の求め方やアルゴリズムが書いてあることもある。
このあたりの記述のバランスの崩れも、混合効果モデルを理解しづらくしているのかもしれない。
今週はかなり仕事で疲れたが、やっと一息ついてこんなことを書いてしまった。自分も決して深く理解しているわけではないから、これも解説ではなくて随筆程度のものだけど。
| 固定リンク
« 共変量解析 | トップページ | 準Newton法 »


コメント