NONMEMの解析において必要とされる品質を考えると、まずはデータセットが正確であることだ。正確というのは、ただの一つも間違いがないということ。
ところが、NONMEMのデータセットは様々な臨床データベースから作られる。あるいは帳票からおこされる。データセット作成は手動というよりはソフトウェア内で行われる。
できたデータセットの確認をどうするかというと、だれかほかの人にデータセットをもう一度作成してもらい、両データセットの一致性をプログラムで確認する。SASだったらPROC COMPAREだ。
読み合わせをするという方法もある。だが、1万以上に及ぶ数字を読み合わせるというのはかなり時間を要する。たとえば私の手元にある、普通のPhase1試験のPKデータ。3試験を併合したNONMEMデータセットは、1671行あり、データアイテムとして10個。つまり16710個の数値がある。1つの数字の読み合わせ確認に、3秒つかうとして、読み合わせの純粋な時間として14時間かかる計算になる。PKPD解析した場合はさらに数字量は増える。
なので、これはあまり現実的ではない。読み合わせをやったことのある人ならわかるだろうが、読み合わせはあまりにも長時間、かつ単調な記録について実施すると正確さが下がる。読み合わせの大義名分からは決して言ってはいけないことだが(笑)。
NONMEMのデータセットのような単調な記録の確認作業が、高品質に行えるとは限らない。むしろ、こういう作業はコンピュータに任せたほうがいい。品質管理の基本は、複数の人間が確認することによってエラーが減らせるという意味なのだから、2名の人間がデータセットを独立に作成することによって、エラーを減らせるという点でダブルプログラミングには問題はない。
これを考えたときに、COMPAREする機能自体が信用できるかという問題がでてくるかもしれない。ソフトウェアを信じてよいのかという問題だ。
そもそも信用できないソフトウェアは使っていないはずだが、その比較機能について何らかの確認をしたいと思うことがあるかもしれない。私の場合、目視で同一であることがわかっているデータセット2つについてと、乱数を用いて発生させた大量の数値を含むデータセット2つについて、それぞれ機能確認をしている。そういう記録があれば、ユーザー側が責任を持つという姿勢がとれるからだ。
大量の数値を含むデータ、については25万行×31列までを確認している。これは私からしたら意味はないのだが、「100個の数値を間違いなく比較できても、101個めでは破たんするのではないか」ということを封じるためである。人間ならこういうエラーはあるが、通常、コンピュータのエラーはこういう出方はしないものだから、あまり意味がある作業ではないけど。また、このデータの中にランダムにエラーを入れたものについても試している。
最近のコメント