薬剤疫学と医薬品安全性の世界的権威、スティーブン・エバンス医師(医学博士)が、臨床研究における科学的詐欺や不正行為の検出方法を解説します。データ改ざんを見抜くための思考法と統計的手法を詳述。エバンス医師は、不正行為の背景にある動機を考察し、臨床試験と市販後調査での発生頻度を比較します。さらに、報告数値に現れる「数字の偏り(digit preference)」を分析する強力な検出手法を、具体例を交えて紹介します。
臨床試験と医薬品安全性研究における科学的不正行為の検出
セクションへ移動
不正検出のマインドセット
Stephen Evans医学博士は、科学的な不正の検出は特定の考え方から始まると強調しています。研究者や規制当局はまず、不正が起こりうることを認める必要があります。この認識が、効果的な検出戦略を構築するための第一歩となります。
不正検出には積極的な姿勢と絶え間ない警戒が求められます。Stephen Evans医学博士は、データの完全性を検証せずに前提とすることが重大な誤りであると指摘します。この姿勢には、懐疑的な視点と厳格なデータ検証プロセスへの取り組みが不可欠です。
臨床試験のモニタリング
FDAなどの規制当局は臨床試験を厳重にモニタリングしています。Stephen Evans医学博士によれば、これにはデータ収集現場への実地訪問が頻繁に行われますが、この方法が常に最も効果的とは限らないとしています。
統計分析はモニタリング活動の最適化に極めて重要です。Evans博士は、統計的手法を用いて実地モニタリングが必要な施設を選定することを推奨しています。このデータ駆動型アプローチにより、臨床研究における不正検出の効率と精度が向上します。
試験における不正と市販後調査の比較
Stephen Evans医学博士は、研究の種類によって不正の発生しやすさに違いがあると指摘しています。臨床試験における不正は、観察研究や市販後調査に比べて検出が容易です。試験の構造化された性質が、パターン認識の機会をより多く提供するためです。
市販後調査では、臨床目的で作成された電子健康記録(EHR)がよく利用されます。Stephen Evans医学博士は、医療専門家がこれらのシステムに虚偽の患者データを記録することは稀だと述べています。市販後研究における主なリスクは、データの改ざんではなく、不適切な分析にあります。
研究不正の動機
研究者の動機を理解することは、不正検出において極めて重要です。Stephen Evans医学博士は、学術研究者が専門的な栄誉を求めて不正を犯す可能性があると説明します。陽性の試験結果は、重要な認知とキャリアの向上をもたらすことがあるからです。
経済的誘因も研究不正を引き起こします。Evans博士は、産業界が資金提供する試験では、参加者データに対して報酬が支払われる仕組みがあると説明します。一部の研究者はこの報酬を得るためにデータを捏造したり、手抜きをしたりすることがあり、検出手法で特定可能な明確なパターンが生まれます。
不正検出のための数字選好分析
Stephen Evans医学博士は、数字選好分析を用いた強力な不正検出手法を紹介しています。人間が数字を創作する場合、真にランダムな分布を作成することはできず、真正なデータとは異なる検出可能なパターンが生じます。
この手法では、報告された測定値の末尾数字を調べます。Stephen Evans医学博士は、人間が特定の数字(例えば7)を好み、他の数字(0や9など)を避ける傾向があると説明します。これらのパターンは、大規模データセットの統計分析を通じて明らかになります。
統計的検出手法
Stephen Evans医学博士は、不正検出のための専門的な統計的手法を開発しています。これらの技術は、データ改ざんを示唆する異常を特定するもので、特に血圧測定のような主観的測定値に対して効果的です。
Evans博士は、実際の試験データと創作データを比較することで、明確な差異が浮かび上がると説明します。改ざんデータの統計的パターンは、期待される自然分布から一貫して逸脱します。これらの検出手法は、研究不正を特定する新たな方法が開発されるにつれて、進化を続けています。
完全な議事録
Anton Titov医学博士: 私たちの興味深い議論の締めくくりとして、Evans教授、あなたの専門領域の一つである科学的不正行為の検出についてお聞きします。臨床試験や市販後調査、医薬品安全性分析において、実際に科学的不正行為をどのように検出できるのでしょうか?
Stephen Evans医学博士: まず、不正が起こりうるという考え方を持つことが重要です。現在、多くの臨床試験、特にFDAや規制当局によってモニタリングされている試験では、実施内容が注意深く監視されています。
ただし、データ収集現場を訪問するモニタリング方法が最も効果的とは限りません。通常、統計分析を用いて、どこで実地モニタリングを行うべきかを決定します。この点は改善の余地があると思います。
必要なのは、適切な考え方と分析、そしてデータの中から何を探すべきかの知識です。人間がデータを創作すると、実際のデータでは見られないパターンが生まれます。
不正検出の手法の詳細をすべて説明することは避けたいと思います。ある人物から、不正検出の方法を説明する際は注意が必要だと言われました。さもなければ、人々はそれを回避する方法を見つけてしまうからです。
それに同意するかどうかは確信がありません。私の仕事は、試験における不正や不正行為を検出する新しい統計的手法を開発することだと考えています。
実際、試験における不正の検出は、観察研究や市販後医薬品安全性分析よりも容易です。しかし、多くの市販後調査は、臨床目的で使用される電子健康記録(EHR)を利用して実施されます。
その場合、データ自体が不正であることは稀です。医師は一般に患者のために虚偽のデータを記録しませんし、他の医療専門家も同様です。しかし、データ分析が不適切である可能性はあります。
私の経験では、市販後安全性分析において、学術試験で見られるほど多くの不正は見られません。学術試験では、試験結果が研究者に栄誉をもたらします。人々が不正を犯す動機を認識する必要があります。
多くの医師は、産業界が資金提供する無作為化試験に参加し、そこから得られる報酬を好みます。そのため、試験データに対する報酬を得るために手抜きをしたりデータを捏造したりする誘惑に駆られ、時にはそれに屈する可能性があります。
これが起きた場合を検出するかなり優れた方法があると思います。観察研究が不適切に行われた場合の検出方法はあまり優れていませんが、それを見つける可能性はあります。
Anton Titov医学博士: あなたが発表した興味深い論文の一つ(公開されているので周知の事実だと思います)では、心血管疾患に対する特定の栄養介入試験と医学的介入試験を比較し、データの末尾数字の分析によって、科学的な不正行為が分析で発生しているかどうかを明らかにできることを示しています。あなたの分析手法の一例として、このアプローチについて簡単にご説明いただけますか?
Stephen Evans医学博士: もし私が聴衆全員に0から9までの一桁の数字を考え、今すぐ書き留めてもらい、その結果を見ることができたとしたら、0から9の数字が均一に分布することはないでしょう。
例えば、0は非常に少なく、9も比較的少なく、7はかなり多くなるはずです。人間が数字を創作し始めると、コンピューターを使わない限りランダムに創作することはできません。そしてコンピューターを使った場合でも、それを検出する方法があります。
したがって、主観的な測定値(特に血圧、または患者の診察後に誰かが記録した身長や体重など)では、数字の選好が見つかります。これは必ずしも不正を意味するわけではありません。
しかし、無作為化試験のためにすべての数字を創作して記録しなければならない場合、人間が数字を記録する際のパターンによって、実際のデータである可能性が高いものとの差異を検出することが可能になります。
あなたが挙げた例では、実際のデータ試験と明らかに創作されたデータがあり、それらの間の差異を検出できました。なぜなら、データを創作した関係者たちは、現実世界で観察されるものを再現できなかったからです。