医療系リアルワールドデータの利活用、いわゆる二次利用は日本では進んでいないと言われています。
その理由については、細かくは様々あるのですが、主に2つに集約されます。
- 理由1: データ前処理の難易度が高い
- 理由2: プレイヤーの層が薄い
これらについて順に説明していきます。
理由その1: データ前処理の難易度が高い
はじめに、「リアルワールドデータの前処理の難易度が高すぎる」という問題です。
これが最も大きな課題です。
従来までの臨床研究とは異なり、データハンドリングの負荷が著しく高まります。
ほとんどの人は、前処理をした経験がないため、実感がわかないかもしれません。
その理由について、誰でも理解できるように、別ページに書いていますのでそちらを参照ください。
理由その2: プレイヤーの層が薄い
次に、プレイヤーの層が薄いという問題です。
リアルワールドデータを用いた研究に意欲的に取り組んでいるのは一体どのような方々でしょうか?
実感として、下記の方々がメインプレイヤーです。
①疫学者(医師免許は保有していない)
②医師免許を保有している人
疫学者は、大学などの機関に勤務している教員や研究者、そして製薬企業などに勤務している場合もあります。
リアルワールドデータの扱いに最も精通しているのは、現状では間違いなく疫学者です。
なぜなら、特に研究機関では論文を書かなければ生き残れないため、必死になって論文を書きます。
そのため、最もリアルワールドデータについて真剣に取り組んでいるのが疫学者です。
しかしながら、絶対数とその層の厚さが諸外国と比較してどうしても劣ります。
リアルワールドデータのハンドリングに対応できる研究者はそれほど多くありません。
次に、医師免許を持つ人という言い方をあえて採用しています。
もちろん研究機関に勤める医師は論文を書く必要があるため、リアルワールドデータを利用したい気持ちはあります。
特に日本では、医師免許を持つまでになると、ほぼ間違いなく医師業を主な生業とする傾向があります。
社会的地位が圧倒的に高いことに加えて、賃金も高いことが起因していると思われます。
つまり、医師免許を保有している時点でリアルワールドデータを用いた研究は良くも悪くも片手間になります。
結果どのような思考になるかというと、医師免許を保有するほとんどの人は「データハンドリングは人に任せたい」となります。
ある人は「我々はリサーチクエスチョンを出す側の人間だ」と考えるかもしれません。
このような状態では「データ解析の途中工程をブラックボックス化して結果の解釈のみに終始」してしまいます。
リアルワールドデータは、データ解析が醍醐味です。この過程をスキップするのは本末転倒です。
残念ながら、リサーチクエスチョンを出すのは人工知能様が最も得意とする領域です。
将来的に、仮説構築は人工知能様一択の作業となるでしょう。
根本的に、リアルワールドデータで課題となるデータハンドリングに真剣に取り組む人は少ないのです。
総括すると、やはりリアルワールドデータの利活用が進まないのは日本特有の原因があります。
他国に比べて博士課程や博士号を保有している人を軽視しているため、科学技術で遅れをとっている。
結果的に、疫学者の数も少なくなり、層も薄くなる(というか、現状そうなっている)。
根本的な解決策はないのか?
根本的には、「誰でもデータハンドリングができるような環境を作る」ことしかない。
しかし、このような雲を掴むような研究課題は、不安である。非常に不安だ。結果が出るかどうか不安である。
道筋すら思い浮かばない。それでは、国から予算が付きそうにない。困った困った。
でも前に進めるしかない。
もうデータベースを構築したり、標準化するような作業は一旦停止すべきだと思う。
データベースを整備するタイプの研究は道筋が分かりやすく、やれば前に進み、報告書も首尾よく出来上がる。
よって、国から予算も付きやすい。
日本は、いつまでデータベースを整備すれば気が済むのだろうか・・・
コメント