初めまして。
私は産婦人科医をしながら機械学習、因果推論、ベイズ統計などを医療データに応用する研究をしています。
産婦人科の、特に産科領域は扱うテーマが妊婦と胎児を対象としており、ランダム化比較試験などを行うことが倫理的に難しいことが多いです。
しかし他科同様に「何が疾患のリスクとして大きく寄与しているのか」「どの薬が疾患に対してよく効くのか」を知りたいのもまた事実であり、そのジレンマから産科領域は他科に比べると発展が遅い(と個人的には思っている)分野でした。
そのような中で、既存のデータから特定の条件下でランダム化のような状況を作り出し、何とかその因果関係に迫ろうとする因果推論のアプローチ、ならびに非線形的な関係や画像・音などまで含めて予測の手段とすることができる機械学習の各手法は、上記のジレンマを解決することができるのではないかと思ったのがこれらを学ぼうと思ったきっかけでした。
今後これらの手法はますます人口に膾炙し、発展していくことでしょう。
一方で、データの解釈を間違うと容易に結果がねじ曲がってしまうのがデータサイエンスの恐ろしいところです。
エセ科学は論外ですが、各統計・機械学習の手法ではなにが前提条件で、何ができて何ができないのかを理解して利用すべきだと日々思います。
上記の理由から、現在仕事の傍ら勉強を続けています。
まだ勉強中の身ではありますが、学んだから考えたことを備忘録として記載していこうと思います。
学んだことをできるだけわかりやすく整理し、アウトプットをすることで系統的に理解を深めたいというのが目的です。
僕は数学が専門ではないので、記載内容が間違ってしまうこともあるかもしれません。
その際はぜひご指摘いただけますと幸いです。
また、同様の理由から、当ブログの記載内容についてはご自身の判断で利用をお願いします。
数理的な詳細は統計専門家にご相談いただくことをおすすめします。
また、医学相談などは一切請け負っておりませんので、悪しからずご了承ください。
最終更新日: