子宮頸がん検診を高精度に迅速化する病理AIの開発に成功 - Cancersに論文が掲載 (6/9ページ)
少なくとも、本邦の津々浦々の病院で現在施行されているヒト技師による細胞診を、すべて既存の自動スクリーニング支援システムに置き換えることは難しいのではないかと言われています。
ここまでをまとめますと、
・子宮頸がん検診は細胞診というハイレベルな人力検査によって支えられている
・人力でやる以上、エラーは避けられないので、精度管理のために機械化したい
・しかし従来の自動システムを導入するには困難がある
となります。もうピンと来る方が多いと思いますが、だからこそ、冒頭の「子宮頸部細胞診のAIは、待ち望まれていた技術でした」という言葉が出てくるわけです。
そして我々は、この度ついに子宮頸部細胞診AIを完成させました。ROC-AUCという精度の目安を示す数字が0.960です。この数字の素晴らしさは、日ごろ、検査の精度についてお考えになっている医療者や、検査室の運営に携わる方々、さらには機械学習をなさったことのある方なら実感できるのではないでしょうか。
ただ、専門的な技術と数字の話以上に、本AIの開発の過程では、我々が非常に驚いた話があったので、本プレスリリースではそちらの話を書きます。以下は「AI開発現場のナラティブ」です。
AI開発の過程で、はからずも、「ヒト細胞検査士がスクリーニングをすること自体への疑義」が浮き彫りになりました。それは、本論文のTable 1に見ることができます。
「ROC-AUC 0.960, Log Loss 2.244」という脅威のデータの上に、「Full Agreement」と書かれているのにお気づきでしょうか? AIの精度を検証する際には、まず細胞診プレパラートを複数の細胞検査士がチェックし、「ヒトによる診断」を用意します(正解を用意するのです)。その結果とAIの判定とを比べて、ROC-AUCやLog Lossなどの評価を行います。このとき、参加者全員の診断が一致していたデータを「Full Agreement」と名付けました。つまり、細胞検査士が全員良性、もしくは全員悪性と判断したプレパラートに関しては、AIは驚異的な正解率を誇った、ということがわかります。