エージェント型AIが臨床文書から認知機能障害の早期段階をスクリーニング
米国マサチューセッツ総合病院のMass General Brighamの研究チームは、日常の臨床文書を分析し、認知機能障害の初期段階にある人々をスクリーニングできるエージェント型AIを開発しました。このAIは完全に自律的であり、導入後は人間の介入を必要としません。リアルワールド検証テストでは98%の特異度を示しており、その成果はNatureのnpj Digital Medicine誌に2つの大規模言語モデル(LLM)ワークフローとして発表されました。
「デジタル臨床チーム」としてのAIシステム
研究者らは、このAIを「単一のAIモデルではなく、デジタル臨床チーム」と表現しています。これは5つの専門エージェントで構成され、それぞれが互いの推論を批判し、洗練させることで、臨床医のケースカンファレンスのような機能を果たします。このシステムは、Mini-Mental State ExaminationやMontreal Cognitive Assessmentといった既存の認知機能検査が抱える、煩雑さや結果のばらつきといった課題を補完し、改善することが期待されています。アルツハイマー病などの認知機能低下を遅らせる新薬が登場している現在、最適な治療期間を逃さないための早期発見が急務となっています。研究者は「臨床記録には、忙しい臨床医が体系的に表面化できない認知機能低下のささやきが含まれており、このシステムは大規模にそれを聞き取る」と述べています。
研究結果と今後の課題
この研究では、200人の匿名患者から収集された3,300件以上の臨床記録を分析しました。AIエージェントの結論は人間によってレビューされ、意見の不一致があった場合には独立した専門家が再評価を行いました。結果として、バランスの取れたテスト条件下では91%の感度を達成しましたが、リアルワールド条件下では62%に低下しました。一方で、陰性症例を除外する特異度はほぼ完璧でした。AIと人間のレビューアの間で不一致があった場合、専門家はAIの推論を58%の確率で妥当であると評価し、初期の人間のチームが見落とした健全な臨床判断をAIが行っていた可能性を示唆しています。研究チームは「AIが苦労する分野を正確に公表している」とし、「臨床AIが信頼されるためには、これらのキャリブレーションの課題を隠すのをやめる必要がある」と、透明性をもって課題に取り組む姿勢を強調しています。また、あらゆる医療システムや研究機関が自律型AIスクリーニングアプリケーションを開発・展開できるオープンソースツール「Pythia」も公開されています。
元記事:Autonomous AI can spot cognitive decline in medical notes