新AIモデル「popEVE」:未知の遺伝子変異による疾患リスクを特定し、希少疾患診断を革新
ハーバード大学医学大学院とゲノム規制センター(CRG)の研究者らが、ヒトタンパク質の変異が疾患を引き起こす可能性と重症度を予測する人工知能モデル「popEVE」を開発しました。このモデルは、これまでどの人にも見られなかった変異であっても特定できるのが特徴です。
popEVEの概要と機能
進化データとヒト集団データの活用: 数十万種の異なる種のデータと、ヒト集団全体の遺伝的変異のデータを用いて開発されました。
生命に不可欠な部位の特定: 約20,000種のヒトタンパク質のどの部分が生命に不可欠で、どの部分が変化を許容するかを特定します。
疾患原因変異の予測とランク付け: 疾患を引き起こす変異を特定するだけでなく、その重症度を体全体でランク付けすることが可能です。
医療診断への影響と利点
希少疾患診断の変革: 希少疾患患者の半数が明確な診断を受けられない現状を変え、医師が最も有害な変異に焦点を当てるのを助けます。
リソースが限られた医療システムでの利用: 患者の遺伝情報のみで機能するため、親のDNAが利用できない場合でも診断を迅速、簡素、安価にできます。
プロテオーム全体での比較: 全ヒトプロテオーム(約20,000種のタンパク質)全体で変異の重症度を意味のある形で比較できる初のモデルです。
遺伝子データベースの偏りの解消: 欧州系の祖先が優勢な遺伝子データベースの偏りによる誤診リスクを軽減し、あらゆる人種・民族の患者に対して公平な結果を提供します。
検証結果
高い診断精度: 重度の発達障害を持つ31,000以上の家族の遺伝子データを分析し、98%のケースで既知の原因変異を最も有害な変異として正確にランク付けしました。
競合モデルを凌駕: DeepMindのAlphaMissenseなどの最先端の競合モデルを上回る性能を示しました。
新規疾患候補遺伝子の発見: これまで発達障害と関連付けられていなかった123の新規疾患候補遺伝子を発見しました。
限界
対象範囲: タンパク質を変化させるDNA変異のみを解釈し、他の種類の変異は対象外です。
臨床的判断の代替ではない: 診断には、病歴や症状分析など、医師の臨床的判断が依然として必要です。
元記事:AI learns from the tree of life to support rare disease diagnosis