慶應義塾大学医学部
東京科学大学
静岡大学
慶應義塾大学岸本泰士郎教授(医学部医科学研究連携推進センター)、東京科学大学高橋英彦教授(医歯学総合研究科精神行動医科学分野)、静岡大学狩野芳伸教授(グリーン科学技術研究所/情報学部)らを中心とする研究グループは、統合失調症患者の発話を自然言語処理(NLP)により多階層的に解析し、自由会話において共通して観察される中核的な言語指標として、①格助詞の低下(「誰が何をしたか」といった文法的関係を示す手がかりの弱まり)、②語の意味的類似度の上昇(語の選択が意味的に近い範囲に偏る傾向)、③副詞の使用頻度の低下、の3要素を同定しました。これら3指標を組み合わせたモデルは、独立検証においてAUC=0.87(95%CI 0.74–0.97)と高い判別性能を示しました。
統合失調症における言語障害は、形態・統語・意味・談話といった複数の階層にまたがることが知られていますが、従来研究では単一レベルの指標や単一課題に依存した評価が多く、課題を超えて再現される「核」となる特徴は明確ではありませんでした。
本研究グループは、約10年間にわたり500名を超える精神疾患を患う患者から自然会話および課題会話データを収集し、30〜60分の会話記録からなる約1,300件にのぼる世界最大級のデータセットを蓄積してきました。本研究では、このうち統合失調症患者104名および健常対照者101名の半構造化面接データを用い、発話テキストを対象に、形態・統語・意味・談話にまたがる計76の言語特徴量を抽出しました。その後、因子分析を行うことで代表的特徴量を選出し、診断との関連を検証した結果、上記の3指標が最も強く統合失調症の罹患と関連することが明らかとなりました。特に、格助詞および副詞の使用頻度の低下は再現性高く確認され、統合失調症の言語特徴として頑健なものであることが示されました。
本成果は、統合失調症の言語障害を「形態統語的明示性の低下」「意味空間の狭まり」「修飾による文脈調整の低下」という3要素として整理する新たな枠組みを提示するものであり、将来的な客観的モニタリング指標の基盤となることが期待されます(※本研究は個人の診断を単独で行うものではありません)。
本研究成果は、6月23日(日本時間)に国際学術誌 Psychological Medicine に掲載されました。
プレスリリース全文は、以下をご覧下さい。