慶應義塾大学医学部生理学教室の岡野雄士(医学部5年生)、加瀬義高助教、岡野栄之教授らの研究グループは、未解決であったシングルセルRNAシークエンス(scRNA-seq)のデータ解析の技術的な課題を克服するモデルを開発し、scRNA-seqデータ間の普遍的な特徴を抽出することに成功しました。
細胞の遺伝情報を網羅的に収集、解析することのできるRNA-seq、特に細胞ひとつひとつの情報を読み取ることのできるscRNA-seqは現在の医学研究において、もはや必須のものとなっています。ただし、急速に発展してきた技術であるが故に、その解析手法にはいくつかの課題があり、それから得られた結果は果たして本当に生物学的な本質を写し出しているのか疑問視されていました。
また、scRNA-seqから細胞種の情報を推定するアノテーションという処理は、細胞の形態学的な情報がないscRNA-seqデータにおいて最も重要な処理工程でありますが、従来のアノテーション方法では、発現変動遺伝子解析によって、データセットに含まれるサンプル間での相対的な比較を行い、有意に発現量が上昇している遺伝子群から恣意的に解釈可能なもの選んで細胞種を推定するため、異なる個体間で共有されている細胞種の「普遍的な特性」を抽出することができていませんでした。さらに、アノテーションは、scRNA-seqデータに対して行われるさまざまな示唆的なデータ解析に先立って行われるため、scRNA-seqデータ解析の結果が、どれだけ一般化可能な真実を写した結果であるのかが問題となっていました。
本研究では、scRNA-seqデータから細胞種の「普遍的な特性」を遺伝子制御ネットワークとして可視化して、そのネットワークの類似性によって細胞特性の近さを評価する指標の開発に成功しました。さらにその指標を体系的な手法でアノテーションに応用することにより、異なる個体由来のscRNA-seqデータを効果的に統合することができるようになりました。実際に、複数個体のヒト胎児脳由来scRNA-seqデータにて本研究成果のモデルを実装してみると、従来法と比較し、よりデータ横断的な特徴を反映したアノテーションが可能であることがわかりました。
この成果により、疾患解析などの研究でこれまで行われてきたscRNA-seqで見落とされていた重要かつ本質的な結果が得られることが期待されます。さらに、希少疾患の解析など、複数の個体や複数の研究機関から取得されたサンプルのデータを統合して解析する必要がある研究テーマにおいて、生データに恣意的な加工を加えずに普遍的特性を確認することができるため、さまざまな分野における応用が期待されます。本研究成果は、2022年11月17日11時(米国東部標準時)に国際幹細胞学会公式ジャーナルである Stem Cell Reports の特集号に掲載されました。