永崎 研宣
ナガサキ キヨノリ
文学部 図書館・情報学専攻 教授
文学研究科 教授
研究概要
情報技術を用いて人文学の研究手法を改良することに力を入れています。元々は仏典のテキストデータベース構築から始まり、SAT大蔵経テキストデータベースの構築を手がけつつ、お寺に入って貴重な資料のデジタル化のお手伝いなどもしてきましたが、そこから発展して、データの持続可能性と共有可能性に焦点をあてるようになり、Unicodeにおける仏典外字の登録や、人文学向けテキストの構造化に関わる国際デファクト標準であるText Encoding InitiativeガイドラインやWeb画像共有の国際デファクト標準であるIIIFの開発・普及や規格の策定などに取り組んできました。さらに近年はAIの活用にも取り組んでおり、TrOCRを用いた木版や手書き資料の自動文字認識や、専門的データとRAGを組み合わせた生成AIの精度向上に取り組んでいます。2024年度はこのテーマで国内の学会・研究会のみならず、台北、敦煌、ベルリン、ブエノスアイレス、ワシントンDC、UCバークリー、ウランバートル等で研究発表をしてきました。日本でもこういう研究テーマが広がっていくとありがたいと思っています。 一方で、海外のこの種の研究を日本に広めるための活動にも力を入れています。2024年4月に三田で仕事を始めてからは、韓国、カナダ、米国(2回)、オランダから来日したこの分野の研究者に、三田に来ていただいて講演会などを開催しました。 文部科学省としても、人文学のDXという事業を開始し、そのなかでもテキストデータモデルの構築に関わる部分を慶應義塾ミュージアム・コモンズが受託して研究活動を始めたところです。今後の人文学の行く末にご関心がおありのかたは、ぜひこの活動に首を突っ込んでみてください。意外に役立つ発見があるかもしれません。
専門
情報技術を用いた人文学における研究手法の改良