熊本大学とTOPPAN、くずし字AI-OCRで未解読だった「細川家文書」約5万枚の解読に成功。検索システムも構築 - INTERNET Watch
https://internet.watch.impress.co.jp/docs/news/1611895.html
国立大学法人熊本大学とTOPPAN株式会社は、公益財団法人永青文庫所蔵の歴史資料「細川家文書」(ほそかわけもんじょ)のうち、崩し字で書かれた約5万枚の未解読の古文書を、TOPPANが開発したくずし字AI-OCRを用いて解読し、約950万文字のテキストデータの生成に成功した。さらに、くずし字AI-OCRによる解読と連動するキーワード検索システムを構築した。
くずし字AI-OCRによる解読と検索システムの一体化によって、くずし字の解読が障壁となっていた古文書などの一次史料への網羅的調査が容易になることが期待されるという。