国立国会図書館、デジタルシフトに向けて
視覚障害者のためのOCRを開発

国立国会図書館は、2021年から2025年までの5年間に実施する「ビジョン2021-2025 国立国会図書館のデジタルシフト」を掲げている。「変わらない4つの基本的役割」を遂行するほか、デジタルシフトに向けた7つの事業に取り組んでいるという。

これらは、将来にわたるすべての利用者に多様な情報資源を提供する「ユニバーサルアクセスの実現」と、そのための恒久的なインフラとなる「国のデジタル情報基盤の拡充」という、2つの事業分野に大きく分けられるという。

▲読み上げ順序の調整機能

前者のひとつのとなるのが、誰でも資料を使えるようにする「読書バリアフリーの推進」である。視覚障害等の理由で読書に困難がある利用者向けに、バリアフリー対応の資料の収集・検索・提供サービスと、利用しやすいテキストデータの製作支援を推進することを目指している。

▲レイアウト認識機能の改善

こうした視覚障害者等用のAIを活用したOCR(光学文字認識)システムを、モルフォAIソリューションズが開発している。2021年度に国立国会図書館が開発したOCR処理プログラムをさらに機能追加・性能改善するもので、テキスト検索だけでなく、視覚障害者用の読み上げにも活用できるテキスト生成ができるそうだ。

▲漢字の読み情報の自動付与機能

今回は開発されるのは、「読み上げ順序の調整機能」、「レイアウト認識機能の改善」「漢字の読み情報の自動付与機能」といったもの。複雑なレイアウトをもつページの読み上げ順序をサポートしたり、白抜き・色付文字に対応することで雑誌などの読み取りも可能になるとしている。End