「くずし字」をすぐに現代日本語の文字に変換する
AIくずし字認識アプリ「みを(miwo)」

古い時代の本を読みたいと思っても、「くずし字」が読めずに諦めている人も多いだろう。2021年8月に公開された、情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(ROIS-DS CODH)による「みを(miwo)」は、そんな悩みを解決してくれるアプリである。

スマホ・タブレット対応の「みを」は、約100万文字の「くずし字データセット」を学習した、最新のAIくずし字認識技術を用いたアプリ。カメラで資料を撮影してボタンを押せば、AIが数秒でくずし字を現代日本語の文字に変換、いつでもどこでもくずし字資料を読むことができる。

くずし字資料に関心を持つ人にはテクノロジーに不慣れな人もいると考え、シンプルなユーザーインタフェースを採用。資料の内容をすぐに確認できるように、カメラ撮影画像の上にくずし字と現代日本語の文字を並べて表示してくれる。

くずし字資料画像と現代日本語の文字表示は比較スライダーで切り替え可能。さらに、文字を囲む四角形を表示することで、続けて書かれるくずし字(連綿体)の切れ目が見えるようになっている。

また、ユーザーがAIの認識結果を適切ではないと思う場合は、自身でROIS-DS CODHの「くずし字データセット」を参照して判断し、AIの認識結果を修正することで、より信頼性の高いテキストデータを実現。アプリの支援により、利用者がくずし字を読む能力も向上するという。

Android版とiOS版が無料ダウンロード可能で、2022年度グッドデザイン賞の受賞を機に新バージョンもリリース。AIくずし字認識の新しいモデル「RURI」により、文字背景の色や模様が複雑な場合でも精度が向上したほか、これまで認識できなかった一部の文字をアプリで新たに認識できるようになった。End