情報・システム研究機構のデータサイエンス共同利用基盤施設 人文学オープンデータ共同利用センターおよび国立情報学研究所、そして人間文化研究機構 国文学研究資料館の3者は11月11日、東京都千代田区で公開イベント「日本文化とAIシンポジウム2019~AIがくずし字を読む時代がやってきた~」を開催した。
課題となる「くずし字」の読み解き
同機構によれば日本では、古典籍や古文書などの歴史資料が数億点規模で現存しているが、その多くが「くずし字」で書かれている。
ほとんどの現代の人は「くずし字」を解読できないため、膨大な「くずし字」の資料をどうやって読み解き、後世に伝えていくかが課題となっている。
こういった背景を受け、3者は独自のくずし字認識アルゴリズムの開発に取り組んでいる。
最近では「くずし字認識:千年に及ぶ日本の文字文化への扉を開く」と題するコンペティションも開催。AIを活用してくずし字の認識に挑むことを目的に、世界のAI研究者・技術者を対象に行った。
AIくずし字認識サービスも一般初公開
今回のシンポジウムでは、同コンペティションの入賞者が登場し、それぞれが開発したくずし字認識アルゴリズムについて解説した。
その他、日本の文字文化の研究者による最先端研究の紹介や、 人文学オープンデータ共同利用センターが中心となって開発を行ったAIくずし字認識サービス「KuroNet」の一般初公開などを行った。
Adobe Stock開催報告によれば、220人を超える来場者は、くずし字の読み説き技術がどこまで進んでいるのかを興味深く体感したという。
U-NOTEをフォローしておすすめ記事を購読しよう