古文書を自動翻訳する日も近い！？江戸時代の8万字超の「くずし字字形データ」が無償公開へ

2016.11.18 13:01 | Japaaan

古文書を自動翻訳する日も近い！？江戸時代の8万字超の「くずし字字形データ」が無償公開へ

大学共同利用機関法人情報・システム研究機構国立情報学研究所（NI）と大学共同利用機関法人人間文化研究機構国文学研究資料館（国文研）がすごいデータを無償公開しました！

11月17日に公開されたのは、江戸時代の古典籍に書かれたくずし字の1文字ずつの字形画像データ。その数なんと8万6176件（1,521文字種）になります。

「どういうこと？」と思ってますか？どれほどすごいことか、以下のリリース情報の画像解説を見ればわかります！

データは「日本古典籍字形データセット」という名称で、字形画像データのほか、文字が古典籍のどの位置に書かれているかを示す文字座標データと、原本の画像データも含まれています。このデータは二次利用を歓迎するオープンデータとして無償提供中。

例えば、古典籍から抽出された「あ」のほんの一部。「あ」にも色々な癖がある。

例えば、古典籍から抽出された「か」のほんの一部。

次のページへ

ピックアップ PR

ランキング

総合

カルチャー

0歳と1歳の子供を連れて雷雨の中へ飛び出そうとしていた私。すると突然、後ろから...（福岡県・30代女性）

Jタウンネット

銀座エリア限定！ステッカーを集めてカスタムできる、日本上陸30周年記念の「スタバカード」が登場中《8月2日から》

東京バーゲンマニア

自転車を持つだけで税金？昭和まで続いた「自転車税」の意外な歴史と脱税が横行した理由

Japaaan

【季節・数量限定】キンモクセイの香りを天然精油で再現した「スチームクリームキンモクセイ&茶」新登場

Japaaan

マグカップで簡単に作れる平成スイーツがアップデートして復活！「マグカップでふっくらケーキ！モコモコ」8月3日に発売

東京バーゲンマニア

「全店舗で売って！」の声続々　もち吉の〝かわいすぎる限定グッズ〟に熱視線→買えるのは地元だけ？本社に聞く

Jタウンネット

鳩サブレーの豊島屋が『鳩の日』（8月10日）限定グッズ詳細を発表！今年はシリコンポーチ「はとっこ」

Japaaan

土偶なりきりパーカーも！青森の縄文遺跡群で発掘された土偶がモチーフのキュートなグッズが新発売

Japaaan

『豊臣兄弟！』小一郎の5万の大軍に徹底抗戦！切腹覚悟で長宗我部元親に降伏を迫った武将・谷忠澄の生涯

Japaaan

【フルーツピークス】フルーツが主役のアフタヌーンティーが2200円！都内の対象店舗は...。

東京バーゲンマニア

もっと見る