日本語の文章の難易度を測るWebサービス「帯」
帯(obi)はrubyで書かれた日本語のテキストの難易度(リーダビリティ)を推定するプログラムで、ことば不思議箱にて公開されています。
文章の難易度は教科書からのサンプルを基準として算出しているようです。
難易度の規準には、小中高大の教科書127冊から抽出した1478サンプル、約100万字のコーパス(教科書コーパス)を用いています。
難易度は1-13(小学校から大学)のレベルで判断されます。ちなみにうちは9レベルで中学3年ぐらいの文章だそうです。
ソースコードも配布されてるみたいです。
日本語テキストの難易度を測る
http://kotoba.nuee.nagoya-u.ac.jp/sc/readability/
No related posts.






