Edge, Chrome, Safari, Firefox推奨
UniDicのロゴ コーパス開発センターのロゴ
現代書き言葉UniDic unidic_bccwj

現代の書き言葉テキストを短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。

書籍、 雑誌、 新聞、 白書、 検定教科書、 広報紙、 Web掲示板、 ブログ、 韻文、 法律文書、 国会会議録 など

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

語彙サイズ(UTF-8)

ライセンス
GPL v2.0/LGPL v2.1/修正BSD

unidic_bccwj_download_button

旧バージョンはこちら

参考文献
References
現代話し言葉UniDic unidic_csj

現代話し言葉の転記テキストを短単位自動解析するための解析用辞書です。 学習には『日本語日常会話コーパス(CEJC)』を利用しているので、 その転記基準に即したテキストの解析に使用できます。

CEJCの転記基準は以下の文献で確認できます。

  • 臼田泰如, 川端良子, 西川賢哉, 徳永弘子, 小磯花絵: 『日本語日常会話コーパス』の転記基準について, 言語処理学会第23回年次大会発表論文集, pp.174-177 (2017).
  • 川端良子, 川端 良子, 臼田 泰如, 西川 賢哉, 徳永 弘子, 小 磯 花絵: 「日常会話コーパス」の転記基準と作業工程, 言語資源活用ワークショップ2016予稿集, pp.296-306 (2017).

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

語彙サイズ(UTF-8)

ライセンス
GPL v2.0/LGPL v2.1/修正BSD

unidic_csj_download_button

旧バージョンはこちら

参考文献
  • 岡 照晃: 「言語研究のための電子化辞書」, コーパスと辞書, 講座 日本語コーパス 7, pp.1-28, 朝倉書店 (2019).
References
  • Yasuharu Den, Junpei Nakamura, Toshinobu Ogiso, Hideki Ogura. A Proper Approach to Japanese Morphological Analysis: Dictionary, Model, and Evaluation, In Proceedings of the sixth international conference on Language Resources and Evaluation (LREC 2008), pp.1019-1024 (2008).
古文用UniDicS unidic_chj

historical_open_button