Edge, Chrome, Safari, Firefox推奨
UniDicのロゴ コーパス開発センターのロゴ
現代書き言葉UniDic unidic_bccwj

現代の書き言葉テキストを短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。

書籍、 雑誌、 新聞、 白書、 検定教科書、 広報紙、 Web掲示板、 ブログ、 韻文、 法律文書、 国会会議録 など

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

語彙サイズ(UTF-8)

ライセンス
GPL v2.0/LGPL v2.1/修正BSD

unidic_bccwj_download_button

旧バージョンはこちら

参考文献
References
現代話し言葉UniDic unidic_csj

現代話し言葉の転記テキストを短単位自動解析するための解析用辞書です。 学習には『日本語日常会話コーパス(CEJC)』を利用しているので、 その転記基準に即したテキストの解析に使用できます。

CEJCの転記基準は以下の文献で確認できます。

  • 臼田泰如, 川端良子, 西川賢哉, 徳永弘子, 小磯花絵: 『日本語日常会話コーパス』の転記基準について, 言語処理学 会第23回年次大会発表論文集, pp.174-177 (2017).
  • 川端良子, 川端 良子, 臼田 泰如, 西川 賢哉, 徳永 弘子, 小 磯 花絵: 「日常会話コーパス」の転記基準と作業工程, 言語資源活用ワークショップ2016予稿集, pp.296-306 (2017).

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

語彙サイズ(UTF-8)

ライセンス
GPL v2.0/LGPL v2.1/修正BSD

unidic_csj_download_button

旧バージョンはこちら

参考文献
  • 岡 照晃: 「言語研究のための電子化辞書」, コーパスと辞書, 講座 日本語コーパス 7, pp.1-28, 朝倉書店 (2019).
References
  • Yasuharu Den, Junpei Nakamura, Toshinobu Ogiso, Hideki Ogura. A Proper Approach to Japanese Morphological Analysis: Dictionary, Model, and Evaluation, In Proceedings of the sixth international conference on Language Resources and Evaluation (LREC 2008), pp.1019-1024 (2008).
古文用UniDicS unidic_chj
  1. 旧仮名口語UniDic
  2. 近代文語UniDic
  3. 近世口語(洒落本)UniDic
  4. 中世口語(狂言)UniDic
  5. 中世文語(説話・随筆)UniDic
  6. 中古和文UniDic
  7. 上代(万葉集)UniDic
旧仮名口語UniDic unidic_chj

旧仮名口語で書かれたテキストを短単位自動解析するための解析用辞書です。 主として旧仮名口語で書かれた雑誌記事の解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

参考文献
  • 小木曽智信: 「旧仮名遣いの口語文を対象とした形態素解析辞書」, じんもんこん2012論文集, pp.25-32 (2012).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
近代文語UniDic unidic_chj

近代文語論説文を短単位自動解析するための解析用辞書です。 明六雑誌, 太陽, 国民之友のような近代の雑誌などの解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
近世口語(洒落本)UniDic unidic_chj

近世の口語資料を短単位自動解析するための解析用辞書です。 主とし、洒落本や人情本テキストの解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

参考文献
  • 小木曽 智信, 市村 太郎, 鴻野知暁: 「近世口語資料の形態素解析の試み」, 第4回コーパス日本語学ワークショップ予稿集, pp.145-150 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中世口語(狂言)UniDic unidic_chj

中世の口語資料、主として狂言台本を短単位自動解析するための解析用辞書です。 虎明本狂言集のようなテキストの解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

参考文献
  • 小木曽 智信, 鴻野 知暁, 市村 太郎: 「狂言台本の形態素解析」, 日本語学会2015年度春季大会 (2015).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中世文語(説話・随筆)UniDic unidic_chj

中世文語(説話・随筆)を短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。

今昔物語集(本朝部), 宇治拾遺物語, 十訓抄, 方丈記, 徒然草 など

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中古和文UniDic unidic_chj

中古和文を短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。

古今和歌集, 土佐日記, 竹取物語, 伊勢物語, 落窪物語, 大和物語, 枕草子, 源氏物語, 紫式部日記, 和泉式部日記, 平中物語, 堤中納言物語, 更級日記, 讃岐典侍日記, 蜻蛉日記, 大鏡 など

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

参考文献
  • 小木曽 智信, 小椋 秀樹, 田中 牧郎, 近藤 明日子, 伝 康晴: 「中古和文を対象とした形態素解析辞書の開発」, 情報処理学会研究報告 人文科学とコンピュータ, Vol.2010-CH-85, No.4, pp.1-8 (2010).
  • 小木曽智信: 「中古仮名文学作品の形態素解析」, 日本語の研究, Vol.9, No.4, pp.49-6 (2013).
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese, In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012), pp.911-915 (2012).
上代(万葉集)UniDic unidic_chj

万葉集を短単位自動解析するための解析用辞書です。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]