国立国語研究所
 
 

和歌集編 概要 INTRODUCTION

『日本語歴史コーパス 和歌集編』として、平安時代から鎌倉時代にかけて編纂された勅撰和歌集のうち、八代集と称される和歌集のデータを短単位、長単位ともに公開しています。

本コーパスでは、

  • すべてのテキストに、読み、品詞、活用形などの形態論情報が付与されています。
  • 本文には和歌集における部立、本文の種別(詞書、歌、左注等)が付与されています。
  • 掛詞の箇所について、同一箇所に複数の形態論情報を付与しています。

なお、収録対象は古典の本文であり、現代語訳は含まれません。

本文と収録作品

本文

    『和歌集編』の本文は国文学研究資料館(National Institute of Japanese Literature/NIJL)所蔵の正保版本「二十一代集」にもとづいています。

収録作品

  • 古今和歌集
  • 後撰和歌集
  • 拾遺和歌集
  • 後拾遺和歌集
  • 金葉和歌集
  • 詞花和歌集
  • 千載和歌集
  • 新古今和歌集

本文の収録範囲

    原則として全てのテキスト(仮名序、詞書、和歌、左注)を収録対象としていますが、次の文書要素はコーパスの対象範囲外としました。

    • 表紙
    • 題箋
    • 巻名
    • 真名序

概要書・規程集

本コーパスの短単位・長単位の形態論情報付与は、以下の概要・規程集に基づいています。

また、これらに記載のなかった事柄に関しては和歌集編独自の概要に収めました。

あわせて、以下もご一読のうえ、ご利用ください。

原本画像および歌人情報へのリンク

コーパス検索アプリケーション「中納言」上の『日本語歴史コーパス 和歌集編』の検索結果の用例から、その用例がある画像ページを参照できます。

画像リンクの一つ目は、コーパスの本文となっている国文学研究資料館(NIJL)所蔵の正保版本「二十一代集」の影印画像(「日本古典籍画像の閲覧(IIIF Curation Viewer)」)です。この画像は、NIJLと人文学オープンデータ共同利用センター(Center for Open Data in the Humanities / CODH)とが共同開発しウェブ上で公開しているもので、無償で参照が可能です。

画像リンクの二つ目は、機関向け電子書籍配信サービス「Maruzen eBook Library」の『新日本古典文学大系』のページ画像です。当該ページの本文、現代語訳、注釈が参照できます。こちらは有償です。

歌人情報参照用としては、国立国会図書館典拠データ検索・提供サービス(Web NDL Authorities)へのリンクを用意しました。

ご利用にあたって

本コーパスをご利用になる際は、必ず下記の情報を明記してください。(バージョンやアクセス年月日は適宜置き換えてください)

  • 国立国語研究所コーパス開発センター(松崎安子ほか)編(2019)『日本語歴史コーパス 和歌集編』(短単位データver.1.0/長単位データver.1.0,中納言バージョン2.5.0)https://ccd.ninjal.ac.jp/chj/wakashu.html (2020年1月1日確認)

※ バージョンかアクセス年月日のいずれかを明記すれば下記のように短縮しても構いません。

  • 国立国語研究所(2019)『日本語歴史コーパス 和歌集編』https://ccd.ninjal.ac.jp/chj/wakashu.html(2020年1月1日確認)
  • 国立国語研究所(2019)『日本語歴史コーパス 和歌集編』(短単位データver.1.0/長単位データver.1.0 )https://ccd.ninjal.ac.jp/chj/ wakashu.html

『日本語歴史コーパス 和歌集編』は、オンライン検索ツール「中納言」を通してご利用いただけます。ご利用には利用許諾契約契約が必要です。詳しくは利用・申込方法をご覧ください。

開発スタッフ

    開発担当者

  • 松崎安子(プロジェクトPDフェロー)
    開発協力者

  • 小木曽智信(教授) 鴻野知暁(東京大学助教)
  • 近藤明日子 呉寧真 片山久留美(プロジェクト非常勤研究員)
  • 蝦名翠 坂東諒 堀麻美 仲村怜(技術補佐員)
  • 木川あづさ 西尾麻衣子 渡邉あゆみ(作業協力者)
    共同研究者

  • 冨士池優美(玉川大学准教授)

※肩書きは開発当時のものです。

このコーパスは、共同研究プロジェクト「通時コーパスの構築と日本語史研究の新展開」(2016-)および科学研究費補助金「日本語歴史コーパスの多層的拡張による精密化とその活用」(研究代表者:小木曽智信 基盤研究(A)2015-2018年度 課題番号15H01883)の成果の一部です。

 
 
event
unidic_bnr

日本語をはじめとする言語を分析するための基礎資料として、書き言葉や話し言葉の資料を体系的に収集し、研究用の情報を付与したものです。