このコーパスのデータを更新し、形態論情報(単語の情報)を付与したものを、『日本語歴史コーパス』「明治・大正編Ⅰ雑誌」の一部として、コーパス検索アプリケーション「中納言」で公開しています。「中納言」の利用にはユーザー登録が必要です。(2016/10/26)
『近代女性雑誌コーパス』(2006年公開)概要
- 明治後期~大正期の女性雑誌3種から40冊を抽出した全文コーパス
- 本文テキストに、XMLを用いて文書構造・文字・表記に関する情報をタグ付け
- 対象雑誌 : 『女学雑誌』(女学雑誌社) 1894(明治27)年・1895(明治28)年 31冊
『女学世界』(博文館) 1909(明治42)年 6冊
『婦人倶楽部』(講談社) 1925(大正14)年 3冊 - 総文字数 : 約210万字
- 著者数 : 約480人
『近代女性雑誌コーパス』設計の考え方は田中牧郎(2006)「『近代女性雑誌コーパス』の概要(pdf)」(『日本学術振興会科学研究費補助金研究成果報告書 基盤研究(B) 「20世紀初期総合雑誌コーパス」の構築による確立期現代語の高精度な記述』pp.55-62)を御覧ください。
このコーパスは、日本学術振興会科研費 14310197による成果の一部です。
利用方法
『近代女性雑誌コーパス』は従来CD-ROM版で公開していましたが、2012年12月からWeb上での公開に切り替えました。
コーパスは2種類の形式で公開します。以下よりダウンロードしてお使いください。
※ このコーパスはクリエイティブ・コモンズ 表示 - 非営利 - 改変禁止 3.0 非移植 (CC BY-NC-ND 3.0)で公開します。
ダウンロード:
- XMLファイル josei_xml.zip (5.3MB)
本文テキストに、XMLを用いて文書構造・文字・表記に関する情報をタグ付けしたファイル。
コーパスの根幹となるデータ。 - 『ひまわり』用データ josei_himawari.zip (18.1MB)
コーパス検索ツール『ひまわり』用のデータ。
『ひまわり』にインストールすることで、『近代女性雑誌コーパス』を簡便に使うことができます。
『ひまわり』用データ(josei_himawari.zip)の利用方法
-
あらかじめ、以下のリンク先の説明に従って『ひまわり』をインストールしておいてください。
参照: 全文検索システム『ひまわり』 -
『ひまわり』用データ(josei_himawari.zip)をダウンロードしてください。
※Windowsをお使いの方は、ダウンロードしたjosei_himawari.zipを右クリックし、[プロパティ] > [全般]でセキュリティのブロックが解除されていることを必ず確認してください。
-
josei_himawari.zipを解凍すると、josei_himawariフォルダが現れます。その中に次のファイルがあることを確認してください。
- Corpora フォルダ ... 『近代女性雑誌コーパス』データを格納したフォルダ
- config_josei.xml ... 設定ファイル
-
Corporaフォルダとconfig_josei.xmlを『ひまわり』がインストールされているフォルダの中に移動してください。上書きの確認が出るかもしれませんが、そのまま続行してください。以上で、コーパスデータの『ひまわり』へのインストールは終了です。
-
『ひまわり』を起動後、[ファイル]>[新規]を実行し、config_josei.xmlを読み込んでください。これで『近代女性雑誌コーパス』が検索できる状態になります。
『ひまわり』の使い方については、『ひまわり』がインストールされているフォルダの中にある利用者マニュアルを参照してください。
ツール『たんぽぽ』『プリズム』の入手方法
CD-ROM版に同梱されていたツール『たんぽぽ』『プリズム』を御利用になりたい方は、以下のリンク先からダウンロードしてお使いください。
参照: 『たんぽぽ』,『プリズム』
CD-ROM版をお使いの方へ
CD-ROM版に同梱されている『ひまわり』は旧バージョンのためWindows Vista、Windows7・8には対応していません。
以下のリンク先にある新しいバージョンの『ひまわり』に更新してお使いください。
参照: 全文検索システム『ひまわり』/『ひまわり』で『近代女性雑誌コーパス』を利用する方法
『近代女性雑誌コーパス』についての、お問い合わせ、ご意見などは、以下のアドレスまで電子メールでお寄せください。