中納言マニュアル:検索動作

ここでは、検索時に指定するオプションの検索動作について説明します。

options01.PNG
中納言画面:検索動作(短単位検索/長単位検索)
options010.PNG
中納言画面:検索動作(文字列検索)

文脈中の区切り記号

検索結果の前後文脈に表示される区切り記号を選択します。 区切り記号には以下の4種類が選択できます。

  •   | (バーティカルバー)
  •  / (スラッシュ)
  •  , (カンマ)
  •  (なし)
options011.PNG
中納言画面:文脈中の区切り記号

文脈中の文区切り記号

検索結果の前後文脈に表示される文区切り記号(CSJ では節単位区切り記号、名大会話コーパスでは発話単位区切り記号)を選択します。 文区切り記号には以下の3種類が選択できます。

  •  区切り記号と同じ
  •  # (シャープ)
  •  ; (セミコロン)
options017.PNG
中納言画面:文脈中の文区切り記号

前後文脈の語数

検索結果に表示する前後文脈の語数を選択します。 選択できる最大の語数は BCCWJ で500語、 CHJ, CSJ, 名大会話コーパスで300語です。

options012.PNG
中納言画面:文脈の語数

検索対象(固定長・可変長) ―(短単位検索・長単位検索のみ)

検索対象として、固定長サンプル・可変長サンプルのいずれか、または両方を選択します。BCCWJ のみ選択できます。

文字列検索では、「両方」で固定です。

options013.PNG
中納言画面:検索対象(固定長・可変長)

共起条件の範囲 ―(短単位検索・長単位検索のみ)

前方共起・後方共起に指定した条件が、異なる文中に現れることを許すかどうかを選択します。

options014.PNG
中納言画面:共起条件の範囲

コーパス利用申込

「中納言」利用申込

copusmenu_title

  • 現代日本語書き言葉均衡コーパス
  • 日本語話し言葉コーパス
  • 日本語歴史コーパス
  • 近代語のコーパス
  • 国語研日本語ウェブコーパス
 
 

event

unidic_btn

wlsp_btn

chunagon_btn

chamame_btn