中納言マニュアル:検索結果のダウンロード

検索結果のダウンロード

ダウンロードボタンをクリックすることで、表示中の検索結果をタブ区切りテキスト形式でダウンロードすることができます。 下記の画像は検索フォーム画面のダウンロードボタンですが、他のページのものも機能は同じです。

download_button.png
画面:検索フォーム画面のダウンロードボタン

ダウンロードに関しては列の表示・非表示は適用されず、すべての列について、10万件までダウンロードすることができます。

またダウンロードされるデータには反転前文脈列(前文脈の末尾の20語を反転させたもの)が付与されます。 これによって、ダウンロードしたテキストデータをExcelなどで開いたときに前文脈でソートすることができます。

ダウンロードオプション

ダウンロードで得られるファイルについて指定することができます。 このオプションはデフォルトでは非表示になっていますので、変更する場合には「設定を表示する」をクリックして表示させてください。

options02.PNG
画面:ダウンロードオプション

システム(文字コード、改行コード)

使用するシステムを選択すると、最適な文字コードと改行コードが選ばれるほか、文字コードと改行コードを個別に指定することも可能です。 文字コードはUTF-8、UTF-16LE、Shift_JIS、EUC-JPから、改行コードはCRLF、CR、LFから選択することができます。

表:各システム選択時に使用される文字コードと改行コード
システム 文字コード 改行コード
Windows UTF-8 CRLF
Excel(Windows) UTF-16LE CRLF
MacOS UTF-8 CR
Linux UTF-8 LF

出力ファイルの Zip 圧縮

ダウンロードしたファイルは出力ファイルが一つの場合はそのままのCSVファイルとして、出力ファイルが複数になる場合にはそれら複数のファイルとサマリーファイルを含めたZIPファイルとしてダウンロードされます。

出力ファイルが一つの場合でも、サマリーファイルを含めたZIPファイルとしてダウンロードする場合には、「出力ファイルが一つの場合は Zip 圧縮を行わない」チェックボックスのチェックを外してください。

検索条件式ごとのファイル出力

「検索条件式で検索」と「履歴で検索」では複数の検索条件式を指定することが出来ます。すべての検索条件式の検索結果を一つのファイルとしてダウンロードする場合には、「検索条件式ごとに出力ファイルを分割する」チェックボックスのチェックを外してください。

インラインタグ

チェックボックスをチェックしてダウンロードすると、キーの前後 10 語ずつに、指定した形態論情報が付加されます。形態論情報は [ と ] で囲まれます。

コーパス利用申込

「中納言」利用申込

copusmenu_title

  • 現代日本語書き言葉均衡コーパス
  • 日本語話し言葉コーパス
  • 日本語歴史コーパス
  • 近代語のコーパス
  • 国語研日本語ウェブコーパス
 
 

event

unidic_btn

wlsp_btn

chunagon_btn

chamame_btn