ChaKi.NETでコーパスを検索するまで
           の流れ
• ChaKi.NETのインストール
 – 環境によっては.NET Frameworkのインストールを求め
   られることがあります
• テキストファイルをChaKi.NETにインポートできる
  形式に変換
 – あらかじめMeCabとCaboChaをインストールしておいて
   ください
• コーパスをインポート(データベースファイル作成)
• データベースファイルを検索対象として指定

                                 1
ChaKi.NETのインストール




                   2
Setup.msiをダブルクリックして実行します




                           3
セキュリティの警告が出ることがあります。
      「実行」をクリック




                   4
「次へ」をクリック




        5
「次へ」をクリック

        6
「次へ」をクリック




        7
しばらくお待ちください



          8
「次へ」をクリック




        9
テキストファイルをChaKi.NETに
インポートできる形式に変換する




                       10
ChaKi.NETにインポートしたい
   テキストファイルを用意します。
ここでは例として、c:¥NAISTにインストール
  されているhana.txtを使用します。




                       11
このような、生のテキストです




                 12
TextFormatterをダブル
クリックして実行します




                13
変換したいテキストファイル
をTextFormatterのウィンドウ
にドラッグ&ドロップします




                  14
すると自動的にファイル名が入力されます




                  15
変換結果格納ファイル名について
• 格納先ファイル名は、変換元ファイル名の拡
  張子を”.mecab”および”.cabocha”で置き換え
  たものになります
変換元: c:¥NAIST¥hana.txt
格納先(MeCab): c:¥NAIST¥hana.mecab
格納先(CaboCha): c:¥NAIST¥hana.cabocha
• 「参照」ボタンをクリックすることで格納先ファ
  イル名を変更できますが、必ずそれぞれ
  ”.mecab”と”.cabocha”で終わるファイル名とし
  てください
                                  16
「変換」ボタンをクリックすると変換
    処理が始まります。
   しばらくお待ちください。




                    17
変換が完了しました。



             18
これらが出力された
  ファイルです



        19
コーパスのインポート

変換結果ファイルからデータベース
   ファイルを作ります



                   20
Chaki.NETを実行します

                  21
メニューからCreate SQLite Corpus を
       クリック
                               22
Input File の 「Browse...」をクリック
                                23
C:¥NAISTに移動し、hana.cabochaを
     選択して「開く」をクリック




MeCabファイルをインポートする場合には、
「ファイルの種類」を「MeCab files」にしてか
    ら.mecabファイルを選択します         24
Input Character Code: UTF-8
   Input Type: Mecab|Cabocha
            とします。
TextFormatterの出力文字コードはUTF-8です。
                                 25
Output DBの 「Browse...」をクリック
                              26
出力されるデータベースファイル名
を指定します。ここではhana.dbと入
   力して「開く」をクリック。




                   27
「Launch」 をクリック
                 28
しばらくお待ちください。
変換が完了したら、Enter
キーを押してこのウィンド
  ウを閉じます。



             29
出力されたデータ
                  ベースファイル




Create SQLite Corpus のウィンドウはもう
          閉じて構いません
                                 30
データベースファイルを
検索対象として指定する




              31
Corpusタブの「Add...」ボタンをクリック
                            32
先ほど作成したデータベースファイル
    を指定して「開く」




                33
検索対象 Corpus List に追加されました
                        34

More Related Content

PDF
Cloferとは
PDF
Cloferとは
PPTX
Indexed DBについて(書きかけ)
KEY
PDF
Cms on SELinux
ODP
Clofer
PDF
はじめに
PPTX
Wikipedia解析
Cloferとは
Cloferとは
Indexed DBについて(書きかけ)
Cms on SELinux
Clofer
はじめに
Wikipedia解析

More from fusion2011 (16)

PDF
PDF
1028 aoyama
PDF
PDF
Stat r 9_principal
PDF
Github github-github
PDF
Niko02
PDF
Niko01
PDF
Texconf11
PDF
7417ff8622ed3f5b9f959a6b8108b77d
PDF
Lee carter modified
PDF
110823 j1644 pr-rev3ml
PDF
Tokushuu
PDF
Thurstone ex.png
PDF
How2mecab
PDF
Me cab
PDF
1028 aoyama
Stat r 9_principal
Github github-github
Niko02
Niko01
Texconf11
7417ff8622ed3f5b9f959a6b8108b77d
Lee carter modified
110823 j1644 pr-rev3ml
Tokushuu
Thurstone ex.png
How2mecab
Me cab
Ad

Chaki setup-nlp-seminar090930