Upload
Download free for 30 days
Login
Submit Search
Chaki setup-nlp-seminar090930
0 likes
378 views
F
fusion2011
1 of 34
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
More Related Content
PDF
Cloferとは
clofer
PDF
Cloferとは
clofer
PPTX
Indexed DBについて(書きかけ)
iPride Co., Ltd.
KEY
Nko
to_muu_mas
PDF
Cms on SELinux
Hiroki Ishikawa
ODP
Clofer
clofer
PDF
はじめに
akinorinakaoka
PPTX
Wikipedia解析
ghazel7
Cloferとは
clofer
Cloferとは
clofer
Indexed DBについて(書きかけ)
iPride Co., Ltd.
Nko
to_muu_mas
Cms on SELinux
Hiroki Ishikawa
Clofer
clofer
はじめに
akinorinakaoka
Wikipedia解析
ghazel7
More from fusion2011
(16)
PDF
K1
fusion2011
PDF
1028 aoyama
fusion2011
PDF
kpop
fusion2011
PDF
Stat r 9_principal
fusion2011
PDF
Github github-github
fusion2011
PDF
Niko02
fusion2011
PDF
Niko01
fusion2011
PDF
Texconf11
fusion2011
PDF
7417ff8622ed3f5b9f959a6b8108b77d
fusion2011
PDF
Lee carter modified
fusion2011
PDF
110823 j1644 pr-rev3ml
fusion2011
PDF
Tokushuu
fusion2011
PDF
Thurstone ex.png
fusion2011
PDF
How2mecab
fusion2011
PDF
Me cab
fusion2011
PDF
Test
fusion2011
K1
fusion2011
1028 aoyama
fusion2011
kpop
fusion2011
Stat r 9_principal
fusion2011
Github github-github
fusion2011
Niko02
fusion2011
Niko01
fusion2011
Texconf11
fusion2011
7417ff8622ed3f5b9f959a6b8108b77d
fusion2011
Lee carter modified
fusion2011
110823 j1644 pr-rev3ml
fusion2011
Tokushuu
fusion2011
Thurstone ex.png
fusion2011
How2mecab
fusion2011
Me cab
fusion2011
Test
fusion2011
Ad
Chaki setup-nlp-seminar090930
1.
ChaKi.NETでコーパスを検索するまで
の流れ • ChaKi.NETのインストール – 環境によっては.NET Frameworkのインストールを求め られることがあります • テキストファイルをChaKi.NETにインポートできる 形式に変換 – あらかじめMeCabとCaboChaをインストールしておいて ください • コーパスをインポート(データベースファイル作成) • データベースファイルを検索対象として指定 1
2.
ChaKi.NETのインストール
2
3.
Setup.msiをダブルクリックして実行します
3
4.
セキュリティの警告が出ることがあります。
「実行」をクリック 4
5.
「次へ」をクリック
5
6.
「次へ」をクリック
6
7.
「次へ」をクリック
7
8.
しばらくお待ちください
8
9.
「次へ」をクリック
9
10.
テキストファイルをChaKi.NETに インポートできる形式に変換する
10
11.
ChaKi.NETにインポートしたい
テキストファイルを用意します。 ここでは例として、c:¥NAISTにインストール されているhana.txtを使用します。 11
12.
このような、生のテキストです
12
13.
TextFormatterをダブル クリックして実行します
13
14.
変換したいテキストファイル をTextFormatterのウィンドウ にドラッグ&ドロップします
14
15.
すると自動的にファイル名が入力されます
15
16.
変換結果格納ファイル名について • 格納先ファイル名は、変換元ファイル名の拡
張子を”.mecab”および”.cabocha”で置き換え たものになります 変換元: c:¥NAIST¥hana.txt 格納先(MeCab): c:¥NAIST¥hana.mecab 格納先(CaboCha): c:¥NAIST¥hana.cabocha • 「参照」ボタンをクリックすることで格納先ファ イル名を変更できますが、必ずそれぞれ ”.mecab”と”.cabocha”で終わるファイル名とし てください 16
17.
「変換」ボタンをクリックすると変換
処理が始まります。 しばらくお待ちください。 17
18.
変換が完了しました。
18
19.
これらが出力された ファイルです
19
20.
コーパスのインポート 変換結果ファイルからデータベース
ファイルを作ります 20
21.
Chaki.NETを実行します
21
22.
メニューからCreate SQLite Corpus
を クリック 22
23.
Input File の
「Browse...」をクリック 23
24.
C:¥NAISTに移動し、hana.cabochaを
選択して「開く」をクリック MeCabファイルをインポートする場合には、 「ファイルの種類」を「MeCab files」にしてか ら.mecabファイルを選択します 24
25.
Input Character Code:
UTF-8 Input Type: Mecab|Cabocha とします。 TextFormatterの出力文字コードはUTF-8です。 25
26.
Output DBの 「Browse...」をクリック
26
27.
出力されるデータベースファイル名 を指定します。ここではhana.dbと入
力して「開く」をクリック。 27
28.
「Launch」 をクリック
28
29.
しばらくお待ちください。 変換が完了したら、Enter キーを押してこのウィンド ウを閉じます。
29
30.
出力されたデータ
ベースファイル Create SQLite Corpus のウィンドウはもう 閉じて構いません 30
31.
データベースファイルを 検索対象として指定する
31
32.
Corpusタブの「Add...」ボタンをクリック
32
33.
先ほど作成したデータベースファイル
を指定して「開く」 33
34.
検索対象 Corpus List
に追加されました 34
Download