Combining long short term memory and convolutional neural network for cross sentence n-ary relation extraction
1. Combining Long Short Term Memory
and
Convolutional Neural Network
for Cross-Sentence
n-ary Relation Extraction
c817c475891868c7c1a3d36e53623f42300a
5785.pdf (openreview.net)
2. Combining Long Short Term Memory
and Convolutional Neural Network for
Cross-Sentence n-ary Relation
Extraction
AngroshMandya,DanushkaBollegala,FransCoenen,KatieAtkinson
AKBC 2019 Conference
まとめ・貢献
1. 複数Entityにまたがる関係抽出
2. LSTMとCNNの組み合わせモデル
3. 文間・文内のn項関係抽出タスクで
SOTA
既存研究との違い
• Gloveの単語ベクトル(WF)とポジション
Embedding(PF)を使い,構造木等は使わない
• n項関係抽出というタスク設定では
LSTM_CNNの組み合わせは初めて
提案の利点 (ウリ)・問題点
利点
1. 入力の素性として依存構造木等の構文情報は
使わない
2. [e1, …, en]のEntityにおけるポジション
Embeddingの設定
問題点
1. n項にまたがる関係がそもそもあるかどうか
2. 提案モデル内でのチューニングの頑張りの違い説
実験仮説と検証結果
1. 文のシーケンス情報はLSTMが確保し,ま
とめる役割としてCNNが効いてくるはず
2. LSTM_CNNモデルとCNN_LSTMモデル
で比較して先にLSTM使った方が良いこと
が分かった
評価方法と結果の利点と問題点
1. Entityの出現位置を平均と分散で分類し,
Entity間距離を元にした結果
2. WFとPFのアブレーション
3. CNNのフィルタ数10~128で事前実験
4. 3つのデータセットで比較
読むべき関連研究
1. Nguyen and Verspoor. (2018)
2. Peng et al. (2017)
主要な絵
3. Introduction
The deletion mutation on exon-19 of EGFR gene was present in 16 patients,
while the L858E point mutation on exon-21 was noted in 10.
All patients were treated with gefitnib and showed a partial response.
項が2つ以上ある関係
項が2つの関係
The cancer led to her father’s death.
因果関係
癌が彼女の父親の死をもたらした.
EGFR遺伝子のエクソン19の欠失変異は16人の患者に存在したが、
エクソン21のL858E点変異は10人に認められた。
全ての患者はゲフィチニブで治療され、部分的な反応を示した。
関係を定義する際の項の数について
4. Introduction
①The deletion mutation on exon-19 of EGFR gene was present in 16 patients,
while the L858E point mutation on exon-21 was noted in 10.
⓶All patients were treated with gefitnib and showed a partial response.
項が2つ以上ある関係
• 2文にまたがる関係抽出
• 3つのEntityをまたぐ関係
遺伝子
L858E
突然変異
EGFR
薬物
geftinib
RESPONSE=3項関係
• 長距離シーケンスの扱い
• Entityの文脈モデリング
• 可変長テキストの表現
問題点
7. Model
単語トークン 𝑥𝑚
エンティティ 𝑒𝑛
テキストスパン 𝑆𝑡
入力
入力
単語ベクトル300次元
ポジションEmbedding 100次元
ポジションEmbedding
n個のEntityの内
最初と最後を基に決定
The
of
EGFR
gene
the
L858E
point
with
gefitnib
and
EGFR gefitnib を基準