12. 不正確 / 未知語 / 冗長 の3つの課題
• 事実と異なる記述 → 致命的
• 未知語(OOV: Out Of Vocabulary)に対応不可能
• 要約したい文はニュースなどで、固有名詞も多い
• 同じ内容を繰り返してしまう → “要約”できていない
2.1.2 一般的なテキスト生成モデルの結果と課題
2. Related works
入力 出力
13. 先の3つの問題を解決できるような要約特化のSeq2Seqモデル
Get To The Point: Summarization with Pointer-Generator Networks
• 2017年、CNN/Daily Mail Dataset において SOTA
• ソフトに「コピペ」することで 正確かつ未知語にも対応 (Pointer-Generator)
• Coverage mechanism を導入し、まだ触れていない単語を出力しやすくし、冗長さを改善
• ExtractiveとAbstractiveの中間的なモデル
2.2 要約モデル (BERT前)
2. Related works