SlideShare a Scribd company logo
文献紹介 
長岡技術科学大学1年 
松本  宏
紹介文献 
• 著者: Resnik, Philip, et al. 
• タイトル: Improving translation via targeted 
paraphrasing. 
• 学会: Proceedings of the 2010 Conference on 
Empirical Methods in Natural Language 
Processing. Association for Computational 
Linguistics, 2010.
概要 
1. 機械翻訳の低コスト高品質な訳質改善を目指す 
2. ターゲットパラフレーズの提案 
• 正しくない翻訳箇所に対応する原文の箇所の換言
背景 
1. 人間リソースを使った機械翻訳 
2. 特定の場面において利用可能な機械翻訳結果の出 
力を目指す:異国でのニュース・レポート、他国 
の製品説明など
提案手法 
ターゲット・パラフレーズ 
1. テスト文を機械翻訳で翻訳 
2. 出力結果の悪質翻訳箇所を検知 
3. 対応原文で同箇所を換言 
4. 再度機械翻訳で翻訳
悪質翻訳箇所 
• 非文法 
• 非文 
• 不適切翻訳
人手手法 
1. 初期翻訳: Google翻訳 
2. 悪質箇所検知: 単言語(目的言語)話者によって行われる 
3. 単語アライメントによる原文の対応箇所の検知 
4. 単言語(原言語)話者によっての言い換え 
5. 機械翻訳で再度翻訳
例 
• John and Mary took a European vacation this 
summer! 
• Mary went on a European
換言からの文生成 
• 1文内に2箇所以上の換言箇所ある場合 
• 複数の換言文の生成が可能 
• この場合全パターンを翻訳
パイロット実験(人手手法): 
• 翻訳: 中国語 ̶> 英語 
• 実験データ: 
• 中国語Wikipediaの見出し文 
• 詳細説明文(1段落以降)からランダムに6文 
• 翻訳: 
• 翻訳手法: Google 翻訳 
• 換言: 
• 検知: Amazon Mechanical Turk: 3人 
• 換言: Amazon Mechanical Turk: 3人
評価(人手手法): 
• 流暢性と適切性の5段階評価: 
• 流暢性評価: 
• 中国語の知識のない英語ネイティブ: 3人 
• 適切性の評価: 
• 中国語の有識英語ネイティブ: 3人 
• それぞれは平均値を取る
結果(人手手法): 
• 流暢性評価: 
• 2.36 ̶> 3.32 
• 適切性の評価: 
• 2.91 ̶> 3.49
実験 
• 手法: 
• パイロット実験同様: 中国語 ̶> 英語 
• データ: 
• NIST MT08 データ: 1,357文中49文 
• 検知: 
• 人手
ターゲットパラフレーズ結果 
• 英語 
• 115の部分的翻訳誤り 
• 平均:2.3箇所/文 
• 中国語 
• 138の適切な換言の付与 
• Mechanicla Turk: $5.06 ≒ $0.11/setence
結果
検知の自動化 
悪質箇所検知の自動化の提案: 
1. 原文Fを訳文Eに翻訳 
2. 訳文Eを復元文F’に翻訳 
3. 原文Fと復元文F’の編集距離を比較
実験 
• 翻訳: 
• 英語 ̶> 中国語 
• Google 翻訳 
• データ: 
• NIST MT08 データ: 1,357文 
• 検知: 
• TERp 
• 評価: 
• TER: Translation Error Rate
ターゲットパラフレーズ結果 
• 不適切: 
• 1,006文中 1,780 箇所 
• 英語 
• 1,000文の換言文を取得
結果 
• TERで評価した時 
• Oracleの結果では12.16 TER points の向上 
• コスト: 
• 換言: $117.48 ≒ $0.12/文
まとめ 
• 換言による訳質改善を行った 
• 悪質訳の検知の自動化を図った 
• パイロット実験で向上が見られた 
• 換言部分も実装は可能 
• バイリンガル・フレーズテーブルの利用により 
• 機械翻訳部分も後に実装したものを利用して行いたい

More Related Content

PDF
[論文読み会資料] Beyond Error Propagation in Neural Machine Translation: Characteris...
PDF
文レベルの機械翻訳評価尺度に関する調査
PPTX
プログラミング言語として考えたTensor flow
PDF
Summary of Rule-based Reordering Space in Statistical Machine Translation
PPTX
Phrase linguistic classification and generalization for improving statistical...
PPTX
Summary of Dialectal to standard Arabic paraphrasing to improve Arabic-Englis...
PPTX
A statistical approach to machine translation
PPTX
Graph Propagation for Paraphrasing Out-of-Vocabulary Words in Statistical Mac...
[論文読み会資料] Beyond Error Propagation in Neural Machine Translation: Characteris...
文レベルの機械翻訳評価尺度に関する調査
プログラミング言語として考えたTensor flow
Summary of Rule-based Reordering Space in Statistical Machine Translation
Phrase linguistic classification and generalization for improving statistical...
Summary of Dialectal to standard Arabic paraphrasing to improve Arabic-Englis...
A statistical approach to machine translation
Graph Propagation for Paraphrasing Out-of-Vocabulary Words in Statistical Mac...

Similar to Improving translation via targeted paraphrasing (13)

PDF
対訳コーパスから生成したワードグラフによる部分的機械翻訳
PDF
Paraphrasing rules for automatic evaluation of translation into japanese
PDF
Extract and edit
PDF
Generalized data augmentation for low resource translation
PDF
さくさくテキストマイニング入門セッション
PDF
Nlp2018 参加報告
PPTX
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
PPTX
Jacet2014ykondo_final
PPTX
[ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Wo...
PDF
2010 re-extending nocuous ambiguity analysis for anaphora in natural language...
PDF
Tree-to-Sequence Attentional Neural Machine Translation (ACL 2016)
PDF
2010 ase-automatic detection of nocuous coordination ambiguities in natural l...
PPTX
Machine translation
対訳コーパスから生成したワードグラフによる部分的機械翻訳
Paraphrasing rules for automatic evaluation of translation into japanese
Extract and edit
Generalized data augmentation for low resource translation
さくさくテキストマイニング入門セッション
Nlp2018 参加報告
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
Jacet2014ykondo_final
[ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Wo...
2010 re-extending nocuous ambiguity analysis for anaphora in natural language...
Tree-to-Sequence Attentional Neural Machine Translation (ACL 2016)
2010 ase-automatic detection of nocuous coordination ambiguities in natural l...
Machine translation
Ad

More from Hiroshi Matsumoto (13)

PDF
Paraphrasing Swedish Compound Nouns in Machine Translation
PDF
Summary: A Sense-Based Translation Model for Statistical Machine Translation
PDF
Predicting Power Relations between Participants in Written Dialog from a Sing...
PPTX
Modeling Irony in Twitter
PPTX
Factored translationmodel
PDF
10.combination of sm_tn_rbmt
PDF
9. cgc parser with_norml_std
PDF
8. relearnt rbmt
PDF
7. ebmt based on st sm
PDF
Summary of English Japanese Translation by MSR-MT
PPTX
PPTX
Mt framework nagao_makoto
PPTX
Approach to japanese english automatic translation by Susumu Kuno
Paraphrasing Swedish Compound Nouns in Machine Translation
Summary: A Sense-Based Translation Model for Statistical Machine Translation
Predicting Power Relations between Participants in Written Dialog from a Sing...
Modeling Irony in Twitter
Factored translationmodel
10.combination of sm_tn_rbmt
9. cgc parser with_norml_std
8. relearnt rbmt
7. ebmt based on st sm
Summary of English Japanese Translation by MSR-MT
Mt framework nagao_makoto
Approach to japanese english automatic translation by Susumu Kuno
Ad

Improving translation via targeted paraphrasing