Submit Search
Improving translation via targeted paraphrasing
1 like
357 views
Hiroshi Matsumoto
EMNLP2010
Education
Read more
1 of 20
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
More Related Content
PDF
[論文読み会資料] Beyond Error Propagation in Neural Machine Translation: Characteris...
Hayahide Yamagishi
PDF
文レベルの機械翻訳評価尺度に関する調査
Kodaira Tomonori
PPTX
プログラミング言語として考えたTensor flow
Keisuke Umezawa
PDF
Summary of Rule-based Reordering Space in Statistical Machine Translation
Hiroshi Matsumoto
PPTX
Phrase linguistic classification and generalization for improving statistical...
Hiroshi Matsumoto
PPTX
Summary of Dialectal to standard Arabic paraphrasing to improve Arabic-Englis...
Hiroshi Matsumoto
PPTX
A statistical approach to machine translation
Hiroshi Matsumoto
PPTX
Graph Propagation for Paraphrasing Out-of-Vocabulary Words in Statistical Mac...
Hiroshi Matsumoto
[論文読み会資料] Beyond Error Propagation in Neural Machine Translation: Characteris...
Hayahide Yamagishi
文レベルの機械翻訳評価尺度に関する調査
Kodaira Tomonori
プログラミング言語として考えたTensor flow
Keisuke Umezawa
Summary of Rule-based Reordering Space in Statistical Machine Translation
Hiroshi Matsumoto
Phrase linguistic classification and generalization for improving statistical...
Hiroshi Matsumoto
Summary of Dialectal to standard Arabic paraphrasing to improve Arabic-Englis...
Hiroshi Matsumoto
A statistical approach to machine translation
Hiroshi Matsumoto
Graph Propagation for Paraphrasing Out-of-Vocabulary Words in Statistical Mac...
Hiroshi Matsumoto
Similar to Improving translation via targeted paraphrasing
(13)
PDF
対訳コーパスから生成したワードグラフによる部分的機械翻訳
長岡技術科学大学 自然言語処理研究室
PDF
Paraphrasing rules for automatic evaluation of translation into japanese
swenbe
PDF
Extract and edit
禎晃 山崎
PDF
Generalized data augmentation for low resource translation
platinum-vallay
PDF
さくさくテキストマイニング入門セッション
antibayesian 俺がS式だ
PDF
Nlp2018 参加報告
浩気 西山
PPTX
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
sekizawayuuki
PPTX
Jacet2014ykondo_final
早稲田大学
PPTX
[ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Wo...
Hayahide Yamagishi
PDF
2010 re-extending nocuous ambiguity analysis for anaphora in natural language...
n-yuki
PDF
Tree-to-Sequence Attentional Neural Machine Translation (ACL 2016)
Toru Fujino
PDF
2010 ase-automatic detection of nocuous coordination ambiguities in natural l...
n-yuki
PPTX
Machine translation
Hiroshi Matsumoto
対訳コーパスから生成したワードグラフによる部分的機械翻訳
長岡技術科学大学 自然言語処理研究室
Paraphrasing rules for automatic evaluation of translation into japanese
swenbe
Extract and edit
禎晃 山崎
Generalized data augmentation for low resource translation
platinum-vallay
さくさくテキストマイニング入門セッション
antibayesian 俺がS式だ
Nlp2018 参加報告
浩気 西山
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
sekizawayuuki
Jacet2014ykondo_final
早稲田大学
[ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Wo...
Hayahide Yamagishi
2010 re-extending nocuous ambiguity analysis for anaphora in natural language...
n-yuki
Tree-to-Sequence Attentional Neural Machine Translation (ACL 2016)
Toru Fujino
2010 ase-automatic detection of nocuous coordination ambiguities in natural l...
n-yuki
Machine translation
Hiroshi Matsumoto
Ad
More from Hiroshi Matsumoto
(13)
PDF
Paraphrasing Swedish Compound Nouns in Machine Translation
Hiroshi Matsumoto
PDF
Summary: A Sense-Based Translation Model for Statistical Machine Translation
Hiroshi Matsumoto
PDF
Predicting Power Relations between Participants in Written Dialog from a Sing...
Hiroshi Matsumoto
PPTX
Modeling Irony in Twitter
Hiroshi Matsumoto
PPTX
Factored translationmodel
Hiroshi Matsumoto
PDF
10.combination of sm_tn_rbmt
Hiroshi Matsumoto
PDF
9. cgc parser with_norml_std
Hiroshi Matsumoto
PDF
8. relearnt rbmt
Hiroshi Matsumoto
PDF
7. ebmt based on st sm
Hiroshi Matsumoto
PDF
Summary of English Japanese Translation by MSR-MT
Hiroshi Matsumoto
PPTX
5. bleu
Hiroshi Matsumoto
PPTX
Mt framework nagao_makoto
Hiroshi Matsumoto
PPTX
Approach to japanese english automatic translation by Susumu Kuno
Hiroshi Matsumoto
Paraphrasing Swedish Compound Nouns in Machine Translation
Hiroshi Matsumoto
Summary: A Sense-Based Translation Model for Statistical Machine Translation
Hiroshi Matsumoto
Predicting Power Relations between Participants in Written Dialog from a Sing...
Hiroshi Matsumoto
Modeling Irony in Twitter
Hiroshi Matsumoto
Factored translationmodel
Hiroshi Matsumoto
10.combination of sm_tn_rbmt
Hiroshi Matsumoto
9. cgc parser with_norml_std
Hiroshi Matsumoto
8. relearnt rbmt
Hiroshi Matsumoto
7. ebmt based on st sm
Hiroshi Matsumoto
Summary of English Japanese Translation by MSR-MT
Hiroshi Matsumoto
5. bleu
Hiroshi Matsumoto
Mt framework nagao_makoto
Hiroshi Matsumoto
Approach to japanese english automatic translation by Susumu Kuno
Hiroshi Matsumoto
Ad
Improving translation via targeted paraphrasing
1.
文献紹介 長岡技術科学大学1年 松本
宏
2.
紹介文献 • 著者:
Resnik, Philip, et al. • タイトル: Improving translation via targeted paraphrasing. • 学会: Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing. Association for Computational Linguistics, 2010.
3.
概要 1. 機械翻訳の低コスト高品質な訳質改善を目指す
2. ターゲットパラフレーズの提案 • 正しくない翻訳箇所に対応する原文の箇所の換言
4.
背景 1. 人間リソースを使った機械翻訳
2. 特定の場面において利用可能な機械翻訳結果の出 力を目指す:異国でのニュース・レポート、他国 の製品説明など
5.
提案手法 ターゲット・パラフレーズ 1.
テスト文を機械翻訳で翻訳 2. 出力結果の悪質翻訳箇所を検知 3. 対応原文で同箇所を換言 4. 再度機械翻訳で翻訳
6.
悪質翻訳箇所 • 非文法
• 非文 • 不適切翻訳
7.
人手手法 1. 初期翻訳:
Google翻訳 2. 悪質箇所検知: 単言語(目的言語)話者によって行われる 3. 単語アライメントによる原文の対応箇所の検知 4. 単言語(原言語)話者によっての言い換え 5. 機械翻訳で再度翻訳
8.
例 • John
and Mary took a European vacation this summer! • Mary went on a European
9.
換言からの文生成 • 1文内に2箇所以上の換言箇所ある場合
• 複数の換言文の生成が可能 • この場合全パターンを翻訳
10.
パイロット実験(人手手法): • 翻訳:
中国語 ̶> 英語 • 実験データ: • 中国語Wikipediaの見出し文 • 詳細説明文(1段落以降)からランダムに6文 • 翻訳: • 翻訳手法: Google 翻訳 • 換言: • 検知: Amazon Mechanical Turk: 3人 • 換言: Amazon Mechanical Turk: 3人
11.
評価(人手手法): • 流暢性と適切性の5段階評価:
• 流暢性評価: • 中国語の知識のない英語ネイティブ: 3人 • 適切性の評価: • 中国語の有識英語ネイティブ: 3人 • それぞれは平均値を取る
12.
結果(人手手法): • 流暢性評価:
• 2.36 ̶> 3.32 • 適切性の評価: • 2.91 ̶> 3.49
13.
実験 • 手法:
• パイロット実験同様: 中国語 ̶> 英語 • データ: • NIST MT08 データ: 1,357文中49文 • 検知: • 人手
14.
ターゲットパラフレーズ結果 • 英語
• 115の部分的翻訳誤り • 平均:2.3箇所/文 • 中国語 • 138の適切な換言の付与 • Mechanicla Turk: $5.06 ≒ $0.11/setence
15.
結果
16.
検知の自動化 悪質箇所検知の自動化の提案: 1.
原文Fを訳文Eに翻訳 2. 訳文Eを復元文F’に翻訳 3. 原文Fと復元文F’の編集距離を比較
17.
実験 • 翻訳:
• 英語 ̶> 中国語 • Google 翻訳 • データ: • NIST MT08 データ: 1,357文 • 検知: • TERp • 評価: • TER: Translation Error Rate
18.
ターゲットパラフレーズ結果 • 不適切:
• 1,006文中 1,780 箇所 • 英語 • 1,000文の換言文を取得
19.
結果 • TERで評価した時
• Oracleの結果では12.16 TER points の向上 • コスト: • 換言: $117.48 ≒ $0.12/文
20.
まとめ • 換言による訳質改善を行った
• 悪質訳の検知の自動化を図った • パイロット実験で向上が見られた • 換言部分も実装は可能 • バイリンガル・フレーズテーブルの利用により • 機械翻訳部分も後に実装したものを利用して行いたい
Download