外国語PDFからWordに文字列をコピーして機械語翻訳原稿にする方法

 外国語で書かれた数百ページ、数千ページものボリュームのある書籍・文献に目を通したいと感じたことはありませんか。

 ネット上で見つけることのできるこれらの文献は、通常、PDF形式で配布されています。

 これを機械語翻訳にかけます。

 最も簡単な方法は、ブラウザはChromeを使い、Google翻訳のドキュメント翻訳するという方法です。テキスト翻訳は5000字までと制限がありますが、ドキュメント翻訳には制限が設けられていないようです。

 ドキュメント翻訳の場合、原稿の媒体は、.docx、.pdf、.pptx、.xlsx のいずれかとされています。

 なお、Firefoxではドキュメント翻訳は使えません。翻訳結果として、原文が表示されるだけです。

 Google翻訳で満足するのであれば、それでおしまい。この記事を読む必要もありません。しかし、Google翻訳の結果に満足できない方もたくさんいると思います。ほぼ、日本語になっていない翻訳結果を提示されても困ります。

 文献を機械語翻訳で読もうとする人のニーズは、膨大なページの中で、自分の関心の高い箇所を見つけるのに使う、がほとんどだと思います。見つかったページを集中して読む。機械語翻訳の結果など最初から信用していないし、そんな翻訳結果を使って論文に引用などできません。

 Google翻訳がまともな翻訳結果を表示できるのなら問題はないのですが、意味不明の「日本文字の羅列」では、せっかく機械語翻訳しても時間の無駄となります。長大な文献をおかしな日本語で読む、というのもかなりのストレスです。

 これまでは、Google翻訳しかなかったのですが、最近は、DeepLやみらい翻訳のような評判のよい翻訳エンジンが出てきました。どの翻訳エンジンも一長一短があり、どれが優れているとは言えない状況ですが、管理人は、DeepLを愛用しています。なお、みらい翻訳は、無料でできるのは、原文5,000文字 出力5000字となっています。

PDFファイルをWordにするにはWordの機能を使う

 PDFファイルの内容をWordにコピーする場合、PDFファイルの内容を[Ctrl]+[A]で文字列全選択し[Ctrl]+[C]でコピーし、Wordの画面で[Ctrl]+[V]で貼り付ける、という手順が頭に浮かびますが、これはダメな方法です。ヘッダや図形がコピーできない場合があります。

 このような場合、最初からWordの読み込み機能を使います。

 Wordを起動し、[ファイル] ⇒ [開く] ⇒ [参照]。ここで、読み込みたいPDFファイルを指定します。

 この操作で、ヘッダもヘッダの位置に読み込むことができ、図形の読み込みもできます。最もうれしいのが、余計な「改行」タグが生成されないこと。このテクニックは役立つと思います。

参考
英語の論文を翻訳する際はGoogleドキュメントを使うのがおすすめ

 

コメント