AI自動翻訳サービスは近年劇的に精度を上げてきました。しかしながら、日本語特有の表現方法である、主語の省略や1文の長さ、婉曲的な表現の使用などが、正確な翻訳を妨げる原因になることがあります。
翻訳精度向上のためには、
- AIが訳出した文をレビューし、必要に応じて編集すること=ポストエディット(後編集)
このプリエディットやポストエディットの作業を生成AIで行うとどうなるでしょうか?翻訳業務の生産性はさらに向上するでしょうか?
「みらい翻訳Plus」では既に、一部、生成AIを融合したサービス(=英文作成機能)を提供していますが、今回は、この枠から飛び出て、ChatGPT、Gemini、Microsoft Copilot、Perplexityの4つの生成AIを比較検証します。これらのAIがどのように日本語の文章のプリエディットを行い、どれが翻訳精度向上に最も役立つかを探ります。
目次
検証方法
ChatGPT、Gemini、Microsoft Copilot、Perplexityの4つの生成AIに共通のプロンプト(命令文)と翻訳する文章(原文)を渡して、
- AI翻訳が翻訳しやすいように書き換えるためのポイントとその理由
- ①のポイントに沿って書き換えた文章
を提示してもらいます。
その後、各生成AIが書き換えた文章を「みらい翻訳Plus」に入力して翻訳を行い、それぞれの翻訳文を比較します。なお、生成AIはいずれも2025年3月現在で、無料で使用できるバージョン(*1)を使いました。
プロンプト:
以下の日本語の文章(#原文)を、「AI翻訳が翻訳しやすいように」書き換えてください。
書き換えた後、どのようなポイントに注意して書き換えたのか、その理由やポイントを簡潔に説明してください。
#原文
本研究会では、エンタメ・クリエイティブ産業振興の意義と、同産業を取り巻く現状や課題、特に同産業全体や産業分野毎に注目すべき状況の変化(流通構造の変化や、デジタル化の進展に伴う制作環境の変化等)とこれに応じた新たなビジネスモデル等について認識・共有をはかり、同産業の生産性を高め、成長産業として飛躍していくために注力すべき部分を明らかにし、これを実現するための官民のアクションプランを取りまとめるとともに、クリエイターをはじめとした同産業に従事する方々が誇りを持って働ける機運を醸成していくことを目的とした、「エンタメ・クリエイティブ産業戦略」の中間とりまとめを策定する。
原文として使用したのは、経済産業省で2025年3月上旬に開催された
「第7回 エンタメ・クリエイティブ産業政策研究会」の事務局資料の「はじめに」のページに書かれている文章の一部です。
お読みいただくとわかるように、この原文は非常に長い1文となっています。あまりの難解さに、もしかしたら途中で読むのをやめてしまった読者もいるかもしれません。日本語を母語とする人にとっても難解なこの文章を、生成AIやAI翻訳はどのように“理解”するのでしょうか?
原文をそのままAI翻訳に入れるとどうなる?
生成AIでプリエディットを行った場合の翻訳精度の向上度合いを検証するため、まずは原文のまま、AI翻訳(「みらい翻訳Plus」)に入力するとどうなるのか見てみましょう。以下が、その翻訳結果です。
翻訳結果:
This workshop aims to recognize and share the significance of the promotion of the entertainment and creative industry, the current situation and issues surrounding the industry, especially the changes in the situation that should be noted in the industry as a whole and in each industry field (Changes in the distribution structure and the production environment due to the progress of digitalization), and new business models in response to these changes, clarify the areas that should be focused on in order to increase the productivity of the industry and make a leap forward as a growth industry, compile a public-private action plan to realize this, and formulate an interim compilation of the “Entertainment and Creative Industry Strategy” with the aim of creating a momentum for creators and other people engaged in the industry to work with pride.
(※下線とハイライトは編集部によるもの)
まず、今回の原文のように非常に長く複雑な文でも、かなり正確に翻訳できているというのが正直な感想です。とはいえ、2点ほど、誤訳と思われるところがありました。
誤訳①:
原文では「流通構造の変化や、デジタル化の進展に伴う制作環境の変化等」だった箇所が、「デジタル化の進展による流通構造や生産環境の変化(Changes in the distribution structure and the production environment due to the progress of digitalization)」となっており、「流通構造の変化」もデジタル化の進展に起因するように書き変わっている。
誤訳②:
この委員会において作成される「『エンタメ・クリエイティブ産業戦略』の中間とりまとめ(an interim compilation of the “Entertainment and Creative Industry Strategy”)」の目的は、原文で述べられた全てのことを推進するためであるはずが、「クリエイターをはじめとした同産業に従事する方々が誇りを持って働ける機運を醸成していくこと」だけを目的としているかのようになっている。
ただ、誤訳②については、原文自体もどの部分がどこに掛かっているのかが非常に分かりづらく、人間が翻訳するとしても、実際の「中間とりまとめ案」の中身に目を通さない限り、正確に原文を理解し、翻訳するのは難しいでしょう。
原文をそのまま「みらい翻訳Plus」で翻訳した場合、誤訳はわずか2か所でしたが、この翻訳文が英語を母語とする人にとって明瞭で理解しやすい文になっているかは、また別の問題です。英語文化圏におけるプロフェッショナル・ライティングでは、情報の正確さだけでなく、論理構成の明確さや簡潔さ、そして読者への配慮が求められます。
上記の翻訳文は、原文のわかりにくさ(曖昧さや冗長性)を忠実に訳出してしまっているがゆえに、先に述べたプロフェッショナル・ライティングの観点から見ると改善の余地があると言えるでしょう。この「原文のわかりにくさ」を、生成AIによるプリエディットでどこまで解決できるかが、この検証の見どころの一つかもしれません。
評価基準:生成AIプリエディットの精度を測る
今回の検証では、「原文の情報保持度」「翻訳結果の向上度」、「翻訳文の読みやすさ」「文のスタイル」の4つを評価基準とします。
- 原文の情報保持度
- 原文の意味や重要な情報が失われていないか。
- 不自然な省略や、誤解を招く表現の書き換えは行われていないか。
- 翻訳結果の向上度
- 原文のまま翻訳した際に発生した誤訳①②が解消されているか。
- その他に、新たな誤訳が発生していないか。
- 読みやすさ
- 長い文や複雑な構造が整理され、理解しやすい文章になっているか。
- 文のスタイル
- 原文の目的や用途に合う文のスタイルや構成になっているか。
「翻訳結果の向上度」「読みやすさ」「文のスタイル」の3つの評価基準については、各生成AIが書き換えた文を「みらい翻訳Plus」で英訳した翻訳文を、それぞれの観点で検証します。
ChatGPT、Gemini、Microsoft Copilot、Perplexityの中で、今回の原文を最もうまくプリエディットし、AI翻訳の訳出結果を向上させたのは、どの生成AIだったでしょうか?
検証結果:GeminiとPerplexityが健闘!?
各生成AIが作成した書き換え文と、それを元にした翻訳文を分析すると、以下のような結検証果が得られました。
生成AI | 書き換えのポイント | 情報保持 | 結果向上 | 読みやすさ | スタイル |
---|---|---|---|---|---|
ChatGPT | ・長文を分割して明瞭化 ・専門用語の整理と統一 ・曖昧な表現を具体化 ・箇条書き的な構造の導入 ・受動的な表現を能動的に変更 |
△ 長文の分割位置や適切でない接続詞の追加、平易な表現の使用などにより、原文との違いが複数生じた。 |
△ 誤訳①は解消。誤訳②は微妙。情報保持度に問題があり、新たな誤訳が発生。 |
○ 非常に明瞭で、論理的な流れが自然。各文が適切に接続され、理解しやすい。 |
○ 標準的でプロフェッショナルなビジネス文書。丁寧で説明的な印象。 |
Gemini | ・文構造の単純化 ・表現の具体化と平易化 ・箇条書きの活用 ・原文の意味やニュアンスを保持 |
○ 原文の「機運を醸成」を「環境を整える」と言い換えており、ややニュアンス違いが発生。 |
○ 誤訳①②とも解消。 |
○ 極めて簡潔。箇条書きの使用により、主要な変更点が視覚的に把握しやすい。 |
? ダイレクトで機能的。アジェンダや要点のサマリーに適したスタイル。 |
Microsoft Copilot | ・文を短く分ける ・明確でシンプルな表現を使う ・箇条書きを避ける |
× 原文からの表現の書き変えや省略が多く、意味が変わってしまった部分がある。 |
× 誤訳①②とも解消されず。 情報保持度に問題があるため、内容が薄まってしまっている。 |
× 冒頭が命令形で始まっており、文の接続が不自然で、意図を掴みづらい。 |
× 冒頭の命令形がビジネス文書の導入として不適切。全体として一貫性に欠け、プロフェッショナルな印象が薄い。 |
Perplexity | ・文章構造の単純化 ・曖昧な表現の削除 ・修飾関係の明確化 ・専門用語の維持 ・文の順序の整理 |
◎ 他の生成AIとは大きく異なり、要素の順番や表現も変わっているが、情報は比較的保持されている。「機運」→「環境」の言い変えがGeminiと同様に発生。 |
〇 誤訳①②とも解消。 |
◎ 構成が非常に整理されており、番号付きリストとインデントによって内容の階層構造が把握しやすい。 |
○ 報告書や公式文書のアウトラインに近い。構造的でフォーマルな印象。 |
多様なアプローチでAI翻訳の精度向上を目指す生成AI
今回の各生成AIが提示した「書き換えのポイント」を比較すると、AI翻訳の精度向上という共通の目標に対し、それぞれが独自のアプローチと設計思想によりプリエディットを行っていることがうかがえます。
多くの生成AIが、「文構造の単純化」や「表現の具体化・平易化」といった、AI翻訳が理解しやすい原文にするための基本的な改善策を共有しています。これは、複雑な原文をそのまま翻訳させるよりも、事前に整理することがAI翻訳の品質向上に不可欠であるという共通認識を示していると言えるでしょう。
その一方で、具体的なアプローチには各AIの個性が色濃く反映されています。
ChatGPTは、長文分割から専門用語の整理、さらには受動態から能動態への変更といった多角的な視点から、原文を積極的に「リフォーム」しようとしています。
Geminiは、明確化と平易化を追求しつつも「原文の意味やニュアンスを保持する」というバランス感覚を重視する姿勢を見せています。
Microsoft Copilotは、文の短縮化とシンプルな表現という基本に徹しながら、「箇条書きを避ける」という他とは異なる独自のスタイルを志向しています。
Perplexityは、構造の単純化に加え、「修飾関係の明確化」や「文の順序整理」といった論理的な側面に深く踏み込み、専門用語を維持することで原文の専門性を保とうとしています。
このように、プリエディットと一口に言っても、その目指す方向性や重視するポイント(例えば、最大限の分かりやすさか、原文のニュアンスの維持か、特定の文体か、論理的な整合性かなど)によって、アプローチは大きく異なることがわかります。
4つの評価軸に基づく総合評価
プリエディットにより、原文の主要な誤訳(誤訳①②)は全てのAIで解消されました。これはプリエディットの明確な効果と言えます。しかし、各評価軸で詳細に見ると、以下の傾向が見られました。
- 原文の情報保持度: Perplexityが原文の情報を最も正確に保持しており、次いでGeminiという結果でした。ChatGPTとMicrosoft Copilotは、情報の欠落やニュアンスの変化が比較的多く見られました。
- 翻訳結果の向上度: 主要な誤訳は全AIで解消したものの、新たな誤訳の発生はなく情報も保持されたPerplexityが、結果として最も安定して翻訳結果を向上させたと評価できます。
- 読みやすさ: Perplexityの箇条書きを駆使した構造的な書き換えは、翻訳文の明確さと理解しやすさにおいて際立っていました。他のAIも短文化により分かりやすさは向上しましたが、Microsoft Copilotの翻訳文には文頭の不自然さが残るなどの課題がありました。
- 文のスタイル: Perplexityは原文のスタイルから大きく変更し、情報の伝達効率を高めるアプローチを取りました。他のAIは原文のスタイルをある程度維持しようとしていますが、その結果、文脈の不整合や冗長性が残る場合も見られました。
結論
今回使用した原文においては、Perplexityが採用した「構成の抜本的変更と箇条書きによる情報の明確化」というプリエディットアプローチが、原文の情報を正確に保持しつつ、AI翻訳にとって誤解が少なく、かつ読みやすい明確な文章を作成する上で最も効果的であったと考えられます。
ただし、これはあくまで今回の検証における結果です。原文の特性や求める翻訳文のスタイル(例えば、原文の文体を極力維持したい場合など)によっては、他のAIのアプローチがより適している可能性も十分にあります。
生成AIを活用したプリエディットは、翻訳の品質向上に確かな効果をもたらす可能性があることが、検証を通じてわかりました。その潜在能力を最大限に引き出すためには、各AIの特性を深く理解し、目的に応じた使い分けと的確な指示が不可欠です。
みらい翻訳では、生成AIの柔軟な文章リライト力や文脈を読み取る力と、AI翻訳が得意とするスピーディーで正確な翻訳力を融合させたサービスの研究・開発をこれからも進めていきます。
プリエディットに使えるプロンプト案
最後に、今回の検証をもとに作成したプリエディット用プロンプト案を付けておきます。なお、このプロンプトは、みらい翻訳ブログ編集部が作成したもので、株式会社みらい翻訳の公式なプロンプトではありません。
# あなたへの依頼(役割設定)
あなたはプロの編集者、兼、翻訳者です。特に技術文書やビジネス文書をAI翻訳ツール(例:英語へ翻訳)が最大限のパフォーマンスを発揮できるようにリライトする専門家です。
# リライトの目的
以下の【原文】を、AI翻訳ツールがより正確に、かつ自然で理解しやすいターゲット言語(例:英語)の文章を生成できるように、論理的で明確、かつ簡潔な日本語の文章に書き換えてください。
# 書き換えの具体的な指示
以下の点に注意して、【原文】をプリエディットしてください。
- 構成の最適化:
* 文章全体の主要な目的や結論が、冒頭で読者に明確に伝わるように構成を見直してください。
* 情報が多岐にわたる場合は、適切にグルーピングし、必要に応じて項目立てや箇条書き(リスト形式)を効果的に使用して情報を整理してください。
- 一文の明確化と簡潔化:
* 一文が冗長にならないよう、60~80字程度を目安に、情報を理解しやすい単位で区切ってください。
* 主語と述語の関係が明確になるように記述してください。
* 曖昧な指示語(「これ」「それ」「あれ」など)は、具体的な名詞に置き換えるか、文脈から誤解が生じないように表現を補ってください。
* 修飾語と被修飾語の関係が明確になるように、言葉の順序や表現を調整してください。 - 表現の調整:
* 受動態の表現は、可能であればより直接的で分かりやすい能動態の表現に書き換えてください。
* 専門用語は不必要に変更せず、一貫性を保って使用してください。ただし、一般的でない専門用語や略語には、初出時に簡単な説明を加えることを検討してください。
* 比喩表現、慣用句、多義的な言葉、曖昧な言い回しなど、AI翻訳が誤解しやすい可能性のある表現は、より直接的で具体的な表現に置き換えてください。 - 論理構造の強化
*各文および段落間の論理的なつながりが明確になるようにしてください。必要に応じて、「そのため」「しかし」「また」などの接続詞を適切に補い、論理関係を明示してください。
- 【原文】に含まれる全ての重要な情報、意図、ニュアンスを正確に保持してください。
- 意味を勝手に変更したり、重要な情報を省略したり、原文にない情報を追加したりしないでください。
- あくまでAI翻訳のための「原文の明確化」であり、内容の創作や大幅な要約は行わないでください。
# 出力形式
書き換えた【プリエディット文】のみを出力してください。
—
【原文】
[ここにプリエディットしたい日本語の原文を貼り付けてください]
—
このプロンプトは汎用的に使えることを目指していますが、原文の特性やプリエディットの目的に応じて、各項目を調整したり、特定の指示を強調したりすることで、より効果的な結果が得られるでしょう。
このプロンプト案が、読者の皆さんにとって有益な情報となれば幸いです。
今回の検証について、各生成AIが作成した書き換え文やその翻訳文を含むフルバージョンをお読みになりたい方は、お問い合わせフォームよりご連絡ください。お問い合わせ内容欄に「生成AIプリエディット検証フルバージョン希望」とご入力ください。
ChatGPT:無料プランの場合、使用バージョンは明示されないが、使用時期から GPT-4o mini と推測される。
Gemini:Gemini 2.0 Flash Thinking Experimental
Microsoft Copilot:無料版の Microsoft Copilot ※詳細なバージョン名は不明
Perplexity:無料版の Perplexity ※詳細なバージョン名は不明