Google翻訳のAPIに新機能 PDFやWord、Excelファイルのレイアウトを維持したまま中身を翻訳
Googleは機械学習を用いて翻訳を行う「Translation API」の新機能として、PDF、Word、Excel、PowerPointのファイルを読み込み、レイアウトなどを保ちつつ内容だけを別の言語へ翻訳して出力する「Document Translation」を発表した。
この記事は新野淳一氏のブログ「Publickey」に掲載された「PDFやWord、Excelファイルを読み込み、レイアウトなどはそのまま内容だけを翻訳。Google Translation APIに新機能」(2021年5月13日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。
Googleは、機械学習を用いて翻訳を行う「Translation API」の新機能として、PDF、Word、Excel、PowerPointのファイルを読み込み、レイアウトなどを保ちつつ内容だけを別の言語へ翻訳して出力する「Document Translation」を発表しました。
具体的にはPDF、DOCX、PPTX、XLSXの形式のファイルを読み込み、元のファイルのレイアウトやフォーマット、見出し、パラグラフごとの区切りなどは変更せずに内容を翻訳し、元のファイル形式のままで出力をします。
Document Translation機能は、Translation API Advancedの機能に含まれています。Translation API Advancedには既存の機能として、用語集を設定して翻訳時に反映できる「用語集」機能や、複数のドキュメントをまとめてバッチ処理できる「一括処理」機能、機械学習のモデルとしてGoogleの汎用翻訳モデルかAutoMLによるカスタムな翻訳モデルを選択できるモデル選択機能などがあり、これらを組み合わせて利用することもできます。
これまでPDFやWordファイルなどのいわゆるビジネスドキュメントを翻訳するには、内容をプレーンテキストに変換するためにコピー&ペーストを行い、翻訳を実行。出力された翻訳済みのプレーンテキストを元のビジネスドキュメントのレイアウトに戻すため、手作業でテキストをペーストして見出しなどのレイアウトを整える、などの作業が発生していました。
ファイル形式もレイアウトもそのままに変換してくれるDocument Translation機能は、こうした手間を大幅に削減してくれることでしょう。
ただし利用にはTranslation APIの呼び出しが必要なため、ファイルのドラッグ&ドロップなどの簡単な操作で行えるようにするには、そうしたアプリケーションをTranslation APIを用いて作る必要があります。今後そうしたアプリケーションの登場も期待されるでしょう。
関連記事
- トランスパイラ「Babel」の開発チーム、資金難で寄付を募集
トランスパイラ「Babel」の開発チームが資金難で寄付を募集すると公式ブログで発表した。 - AWS、エッジにおけるJavaScript実行環境に本格参入 CloudflareやDenoなどの競合に
Amazon Web Services(AWS)は、エッジ環境で軽量なJavaScriptによる処理を実行可能な新サービス「Amazon CloudFront Functions」を発表した。 - Google Cloud FunctionsがPHPをサポート開始 サーバレスの関数が記述可能に
Google Cloud Platformにおけるサーバレスコンピューティング環境を提供するGoogle Cloud Functionsで、PHP言語のサポートがプレビューとして開始されることが発表された。 - Google、「AppSheet Automation」正式リリース ノーコードで業務用bot、レシートの読み取りやメールの自動送信など
米Googleは、ノーコード開発ツールの「AppSheet Automation」を正式リリースした。 - 傘下のVMwareが独立 DELLの狙いとは
Dell TechnologiesとVMwareは、VMwareをデル傘下からスピンオフし、独立した公開会社にすることを発表。その狙いを考察する。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.