米Googleは6月27日(現地時間)、2007年から提供している自動翻訳サービス「Google翻訳」で、新たに110言語をサポートしたと発表した。LLMの「PaLM 2」を使った。これで対応言語数は243になった。
新言語の話者は6億1400万人以上であり、これは世界人の約8%に当たる。新言語の約4分の1はアフリカの言語だ。
話者が多いがこれまでサポートしてこなかった広東語も追加された。サポートが難しかったのは、書き言葉が北京語と重複することが多く、学習用データを見つけにくかったためとGoogleは説明した。
「言語には、地域的な変種、方言、異なるスペリングの基準など、膨大なバリエーションがある。また、多くの言語には標準的な形式がないため、“正しい”変種を選ぶことは不可能」とGoogle。Google翻訳ではオンラインでよく使われている変種に最も近いテキストを生成するが、そこには他の変種の要素も混ざっているという。
PaLM 2により、互いに似ている言語の翻訳を効率的に学習できるようになったという。Googleは1000言語をサポートするAIモデルを構築するイニシアチブを掲げており、今後もさらに多くの言語の変種とスペル規則をサポートしていくとしている。
サポートする言語のリストはヘルプページで確認できる。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR