ITmedia NEWS > 社会とIT >
ITmedia AI+ AI活用のいまが分かる

検閲員の過労死で見えた、中国ネット検閲のリアル クラウドとAIでは足りない理由(3/4 ページ)

» 2022年04月20日 18時50分 公開
[山谷剛史ITmedia]

クラウドとAIは助けになるか?

 今、中国ではクラウドとAIが発達しているが、コンテンツの合否をさまざまな視点から判定するフィルタリングについても同様に鍛えられたAIを活用したクラウドサービスが活躍している。

 例えば図普科技や雲上曲率や博特智能や数美科技や梵為科技といった、企業は文字や動画や音声などのフィルタリングに特化した専業サービスを提供している。

 図普科技によれば、同社は中国最大の第三者独立認証クラウドプラットフォームとして1日平均20億回のデータ処理量と数千億回以上の累積処理量を持ち、ライブストリーミングのプラットフォームについてもAI技術を使用して、若者に悪影響を与える生放送画像をリアルタイムで監視および識別、デジタルメディアコンテンツの知的監査分野で大きな優位性を持っているという。

 また雲上曲率の検閲システムでは多国語に対応し、テキストだけでなく音声にも対応するという。実際各国語をAIが学習するのは難しく、ましてやスラングや時事ネタもチェックしなくてはならないので難易度が高いことは予想できるが、どこまでフィルタリングできるか未知数だ。

photo 雲上曲率の多言語検閲ソリューション

 雲上曲率はQ&Aサイト「知乎」の中で、「原文の中にスラングも含めフィルタリングすべき言葉が混ざっている。翻訳を先にしてそこからフィルタリングをかけるという手法は有効ではない」「世界の言語は複雑であり、それぞれの言語の進化は歴史的、政治的、文化的な影響が混在していて、違う言語で語彙は同じでも意味が異なることもあり、多言語検閲を技術的に困難なものにしている」とコメント。多言語検閲が容易でないことが伺える。

 専業の企業だけではない。「アリババ(阿里巴巴)」や「テンセント」や「バイドゥ(百度)」や「ネットイース(網易)」などのクラウドサービスを提供する各社も検閲を行うコンテンツフィルタリングサービスを提供している。フィルタリング用のサービスをSaaSとして提供しているので、クラウドサービスを利用するともれなく導入されるサービスというわけではなく、開発者が導入する必要があるときに機能を利用することができる。

 例えばアリババクラウドにおける開発者向けの検閲サービスの説明を見てみると、「ビデオ、オーディオ、画像、タイトルなどのメディアファイルのコンテンツを多次元的に正確に識別し、メディアファイル内のリスクやコンプライアンスに反するコンテンツを検出するのに役立てることができる。さまざまなビジネスシナリオの監査要件に合わせて、検閲機能はカスタマイズができる。インテリジェントな動画検閲サービスでは、膨大なアノテーションデータとディープラーニングアルゴリズムに基いて、動画に含まれる禁止コンテンツや表紙やタイトルなどのメディア情報を、音声やテキストや映像などの多次元から正確に識別し、ポルノ・暴動・政治的コンテンツ・広告認識・不良シーン認識、音声スパム認識などの複数の機能モジュールをサポートする」としている。

 暴力・政治的コンテンツチェック機能では、コンテンツを「正常」「人が集まる」「デモ」「交通事故現場」「旗を掲げる」「爆発」「特殊装束」「武器」「喧嘩」「流血」のいずれかで判定する。同様に画像チェックではコンテンツを「正常」「広告やミニプログラムのQRコード」「(画像内の文字に。以下同)政治干渉」「ポルノ」「暴力」「テロ」「禁止内容」のいずれかで判定。音声チェックではコンテンツを「正常」「スパム」「広告」「政治干渉」「テロ」「言葉の暴力」「ポルノ」などで判定できるそうだ。

Copyright © ITmedia, Inc. All Rights Reserved.