ITmedia NEWS > ネットの話題 >

「われわれも驚いている」――参院選「Yahoo!検索」予想は9割一致 山本太郎氏の当選は予想できず

» 2013年07月30日 14時06分 公開
[ITmedia]

 ヤフーの「Yahoo!JAPANビッグデータレポートチーム」は7月29日、21日投開票の参院選について、「Yahoo!検索」のデータを基にした政党別の議席数予想を実際の結果と参照した“答え合わせ”を発表した。政党ごとの獲得議席数は、予測チームも「驚くほど」の一致率だったが、投票日直前に検索数が急増した山本太郎氏の当選を予測できないなどいくつかの課題が浮かび上がった。

 予想は、「相関モデル」「投影モデル」の2つの手法を用いた。相関モデルは、昨年12月の衆院選の結果とYahoo!検索のデータを基に、特定期間中の検索量から予想。投影モデルは、過去の選挙事例での公示日前後の検索量の変化をスコア化し、今回の衆院選の公示前の検索数と掛け合わせるモデルで、それぞれ、7月4日〜7月16日のデータで分析した最終予測レポート(19日に発表)を基に結果を検証した。

画像

 参院選全体(比例区・選挙区合計)の政党ごとの獲得議席数は、与野党でみると両モデルとも完全に一致した(与党76議席、野党45議席)。政党別では、参院選で改選対象となった全121議席中、相関モデルでは105議席(87%)、投影モデルでは111議席(92%)が一致と、9割一致している。

 「政治的な読みに基づかないデータ解析からの予測としてここまで一致したことにはわれわれも少々驚いている」と予測チームはコメント。ただ両モデルともに民主党と自民党の獲得議席を多めに予測する一方で、公明党は獲得議席を少なめに見積もっていた。


画像
画像

 比例区48議席のうち、議席獲得政党の予測が一致したのは、相関モデルでは40議席(83%)、投影モデルで42議席(88%)。予測とかい離があった政党もおおむね誤差1議席内に収まっているが、公明党と他(諸派・無所属)の獲得予測は両モデルともに2議席のズレが発生していた。

 選挙区の全73議席中、相関モデルで61議席(84%)が一致、投影モデルでは65議席(89%)が一致。与野党単位ではともに1議席のみのずれで、「われわれも予想していなかった結果」という。選挙区で誤差が大きかったのは民主党と他(諸派、無所属)で、それぞれ両モデルともに3議席ずれていた。


画像
画像

 選挙区を都道府県別で見ると、すべて一致した都道府県は、相関モデルは41都道府県、投影モデルは42都道府県。完全に不一致だったのは、両モデルとも沖縄県と岩手県の2県。東京都は両モデルとも全5議席中3議席だけの的中となり、他県と比較して大きくずれた。

山本太郎氏、投票日直前に追い上げ 各政党別検索数抜く

 選挙区で予想を外した沖縄県と岩手県はそれぞれ、自民党と予測していたが、諸派もしくは無所属候補が勝った県。今回の予測モデルは政党名をベースに予測しており、諸派や無所属は対象外だったため、予想を外す結果になった。


画像
画像

 投開票日の4日前から検索数が急増し、全国の各政党名の検索数を超えるほどの検索が集中した山本太郎氏の当選も予想できなかった。東京都選挙区のみ山本太郎氏の個人名を政党名として置きかえるなど対策を行っていたが、最終予測は投開票日の5日前までのデータを用いていたこともあり、山本氏の検索量を低めに見積もる結果に。投開票日直前のデータを改めて検証すると、山本氏は当選圏内に入っていたという。

 公明党の獲得議席数予想が実態との差が特に大きかった理由の1つは、52.61%という低投票率とみている。低投票率時は一般的に組織力の強い政党が有利と考えられ、実際に用いた補正よりも大きな補正が必要だったとみている。

 また、今回の選挙では直前に行われた都議会選挙の関心がデータとして混じってしまうなど、本来その候補者や政党が持つ“票のつながりやすさ”を正確に反映できない面もあったという。

Copyright © ITmedia, Inc. All Rights Reserved.