先日行われた参議院選挙の「当確予測」で、ニコニコ動画が脅威の的中率97.52%ということで話題になっていますね。

  <TVや新聞よりも正確!? ニコニコ動画が行った参院選の「当確予測」の精度が凄かった>  

 選挙区で外したのは新潟区のたった一人。比例区も+1が二党、-1が二党という正確さ。結果、計121人中118人当て、的中率97.52% (118/121)になったのです。

 あと3年も国政選挙ないなんてつまんない、早く次の予測が見たい!!

 ということで、少し詳しく見てみました。もし、当確と次点の差が大差であれば、事前のアンケートで簡単に予測が付きます。実際、選挙区によっては何倍も開いているところもあります。その一方で当選ラインと次点が僅差の接戦区もかなりあります。(次点の得票数) / (当選ラインの得票数) で高いもん、つまり接戦順にいくつか並べると、

97.7% (当選落選で5000票余りしか差がない!)
  ◇宮城
当  421,634 愛知治郎 <3>自 現=[公]
当  220,207 和田政宗 <1>み 新
▽  215,105 岡崎トミ子 (3)民 現

96.5%
 ◇神奈川
当1,130,652 島村大 <1>自 新
当  740,207 松沢成文 <1>み 新
当  629,662 佐々木さやか <1>公 新
当  461,006 牧山弘恵 <2>民 現
▽  444,955 畑野君枝 (1)共 元

92.6%
 ◇山形
当  272,779 大沼瑞穂 <1>自 新=[公]
▽  252,040 舟山康江 (1)風 現=[社]

91.8%
 ◇京都
当  390,577 西田昌司 <2>自[町]現=[公]
当  219,273 倉林明子 <1>共 新
▽  201,297 北神圭朗 民 新

90.2%
 ◇東京
当1,064,660 丸川珠代 <2>自[町]現
当  797,811 山口那津男 <3>公 現
当  703,901 吉良佳子 <1>共 新
当  666,684 山本太郎 <1>無 新
当  612,388 武見敬三 <4>自 現
▽  552,714 鈴木寛 (2)民 現

(データは毎日新聞の記事から頂きました。)

 と、こんな僅差のものも、ばしばし当ててしまったという。80%台も3つ,4つあるようです。外れた新潟区だと 80.9%で、つまりこれくらい離れていても外れることがある中これだけ当てるってのは、ちょっと出来過ぎではないかと思えるほどです。

 これを投票締め切り直後に発表したのですから、テレビの選挙速報は完敗と言っていいのではないでしょうか。次は絶対ニコニコ生放送の開票速報見よう。

 この当確予測、どうしてこんなに精度が高いのでしょうか。きっとそのアンケート方法にあるのだと思います。

 アンケートは、ニコニコ動画を通して行われます。私はSOHOで、メインのMacを昼も夜も使っているわけですが、すると、視聴していなくてもどこかにニコニコ動画が開きっぱなしになっています。すると、突然、「アンケートにご協力ください」とニコ割アンケートが始まります。期間中三回くらい呼びかけられました。(もしかしたら参議院のアンケートではなかったのかもしれませんが)
 いつも仕事中にやってきて参加しなかったため中身は知りません。残念です。

 このやり方で脅威の的中率を見せましたが、なぜでしょうか。

・大量にアンケートできる。
 実際の数は分かりませんが、普通のアンケートよりは安価に素早く大量にアンケートができます。従来の出口調査よりも集めたアンケートの数が遥かに多いのではないでしょうか。

・受動的な人にも答えてもらえる。
 ネット上のアンケートだと、積極的に答えたい人だけになりがちです。ニコ動視聴中に向こうからやってくると、まあウザくもありますが、しゃあねえ答えるかと受動的な人にも答えてもらうことができます。

・セグメントを細かくできて、予測が向上する。
 ニコニコ動画の会員に対してですから、会員のプロフィールを持っています。20代、30代……より細かくできるので、精度があがりそうです。つまり、単にとったアンケートで一番多かった候補が当確というのではなく、例えば年代と性別ごとに分けて、それを実際の人口分布に合うように補正すれば精度は上がります。
 また住所がどこまで取れるかよく分かりませんが、同じ県内の都市部、周辺部くらいは区分ができれば、やはり精度はあがるでしょう。

・セグメントごとに必要な量アンケートを集められる。
 アンケートはニコニコ動画側から画面に出せますから、ランダムにアンケートを出すのではなく、各世代、男性女性同じ数くらい集まるように表示することも可能です。まあ、50代以上のユーザーは数%もいないようなので、その年代のデータを全ての都道府県きちんと揃えるのは、まだかなり難しいのではないかと思っています。
 実際、上記の接戦区は山形以外は都市のあるとこなので、かなりデータが揃えられたでしょう。新潟県もそんなに小さい県ではないですが、外してしまったのは、高齢者のデータが脆弱だったからかもしれません。もしそれ以外の人口の少ない県で接戦があったら、結構外したかもしれません。
 比例区でもほとんど当てているものの1議席取るとした党が二つ取れなかったのは、その辺が影響してるかもしれません。

 世論調査新時代

 さて、この高い的中率を実現したということは、あるとんでもないことが実現できることになります。それは、

 真に近い世論調査ができる

ということです。

 今回予測し結果も出たことで、このアンケートを用いた予測は、ビッグデータを利用することでさらに精度をあげることができます。当確だけでなく得票数も公開されていますから、ニコニコ動画のアンケートから得票数まで予測しようとすれば、かなりいろいろできそうです。

 たとえば、ニコ動を毎日見ている、週一回程度、月一回程度を中心に区分して、集計したとします。多分データとしては、毎日見ている人の方が数が多いでしょうが、ではその分週一回程度、月一回程度の結果をより重視することで、予測を実際の得票数に近づけられるかもしれません。このような傾向を捉え、補正をすることで、ニコニコ動画のアンケートの結果から、選挙での得票数をどんどん正確に予測できるようになるでしょう。

 ちなみにビッグデータに関しては、最近革新的な開発がありました。

 産総研:ビッグデータから新たな科学的発見をもたらす統計手法を開発  

アンケートにより選挙結果の予測の精度は

 さて、もしこの補正を「世論調査」に適用したらどうなるでしょうか。

 真の世論調査は大変困難です。無作為に固定電話に電話してアンケートとかいう手法がありますが、今時固定電話で届く人の答えだけ集めたとしても、国民全体の傾向を捉えているとは思えません。ネット上の単純なアンケートも、ネットのアンケートに答える人の答えだけ集めて、国民全体の傾向を捉えているとは思えません。

 でも、もし、「消費税アップ賛成・反対」でアンケートをしたとして、選挙と同じ方法で補正したとしたら、もしそれを争点に国民投票をしたらどうなるかという点について、極めて精度の高い結果を出すことが期待できます。投票に行くかいかないかという点も含んでいるからです。

 ですから、「カレーライスとラーメンどっちが好き?」というようなアンケートでは、相変わらず真の世論からは少しずれたものになるかもしれませんが、政治に関する問題であれば、ほとんど実際に投票するのと変わらない結果を得られる可能性があります。
 たとえば、今後議論されるであろう憲法改正に関する世論調査では強力な存在感を発揮しそうです。

 もちろんその「補正」の詳細はノウハウとして企業秘密になる可能性が高く、悪意があれば、好きなように結果をいじれることにもなりかねません。ですが、アンケートの直接の結果も開示しながら、選挙と同じ方法で補正したと説明すれば、ある程度の妥当性は第三者も検証できます。

 世論調査なんてまったく信用できないと言われがちな世の中ですが、妥当らしいと信じうる世論調査がうまれそうです。このプラットフォームが今後どんな影響力を持つのか楽しみですね。

ミライ: ここからは六葉未来点(?)です。