少し前に見つけたツイートなんですが。

日本の映画を観る本数はこんな感じらしい。観る人は猛烈に見るけど大多数の人はそもそもほとんど映画を観てない。 #daycatch

CZ34tptWAAAw7gw.jpg


pic.twitter.com/2jD5Ft2rPr

― Simon_Sin (@Simon_Sin) 2016年1月29日

 これは、完璧なロングテールの例題のように見えます。

 ロングテールとは、たとえばニコ動でべらぼうな再生数を誇る動画がある一方で、再生数が少ない動画が無数にあるような分布です。

 映画を見る本数がロングテールなのか検証してみましょう。

 そのためには、映画に行く回数の多い人から1位2位と順位をつけたグラフを書きます。

 例えば、月に1回つまり年12回以上行く人は、165万人いますから、月に1回つまり年12回行く人は165万位ということになります。

 月に1回とそれ以上行く人は、165万+206万 = 371万人いますから、2ヶ月に1回つまり年6回行く人は371万位になります。

 という風にして順位と回数の表を作るとこうなります。
2a5037a02a6c44c7376adaa9c82dfac9eb6fd08b

 これをグラフにするとこうなります。
5be49d18d25f1762dddfc4c3f5e0f692dbf723a8

 おお、なんとなくロングテールっぽいです。これを確認するには、縦軸横軸を対数表示、規模の目盛りに直します。
90a62974a2c43c949d3234d629b7599435d1094a

 完璧とは言いませんが、わりと綺麗な右肩下がりのグラフになりました。

 ロングテールです。

 ロングテール? それがなにか? 観る人はたくさん観るけど、ほとんどの人はほとんど観ないだけじゃん、と思うかもしれません。でも、分布がロングテールだと、あるグラフはとってもフラットになります。

 年1回行く人は1524万人いますから、この層は延べ1524万回映画を観ています。
 半年に1回つまり年2回行く人は1071万人いますから、この層は延べ2142万回観ています。
 という延べ鑑賞回数をそれぞれの層で合計してグラフにすると次のようになります。

 ただし、これは「フェア」じゃないグラフなので、鵜呑みはしないでください。
5ea2bae70b80ab2322d088523ba9cee296fac1eb


 「うわ、月1回以上がダントツに多い!」と考えてはいけません。

 このグラフで本当にそれぞれの延べ数を比べたければ、このグラフの横軸、つまりカテゴリは、規模で等間隔になっていないといけません。つまり、年に観る回数が1回、2回(半年に1回)、4回(3ヶ月に1回)、8回(?)、16回、32回・・という風に倍々になっていないといけないのです。

 月に1回以上の平均が28回とありますから、月1回以上が一つのカテゴリはまとめ過ぎで、たとえば月2回以上(年24回)のカテゴリを作らないといけません。

 一方で、そのまとめすぎを除けば、横軸の取り方は倍々に近いものになっています。大まかな傾向を観るには十分です。

 という注意に留意しながらこのグラフを見るととても大きな特徴が見えてきます。それは、どの層も存在感があるということです。

 このグラフはそのまま、ある映画館で、観に来た人にインタビューした時の分布になります。映画が終わった後、インタビューすれば、年に1回、半年に1回、3ヶ月に1回、2ヶ月に1回、月に1回、月に1回以上、そしておそらく月に2回以上の人がだいたい同じくらいいるのです。決して二極化しているわけではありません。

 さらにグラフには出てきませんが、0回にカウントされている8580万人の中には、2年に1回観る人、4年に1回見る人がいます。映画館でインタビューすればそういう人もちゃんといることがわかるはずです。

 つまり映画館としては、どれもお客さんです。年に1回しか観ない人も、毎月のように来る人も、無視できない存在なのです。
 
 ロングテールなグラフを観てしまうと、つい一部の人だけがたくさん観てて、大部分の人はほとんど観ていないという感想を持ってしまいますが、そのような現象はあるゆるところに存在し、しかも、映画館のインタビューをしてみればのように、どのお客さんも決して無視できない存在なのです。


《ワンポイントミライ》(

ミライ: ということで、《ワンポイントミライ》第2回目です。

 今回は、ミラフツ名物ロングテールですね!

フツクロウ: ホッホッホッ。そうじゃの。

ミライ: どうしてここ「未来の普通」では、ロングテールがよく取り上げられるのでしょう。