・データの分布について そもそも回帰分析(ないし一般化線形モデル)というものは、被説明変数に対して各説明変数がどれほどの影響を及ぼしているかをモデルによって評価する手法であって、基本的に各説明変数は独立なものとして見なされます(回帰分析における説明変数が独立変数と呼ばれるのはこのためです)。従って説明変数Aと説明変数Bの間に「釣り合いがとれていない」としても、被説明変数との関係性を見るのが主目的ですから交互作用を考慮しない場合はそれは関係ありません。それどころか、「釣り合いが取れていない」ならばこの2変数はほぼ無相関、ほぼ独立ということになり、逆に回帰分析においては有利となります。 ・標準化する理由について この点は明言しておきたいと思いますが、私は「符号だけを見ている」わけではありません。次回同様の分析は行うときは標準化したあとの数値の大きさに対する評価も書く予定です。 ・分析の意義について 特定の分析が「バカバカしい」と思うのはそれぞれの読者の勝手です。そして私は統計学の視点からゲームの進行に対して一つの視点を提供する、その手法として遠征時間と獲得資源量の関係のモデルを回帰分析(一般化線形モデル)を使っているというものです。本文中でも、「実際の時間」と「モデル3,6によって評価された時間」を見比べて評価を行っています(係数そのものに対する評価がこの記事では不足しているという指摘は認めますが)。この分析の意義については発売中の同人誌『提督のための統計学』で書いております(こちらを読んでも不十分に感じられるかもしれませんが)。それ以降はもちろんこちらの説明不足もあると思いますが、一方的に「バカバカしい」と決めつけるのもよくないと思います。
フォロー
後藤和智の若者論と統計学っぽいチャンネル
(著者)
・データの分布について
そもそも回帰分析(ないし一般化線形モデル)というものは、被説明変数に対して各説明変数がどれほどの影響を及ぼしているかをモデルによって評価する手法であって、基本的に各説明変数は独立なものとして見なされます(回帰分析における説明変数が独立変数と呼ばれるのはこのためです)。従って説明変数Aと説明変数Bの間に「釣り合いがとれていない」としても、被説明変数との関係性を見るのが主目的ですから交互作用を考慮しない場合はそれは関係ありません。それどころか、「釣り合いが取れていない」ならばこの2変数はほぼ無相関、ほぼ独立ということになり、逆に回帰分析においては有利となります。
・標準化する理由について
この点は明言しておきたいと思いますが、私は「符号だけを見ている」わけではありません。次回同様の分析は行うときは標準化したあとの数値の大きさに対する評価も書く予定です。
・分析の意義について
特定の分析が「バカバカしい」と思うのはそれぞれの読者の勝手です。そして私は統計学の視点からゲームの進行に対して一つの視点を提供する、その手法として遠征時間と獲得資源量の関係のモデルを回帰分析(一般化線形モデル)を使っているというものです。本文中でも、「実際の時間」と「モデル3,6によって評価された時間」を見比べて評価を行っています(係数そのものに対する評価がこの記事では不足しているという指摘は認めますが)。この分析の意義については発売中の同人誌『提督のための統計学』で書いております(こちらを読んでも不十分に感じられるかもしれませんが)。それ以降はもちろんこちらの説明不足もあると思いますが、一方的に「バカバカしい」と決めつけるのもよくないと思います。