これ以上のやりとりは不毛だと思いますが、何度でも言いますけど、 1. 一般化線形モデルを用いたのは、別のところでも書きましたが、目的変数である遠征時間のほうを対数正規分布に従うものと見なしているからです。 2. 「歯抜けデータで回帰分析をしてはいけない」というのは正しいですが、そもそもここで用いているデータは「歯抜け」ではありません。元データで記述されていないものは、得られない(獲得量が0である)ということです。従って変数には0を入れており、どこにも欠損はありません。 3. 標準化を行った理由は、元々のデータではデータ特有のばらつきがありますが、それを平均0・分散1にそろえることにより係数の水準の大小を比較しやすくすることが目的です。標準化を行えば少なくとも各パラメータの水準が揃うので、元データの分散などを取り除いた上での評価が可能になります。これだけでも十分な利点です。 4. 1と同様の理由で、これも作戦(遠征)ごとに時間と各種報酬が「決まっている」中で、報酬の量にあった時間になっているかを回帰モデルによって評価するのが目的です。 なお前提となる分析の目的については第37回(http://ch.nicovideo.jp/kazugoto/blomaga/ar420439)でも述べております。
フォロー
後藤和智の若者論と統計学っぽいチャンネル
(著者)
これ以上のやりとりは不毛だと思いますが、何度でも言いますけど、
1. 一般化線形モデルを用いたのは、別のところでも書きましたが、目的変数である遠征時間のほうを対数正規分布に従うものと見なしているからです。
2. 「歯抜けデータで回帰分析をしてはいけない」というのは正しいですが、そもそもここで用いているデータは「歯抜け」ではありません。元データで記述されていないものは、得られない(獲得量が0である)ということです。従って変数には0を入れており、どこにも欠損はありません。
3. 標準化を行った理由は、元々のデータではデータ特有のばらつきがありますが、それを平均0・分散1にそろえることにより係数の水準の大小を比較しやすくすることが目的です。標準化を行えば少なくとも各パラメータの水準が揃うので、元データの分散などを取り除いた上での評価が可能になります。これだけでも十分な利点です。
4. 1と同様の理由で、これも作戦(遠征)ごとに時間と各種報酬が「決まっている」中で、報酬の量にあった時間になっているかを回帰モデルによって評価するのが目的です。
なお前提となる分析の目的については第37回(http://ch.nicovideo.jp/kazugoto/blomaga/ar420439)でも述べております。