>Shell mac様 はじめまして。書き込みありがとうございます。しかし、Shell mac様のコメントは的外れなところが多いと思うので改めて前提を説明いたします。 1. データの性質について まず、ここで用いている「艦これ」の遠征の報酬データは、「この値の資材などが得られることが最初から決まっている」ものです。そのため測定回数などはまったく関係はありません。あくまでこのモデル構築の目的は「得られる資材の量と遠征時間の関係を一般化線形モデルで作成し、遠征の時間資源の獲得量に見合ったものになっているか」ということを評価するのが目的です。そのため割り当て条件などの批判は無効です。 2. 資源取得数について 報酬の資源の量は離散的な値ではありますが、連続的な量と見なして分析することも可能です。100単位ごとにやる、というのはかえって操作を増やしてしまうことになります。データの性質から考えると、最初から連続量として分析したほうが効率的ですし、正確です。 3. 標準化について 標準化を行う目的は、回帰係数から元のデータのばらつき(平均・分散)の影響を取り除くためです。標準化を行うと全てのパラメータが平均0・分散1になるので、影響の程度についてより正確なものを知ることができます(これによって得られた係数を標準化偏回帰係数と言います)。 以上、Shell mac様のご意見はいずれもデータ及び分析の性質を考えると的外れなものでしかないと考えます。
フォロー
後藤和智の若者論と統計学っぽいチャンネル
(著者)
>Shell mac様
はじめまして。書き込みありがとうございます。しかし、Shell mac様のコメントは的外れなところが多いと思うので改めて前提を説明いたします。
1. データの性質について
まず、ここで用いている「艦これ」の遠征の報酬データは、「この値の資材などが得られることが最初から決まっている」ものです。そのため測定回数などはまったく関係はありません。あくまでこのモデル構築の目的は「得られる資材の量と遠征時間の関係を一般化線形モデルで作成し、遠征の時間資源の獲得量に見合ったものになっているか」ということを評価するのが目的です。そのため割り当て条件などの批判は無効です。
2. 資源取得数について
報酬の資源の量は離散的な値ではありますが、連続的な量と見なして分析することも可能です。100単位ごとにやる、というのはかえって操作を増やしてしまうことになります。データの性質から考えると、最初から連続量として分析したほうが効率的ですし、正確です。
3. 標準化について
標準化を行う目的は、回帰係数から元のデータのばらつき(平均・分散)の影響を取り除くためです。標準化を行うと全てのパラメータが平均0・分散1になるので、影響の程度についてより正確なものを知ることができます(これによって得られた係数を標準化偏回帰係数と言います)。
以上、Shell mac様のご意見はいずれもデータ及び分析の性質を考えると的外れなものでしかないと考えます。