ちなみに http://www.niph.go.jp/journal/data/55-3/200655030007.pdf によると「強く無視できる割り当て条件」の所で僕が上で話したのと似た解説があるみたいです。 それと本文にある >またデータのばらつきによる影響をなくした結果も見るため、それぞれの指標を標準化した値を使ってのモデル作成も行います。 ガチで素人なのでわからないのですが、説明変数を標準化するとバラつきの影響がなくなるのですか?というか バラつきが何に影響するのか教えてください。ググったのですが説明変数同士が無相関なときに係数が説明力としても 使える、ぐらいしかわからなかった。個人的には標準化の意味は、説明変数を単位フリーにできること。?ぐらいですかね。標準化すると逆に 係数が解釈しにくくなる気がします。例えばある説明変数の1sdの増加が0.00023の目的変数の増加に対応する、なんて直感的に分かりにくい。。 >なお、一般化線形モデルによる分析では修正決定係数は出ませんので、デビアンスやAIC(赤池情報量規準)で判定する必要があります。ここではAICを用います。 GLMではR^2計算できない。そうなんだけど個人的には一般線形モデルのほうが一般化線形モデルより使いやすいのでなぜそうしないのか気になったです。今回も前回に引き続いて正規分布を仮定してるんですよね。解析ソフトで使いやすい関数が揃ってることを抜きにしても、最小二乗法の推定(BLUE)と正規分布の最尤推定法は同じ推定結果なるから無理して一般化使わなくても、、とこでdispersion parameterの値もR^2に代わるものとしてのせてほしいかも。1に近いほど モデルが適合してる、だっけ。
フォロー
後藤和智の若者論と統計学っぽいチャンネル
(ID:15571176)
ちなみに
http://www.niph.go.jp/journal/data/55-3/200655030007.pdf
によると「強く無視できる割り当て条件」の所で僕が上で話したのと似た解説があるみたいです。
それと本文にある
>またデータのばらつきによる影響をなくした結果も見るため、それぞれの指標を標準化した値を使ってのモデル作成も行います。
ガチで素人なのでわからないのですが、説明変数を標準化するとバラつきの影響がなくなるのですか?というか
バラつきが何に影響するのか教えてください。ググったのですが説明変数同士が無相関なときに係数が説明力としても
使える、ぐらいしかわからなかった。個人的には標準化の意味は、説明変数を単位フリーにできること。?ぐらいですかね。標準化すると逆に
係数が解釈しにくくなる気がします。例えばある説明変数の1sdの増加が0.00023の目的変数の増加に対応する、なんて直感的に分かりにくい。。
>なお、一般化線形モデルによる分析では修正決定係数は出ませんので、デビアンスやAIC(赤池情報量規準)で判定する必要があります。ここではAICを用います。
GLMではR^2計算できない。そうなんだけど個人的には一般線形モデルのほうが一般化線形モデルより使いやすいのでなぜそうしないのか気になったです。今回も前回に引き続いて正規分布を仮定してるんですよね。解析ソフトで使いやすい関数が揃ってることを抜きにしても、最小二乗法の推定(BLUE)と正規分布の最尤推定法は同じ推定結果なるから無理して一般化使わなくても、、とこでdispersion parameterの値もR^2に代わるものとしてのせてほしいかも。1に近いほど
モデルが適合してる、だっけ。