後藤和智の若者論と統計学っぽいブロマガ
第21回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門(第4回:間奏――ツール紹介)
今回は、フリーの統計ソフト「R」による分析を行うに当たって、分析をより円滑にしてくれるツールを紹介します。
1. R Commander(Rコマンダー)
2003年5月から開発が進められている(RjpWiki「R史」http://www.okada.jp.org/RWiki/?R%BB%CB より)、最も伝統的なRの入力支援ツールです。CRANでパッケージとして提供されています。Rコマンダーを呼び出すためには、次のように入力します(呼び出せない場合は、「パッケージ」メニューの「パッケージのインストール」から「Rcmdr」を選んで、もう一度インストールしてください)。
> library(Rcmdr)
これでRコマンダーを呼び出すと次のような画面が現れます。
Rコマンダーを使うには、まず、データセットがデータフレームの形で保存されている必要があります(行列をデータフレームに変換するには、data.frame(行列名)と入力します)。そしてRコマンダーでは、データセットをアクティブデータセットとして設定して、そのデータセットに対して種々の分析を行うことができます。
Rコマンダーでできる分析は実に多岐にわたります。データの数値的な要約や区間推定、検定はもちろんのこと、データの特徴をグラフとして表示したり、あるいは種々の多変量解析、クラスター分析なども可能です。実際、このシリーズで使ったグラフなども、Rコマンダーを使って分析しているものも多くあります。
例えばクラスター分析をやりたいとしたら、「統計量」メニューから、「次元解析」>「クラスター分析」を選んで、いくつかの解析手法が提示されるので、その中で自分がやりたい分析を行うようにすればいいです。
適当なデータを見つけたら、それをRのデータフレームにして、Rコマンダーでちょこちょこいじってやると、そのデータの性質がわかってくるでしょう。
2. Rz
大阪大学大学院生の林真広(@masaha03)によって開発されているツールです。このツールでは、パラメータを指定して、クロス集計やデータの図示などがわかりやすくできるようになっています。こちらもCRANでパッケージとして提供されております。
Rzについては作者の林が下記のサイトでチュートリアルを公開しています。
http://m884.jp/RzTutorial_Ja.html
ここではクロス集計を行ってみましょう。Rzでサンプルデータセットとして提供されているデータを読み込み(「ヘルプ」>「サンプル・データセットの読み込み」)、次に作業画面の「記述統計量」をクリックして、さらに「v480045」と「v480047」にチェックを入れて、「Row」にv480045、「Col」にc480047を入れます。そして「実行」をクリックすると、R本体のコンソールに以下のような結果が出力されます。
=============== Rz による出力 ===============
=============================================================
v480047
----------------------------------------------
v480045 18-24 25-34 35-44 45-54 55-64 65 AND OVER Total
-------------------------------------------------------------
MALE 18 70 83 60 37 31 299
6.02% 23.4% 27.8% 20.1% 12.4% 10.4% 100%
FEMALE 38 72 91 64 49 39 353
10.76% 20.4% 25.8% 18.1% 13.9% 11.0% 100%
-------------------------------------------------------------
Total 56 142 174 124 86 70 652
8.59% 21.8% 26.7% 19.0% 13.2% 10.7% 100%
=============================================================
Chi-Square Test for Independence
Number of cases in table: 652
Number of factors: 2
Test for independence of all factors:
Chisq = 5.824, df = 5, p-value = 0.3237
X^2 df P(> X^2)
Likelihood Ratio 5.9469 5 0.31142
Pearson 5.8241 5 0.32371
Phi-Coefficient : 0.095
Contingency Coeff.: 0.094
Cramer's V : 0.095
Rzでも、Rコマンダー同様に、データを入れていろいろと楽しんでみるのがいいでしょう。Rzにデータを入れるには、「ファイル」メニューの「データのインポート」を選択します。「大局的環境からインポート」を選ぶと、作業ファイル内にあるデータセットを読み込むことができます。
「レビュー系サイト・同人誌のための多変量解析入門」シリーズは次回が最終回です(次回予定:テキストマイニング)。なお科学統計カテゴリの新シリーズは未定です。
【今後の掲載予定:定期コンテンツ(原則として毎月5,15,25日更新予定)】
第22回:【政策】雇用戦略対話を総括する(最終回:まとめ)(2013年6月15日配信予定)
第23回:【思潮】「草食系男子」論とは何か(第2回:モラルパニックとしての「意欲を失った若者」)(2013年6月25日配信予定)
第24回:【科学・統計】セイバーメトリクスを学ぶ(2013年7月5日配信予定)
【近況】
・「サンシャインクリエイション60」にサークル参加します。
開催日:2013年6月23日(日)
開催場所:サンシャインシティ(東京都豊島区)
アクセス:各線「池袋」駅より徒歩10分程度、または東京メトロ有楽町線「東池袋」駅より徒歩5分程度
スペース:A23ホール「K」ブロック06b
・「コミックマーケット84」2日目にサークル参加します。
開催日:2013年8月11日(日)
開催場所:東京ビッグサイト(東京都江東区)
アクセス:ゆりかもめ「国際展示場正門」駅より徒歩3分程度、または東京臨海高速鉄道りんかい線「国際展示場」駅より徒歩5分程度
スペース:東館「R」ブロック19b
・「第10回博麗神社例大祭」新刊の『古明地さとりの自己形成論講義――市民のための「自己」をめぐる社会科学講座』と『新・幻想論壇案内――東方Project系「評論・情報」コンテンツの新たな展開』がメロンブックス、とらのあな、COMIC ZINで発売中です。またいずれも電子版もメロンブックスDLで配信中です。
『古明地さとりの自己形成論講義――市民のための「自己」をめぐる社会科学講座』
告知ページ:http://ameblo.jp/kazutomogoto/entry-11524050938.html
サンプル(フェイスブック):http://www.facebook.com/media/set/?set=a.564139223609627.1073741827.450356281654589&type=1
サンプル(pixiv):http://www.pixiv.net/member_illust.php?mode=medium&illust_id=35542729
メロンブックス:http://shop.melonbooks.co.jp/shop/detail/212001061205
とらのあな:http://www.toranoana.jp/mailorder/article/04/0030/12/16/040030121698.html
COMIC ZIN:http://shop.comiczin.jp/products/detail.php?product_id=16239
電子版(メロンブックスDL):http://www.melonbooks.com/index.php?main_page=product_info&products_id=IT0000163554
『新・幻想論壇案内――東方Project系「評論・情報」コンテンツの新たな展開』
告知ページ:http://ameblo.jp/kazutomogoto/entry-11524045526.html
サンプル(フェイスブック):http://www.facebook.com/media/set/?set=a.564140326942850.1073741828.450356281654589&type=3
サンプル(pixiv):http://www.pixiv.net/member_illust.php?mode=medium&illust_id=35543054
メロンブックス:http://shop.melonbooks.co.jp/shop/detail/212001061206
とらのあな:http://www.toranoana.jp/mailorder/article/04/0030/12/17/040030121701.html
COMIC ZIN:http://shop.comiczin.jp/products/detail.php?product_id=16240
電子版(メロンブックスDL):http://www.melonbooks.com/index.php?main_page=product_info&products_id=IT0000163553
・「杜の奇跡20」新刊の同人誌『統計学で解き明かす成人の日社説の変遷――平成日本若者論史5』が現在発売中です。また、近日中にKindleでの刊行を予定しております。
告知ページ:http://ameblo.jp/kazutomogoto/entry-11489088720.html
とらのあな:http://www.toranoana.jp/mailorder/article/04/0030/10/93/040030109347.html
COMIC ZIN:http://shop.comiczin.jp/products/detail.php?product_id=15815
・「第8回博麗神社例大祭」新刊の『幻想論壇案内――東方Project系「評論・情報」レビュー』の電子版を発行しました。メロンブックスDLで購入できます。なお電子化にあたり第2章を削除しております。
http://www.melonbooks.com/index.php?main_page=product_info&products_id=IT0000163552
・「コミックマーケット81」新刊『三訂版・市民のための統計解析』のKindle版の刊行を行いました。そのほかKindleでも同人誌を多数刊行しております。Amazonの著者セントラルはこちらです。
http://www.amazon.co.jp/-/e/B004LUVA6I
(2013年6月5日)
奥付
後藤和智の若者論と統計学っぽいブロマガ・第21回「【科学・統計】レビュー系サイト・同人誌のための多変量解析入門(第4回:間奏――ツール紹介)」
著者:後藤 和智(Goto, Kazutomo)
発行者:後藤和智事務所OffLine
発行日:2013(平成25)年6月5日
連絡先:kgoto1984@nifty.com
チャンネルURL:http://ch.nicovideo.jp/channel/kazugoto
著者ウェブサイト:http://www45.atwiki.jp/kazugoto/
Twitter:@kazugoto
Facebook…
個人:http://www.facebook.com/kazutomo.goto.5
サークル:http://www.facebook.com/kazugotooffice
第21回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門(第4回:間奏――ツール紹介)
今回は、フリーの統計ソフト「R」による分析を行うに当たって、分析をより円滑にしてくれるツールを紹介します。
1. R Commander(Rコマンダー)
2003年5月から開発が進められている(RjpWiki「R史」http://www.okada.jp.org/RWiki/?R%BB%CB より)、最も伝統的なRの入力支援ツールです。CRANでパッケージとして提供されています。Rコマンダーを呼び出すためには、次のように入力します(呼び出せない場合は、「パッケージ」メニューの「パッケージのインストール」から「Rcmdr」を選んで、もう一度インストールしてください)。
> library(Rcmdr)
これでRコマンダーを呼び出すと次のような画面が現れます。
Rコマンダーを使うには、まず、データセットがデータフレームの形で保存されている必要があります(行列をデータフレームに変換するには、data.frame(行列名)と入力します)。そしてRコマンダーでは、データセットをアクティブデータセットとして設定して、そのデータセットに対して種々の分析を行うことができます。
Rコマンダーでできる分析は実に多岐にわたります。データの数値的な要約や区間推定、検定はもちろんのこと、データの特徴をグラフとして表示したり、あるいは種々の多変量解析、クラスター分析なども可能です。実際、このシリーズで使ったグラフなども、Rコマンダーを使って分析しているものも多くあります。
例えばクラスター分析をやりたいとしたら、「統計量」メニューから、「次元解析」>「クラスター分析」を選んで、いくつかの解析手法が提示されるので、その中で自分がやりたい分析を行うようにすればいいです。
適当なデータを見つけたら、それをRのデータフレームにして、Rコマンダーでちょこちょこいじってやると、そのデータの性質がわかってくるでしょう。
2. Rz
大阪大学大学院生の林真広(@masaha03)によって開発されているツールです。このツールでは、パラメータを指定して、クロス集計やデータの図示などがわかりやすくできるようになっています。こちらもCRANでパッケージとして提供されております。
Rzについては作者の林が下記のサイトでチュートリアルを公開しています。
http://m884.jp/RzTutorial_Ja.html
ここではクロス集計を行ってみましょう。Rzでサンプルデータセットとして提供されているデータを読み込み(「ヘルプ」>「サンプル・データセットの読み込み」)、次に作業画面の「記述統計量」をクリックして、さらに「v480045」と「v480047」にチェックを入れて、「Row」にv480045、「Col」にc480047を入れます。そして「実行」をクリックすると、R本体のコンソールに以下のような結果が出力されます。
=============== Rz による出力 ===============
=============================================================
v480047
----------------------------------------------
v480045 18-24 25-34 35-44 45-54 55-64 65 AND OVER Total
-------------------------------------------------------------
MALE 18 70 83 60 37 31 299
6.02% 23.4% 27.8% 20.1% 12.4% 10.4% 100%
FEMALE 38 72 91 64 49 39 353
10.76% 20.4% 25.8% 18.1% 13.9% 11.0% 100%
-------------------------------------------------------------
Total 56 142 174 124 86 70 652
8.59% 21.8% 26.7% 19.0% 13.2% 10.7% 100%
=============================================================
Chi-Square Test for Independence
Number of cases in table: 652
Number of factors: 2
Test for independence of all factors:
Chisq = 5.824, df = 5, p-value = 0.3237
X^2 df P(> X^2)
Likelihood Ratio 5.9469 5 0.31142
Pearson 5.8241 5 0.32371
Phi-Coefficient : 0.095
Contingency Coeff.: 0.094
Cramer's V : 0.095
Rzでも、Rコマンダー同様に、データを入れていろいろと楽しんでみるのがいいでしょう。Rzにデータを入れるには、「ファイル」メニューの「データのインポート」を選択します。「大局的環境からインポート」を選ぶと、作業ファイル内にあるデータセットを読み込むことができます。
「レビュー系サイト・同人誌のための多変量解析入門」シリーズは次回が最終回です(次回予定:テキストマイニング)。なお科学統計カテゴリの新シリーズは未定です。
【今後の掲載予定:定期コンテンツ(原則として毎月5,15,25日更新予定)】
第22回:【政策】雇用戦略対話を総括する(最終回:まとめ)(2013年6月15日配信予定)
第23回:【思潮】「草食系男子」論とは何か(第2回:モラルパニックとしての「意欲を失った若者」)(2013年6月25日配信予定)
第24回:【科学・統計】セイバーメトリクスを学ぶ(2013年7月5日配信予定)
【近況】
・「サンシャインクリエイション60」にサークル参加します。
開催日:2013年6月23日(日)
開催場所:サンシャインシティ(東京都豊島区)
アクセス:各線「池袋」駅より徒歩10分程度、または東京メトロ有楽町線「東池袋」駅より徒歩5分程度
スペース:A23ホール「K」ブロック06b
・「コミックマーケット84」2日目にサークル参加します。
開催日:2013年8月11日(日)
開催場所:東京ビッグサイト(東京都江東区)
アクセス:ゆりかもめ「国際展示場正門」駅より徒歩3分程度、または東京臨海高速鉄道りんかい線「国際展示場」駅より徒歩5分程度
スペース:東館「R」ブロック19b
・「第10回博麗神社例大祭」新刊の『古明地さとりの自己形成論講義――市民のための「自己」をめぐる社会科学講座』と『新・幻想論壇案内――東方Project系「評論・情報」コンテンツの新たな展開』がメロンブックス、とらのあな、COMIC ZINで発売中です。またいずれも電子版もメロンブックスDLで配信中です。
『古明地さとりの自己形成論講義――市民のための「自己」をめぐる社会科学講座』
告知ページ:http://ameblo.jp/kazutomogoto/entry-11524050938.html
サンプル(フェイスブック):http://www.facebook.com/media/set/?set=a.564139223609627.1073741827.450356281654589&type=1
サンプル(pixiv):http://www.pixiv.net/member_illust.php?mode=medium&illust_id=35542729
メロンブックス:http://shop.melonbooks.co.jp/shop/detail/212001061205
とらのあな:http://www.toranoana.jp/mailorder/article/04/0030/12/16/040030121698.html
COMIC ZIN:http://shop.comiczin.jp/products/detail.php?product_id=16239
電子版(メロンブックスDL):http://www.melonbooks.com/index.php?main_page=product_info&products_id=IT0000163554
『新・幻想論壇案内――東方Project系「評論・情報」コンテンツの新たな展開』
告知ページ:http://ameblo.jp/kazutomogoto/entry-11524045526.html
サンプル(フェイスブック):http://www.facebook.com/media/set/?set=a.564140326942850.1073741828.450356281654589&type=3
サンプル(pixiv):http://www.pixiv.net/member_illust.php?mode=medium&illust_id=35543054
メロンブックス:http://shop.melonbooks.co.jp/shop/detail/212001061206
とらのあな:http://www.toranoana.jp/mailorder/article/04/0030/12/17/040030121701.html
COMIC ZIN:http://shop.comiczin.jp/products/detail.php?product_id=16240
電子版(メロンブックスDL):http://www.melonbooks.com/index.php?main_page=product_info&products_id=IT0000163553
・「杜の奇跡20」新刊の同人誌『統計学で解き明かす成人の日社説の変遷――平成日本若者論史5』が現在発売中です。また、近日中にKindleでの刊行を予定しております。
告知ページ:http://ameblo.jp/kazutomogoto/entry-11489088720.html
とらのあな:http://www.toranoana.jp/mailorder/article/04/0030/10/93/040030109347.html
COMIC ZIN:http://shop.comiczin.jp/products/detail.php?product_id=15815
・「第8回博麗神社例大祭」新刊の『幻想論壇案内――東方Project系「評論・情報」レビュー』の電子版を発行しました。メロンブックスDLで購入できます。なお電子化にあたり第2章を削除しております。
http://www.melonbooks.com/index.php?main_page=product_info&products_id=IT0000163552
・「コミックマーケット81」新刊『三訂版・市民のための統計解析』のKindle版の刊行を行いました。そのほかKindleでも同人誌を多数刊行しております。Amazonの著者セントラルはこちらです。
http://www.amazon.co.jp/-/e/B004LUVA6I
(2013年6月5日)
奥付
後藤和智の若者論と統計学っぽいブロマガ・第21回「【科学・統計】レビュー系サイト・同人誌のための多変量解析入門(第4回:間奏――ツール紹介)」
著者:後藤 和智(Goto, Kazutomo)
発行者:後藤和智事務所OffLine
発行日:2013(平成25)年6月5日
連絡先:kgoto1984@nifty.com
チャンネルURL:http://ch.nicovideo.jp/channel/kazugoto
著者ウェブサイト:http://www45.atwiki.jp/kazugoto/
Twitter:@kazugoto
Facebook…
個人:http://www.facebook.com/kazutomo.goto.5
サークル:http://www.facebook.com/kazugotooffice
コメント
コメントはまだありません
コメントを書き込むにはログインしてください。