後藤和智の若者論と統計学っぽいブロマガ
第9回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門/第1回:フリーソフト「R」を導入しよう
サマリー:
漫画や小説などをレビューしたサイトや同人誌、あるいは書籍はよく見かける。しかし、その多くは個々の作品の評価に終始し、評価の全体像が見られるものは少ない。そこでこのシリーズでは、多変量解析を通じて、レビューの全体像を示す手法を紹介していく。第1回は、分析のためのツールとして、フリーソフト「R」を紹介する。
漫画や小説などをレビューしたサイトや同人誌は、いろいろなところでよく見かけると思います。3年くらい前の文学フリマでしたか、私の大好きな、所謂「萌え系」の4コマ漫画を総合的にレビューした同人誌がありまして(『5M vol.04』サークルファイブエム、2010年5月)、その同人誌には『ふおんコネクト!』(芳文社、全4巻)作者のざら氏のインタビューのほか、いろいろと納得させられるレビューが書かれていました。適切な評論やレビューは、作品世界の読解や、あるいは創作に対してプラスに働くものだと思いますので、どんどん行い、そしてレビューする側も、他の人の評論やレビューを参照して、作品・評論共に質が上がっていけばいいかなと思います。
ところで、こういう風な、複数の作品をレビューしたもので、またそのレビューの内容が優れたものであっても、複数のレビューを総合的に評価して、作品の傾向を見たり、あるいはレビューがどのような思想に基づいているかについて示してみせたものは少ないように思えます。確かにレビューから個々の作品がどういうものであるかを読むことはできますが、作者が作品群を「全体として」どのように評価しているのかについては不明です。これは別に昨今の評論の傾向を批判しているわけではないのですが、でも評論の全体像が見えれば面白いのになぁ、と考えることはよくあります。
さて、このシリーズのタイトルは、「レビュー系サイト・同人誌のための多変量解析入門」です。実をいうと、先ほど述べたような「評論の全体像を見る」という行為は、統計学を使って行うことができるのです。方法としては次の2つが挙げられます。
1. レビューそのものを統計分析の対象にする。
2. 作品をレビューする際にタグをつけて、そのタグについて統計分析する。
1については特に言うことはないと思いますが、レビューのテキストそのものについて分析する必要があるため、若干手間がかかります。2については、いくつかの評価基準を設定する(例えば、「学園もの」「ファンタジー」「百合要素強い」など)を設定して、それに作品が当てはまるかどうかをチェックした後、その評価に対して統計分析を行うというものです。こちらの方が手法も簡単であり、また結果もわかりやすいのでおすすめです。このシリーズでは、一応両方について取り扱っていきますが、後者の手法に基づく分析はいくつかあります。
まず読者の皆様におすすめしたいのは、同人サークル「でいひま」の作品「エロマンガ統計」シリーズです。これは、成人向け漫画などについて、作品の傾向をリストアップし、それについて統計解析を行っていくというシリーズの総集編で、その中には先ほど説明した2の手法に基づく分析がたくさん収められています。使用されている手法は主に数量化3類(対応分析)と呼ばれているものですが、他にも様々な分析が試みられているので、是非とも目を通しておいてください。COMIC ZINで委託されておりますが、残念ながら総集編は通販では品切れのようです…。
http://shop.comiczin.jp/products/list.php?category_id=2661
しかし今回は、分析手法について説明する前に、分析ツールの導入について説明していきたいと思います。
作品の分析には、多変量解析という手法を使う必要があります。多変量解析を用いると、たくさんの作品の性質について全体像を見渡すような分析ができますが、そもそも多変量解析を行うには専用のソフトが必要になります。しかし、有名な統計解析ソフトとしてはSPSSやSASがありますが、いずれもかなり高額です。またエクセルを使って多変量解析ができるようになるソフトも発売されていますが、その代表格である社会情報サービスの「エクセル統計」もかなり高価です(http://software.ssri.co.jp/ex/)。
ただ、近年はフリーソフトでも複雑な統計処理ができるようになっています。そのソフトこそ、「R」(R言語)です。RはS言語をベースに1990年代終わり頃からオープンソースで開発されているプログラミング言語・統計解析環境です。Rについては、日本では、岡田昌史氏によるサイト「RjpWiki」が充実しているため、是非とも読んでみてください。
http://www.okada.jp.org/RWiki/index.php?RjpWiki
さて、Rをインストールするわけですが、先ほども述べたとおりRはオープンソースのソフトウェアのため、誰でも無料でダウンロード・インストールすることが可能です(その代わり無保証です)。Windows, Macintosh, Linuxのいずれにも対応しているので、まずはRjpWikiの「Rのインストール」のページから、最新版を入手しましょう(以下、ここではWindows版を想定して説明します)。
Rをインストールしたら、まずはパッケージをインストールする必要があります。Rにおけるパッケージとは、特に複雑な統計解析を行う上で必要不可欠なもので、これがないとRは最低限の機能しか持たなくなります。今後説明する予定の数量化3類などは特定のパッケージがないとできないため、まずはパッケージを入手しましょう。パッケージを入手する際には、上のメニューから「パッケージ」を選び、さらに「パッケージのインストール」を選びます。
そうすると、最初にどこのCRAN(Rのサーバーです)を選択するかの画面になります。これは基本どこでも構いません(私は筑波大学のミラーを使っています)。次にインストールするパッケージを選びますが、まずは一番上のパッケージをクリックし、スクロールバーを一番下に持っていって、Shiftキーを押しながら一番下のパッケージをクリックしましょう。そうすると、全てのパッケージが選択されます。
あとは、全てのパッケージがインストールされるのを待つだけです(なお、パッケージを入れるために、ハードディスクにだいたい3GBくらいの空きを作っておきましょう)。ブロードバンド環境でも数時間かかるので、その間はインターネットを使わない作業をするか、あるいは出かけるなり寝るなりしましょう。ここまできてようやくRをフルに使用する準備が整います。
次回からは、実際にRを使って分析をする方法を見ていきましょう。
(次回はブロマガ第13回に掲載予定。次回の内容は「対応分析/数量化3類」の予定です。)
【今後の掲載予定:定期コンテンツ(原則として毎月5,15,25日更新予定)】
第10回:【政策】若者雇用戦略を総括する(第2回)(2013年2月5日掲載予定)
第11回:【思潮+政策】ロスジェネ系雇用規制緩和論者の俗流新自由主義を批判する(2013年2月15日掲載予定)
第12回:【思潮】「デジタルネイティブ」論を批判的に読むために(第2回)(2013年2月25日掲載予定)
【今後の掲載予定:書評(不定期配信)】
第1回:和久井みちる『生活保護とあたし』あけび書房、2012年12月
第2回:浜田宏一『アメリカは日本経済の復活を知っている』講談社、2012年12月
第3回:山口智美ほか『社会運動の戸惑い』勁草書房、2012年10月
第4回:出井智将『派遣鳴動』日経BP社、2010年5月
【近況】
・「コミティア103」にサークル参加します。
開催日:2013年2月3日(日)
開催場所:東京ビッグサイト
スペース:東5ホール「と」ブロック20b
備考:イベントの規定により、二次創作同人誌である『幻想論壇案内』『紅魔館の統計学なティータイム』の頒布は行いません。
・「コミックマーケット83」新刊の『紅魔館の統計学なティータイム――市民のための統計学Special』ですが、好評につき重版しました。とらのあなに大幅に補充したほか、COMIC ZINにも補充する予定です。また、電子版がメロンブックスDLにて販売中です。下記の告知ページをご覧下さい。
http://ameblo.jp/kazutomogoto/entry-11422949903.html
・同じく「コミックマーケット83」新刊の『社会の見方、専門知の関わり方――俗論との対峙から考える』がCOMIC ZINにて委託販売中です。
http://shop.comiczin.jp/products/detail.php?product_id=14728
・「コミックマーケット80」(2011年夏コミ)で出した『青少年言説Commenatries――後藤和智/後藤和智事務所OffLine発言集』を、ニセ科学関係、政策論関係を中心に再編集した普及版『青少年言説Commenatries Lite』がKindleストアで販売中です。筆者の2010年頃の思考の集大成となっています。是非ともお買い求め下さい。Amazonの著者セントラルはこちらです。
http://www.amazon.co.jp/後藤-和智/e/B004LUVA6I
・電子書籍の新シリーズとして、書き下ろしの「平成日本若者論史Plus」を始めます。第一弾として、『ロスジェネ・メディアの世代認識:『AERA』に見るロスジェネ世代の特別視と他世代への攻撃性に関する考察』の配信を開始しました。さらに、2月初旬には、第2弾となる『「ニート」肯定言説の甘い罠』の刊行も予定しております。
・「仙台コミケ204」新刊の『徹底批判 新日本国憲法ゲンロン草案』の冊子版がCOMIC ZIN、コミックとらのあな、模索舎で、電子書籍版がKindleストア及びブクログのパブーで販売しております。詳しくはこちらをご参照ください。
http://ameblo.jp/kazutomogoto/entry-11394353097.html
・「コミックマーケット82」新刊の『現代学力調査概論――平成日本若者論史3』がCOMIC ZIN及びコミックとらのあなにて委託販売中です。詳しくはこちらをご覧下さい。
http://ameblo.jp/kazutomogoto/entry-11322783067.html
・筆者が以前刊行した同人誌の電子書籍版、『「若者論」を狙え! Electronic Publication Version』がKindleストア及びブクログのパブーで販売中です。
・筆者が以前刊行した「ヤンキー風俗研究会」との合同誌『義家汚染――ヤンキー脳の恐怖』『俗・義家汚染――人として軸がぶれている』をブクログのパブーにて無料公開しています。
(2013年1月25日)
奥付
後藤和智の若者論と統計学っぽいブロマガ・第9回「【科学・統計】レビュー系サイト・同人誌のための多変量解析入門/第1回:フリーソフト「R」を導入しよう」
著者:後藤 和智(Goto, Kazutomo)
発行者:後藤和智事務所OffLine
発行日:2013(平成25)年1月25日
連絡先:kgoto1984@nifty.com
チャンネルURL:http://ch.nicovideo.jp/channel/kazugoto
著者ウェブサイト:http://www45.atwiki.jp/kazugoto/
Twitter:@kazugoto
Facebook…
個人:http://www.facebook.com/kazutomo.goto.5
サークル:http://www.facebook.com/kazugotooffice
第9回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門/第1回:フリーソフト「R」を導入しよう
サマリー:
漫画や小説などをレビューしたサイトや同人誌、あるいは書籍はよく見かける。しかし、その多くは個々の作品の評価に終始し、評価の全体像が見られるものは少ない。そこでこのシリーズでは、多変量解析を通じて、レビューの全体像を示す手法を紹介していく。第1回は、分析のためのツールとして、フリーソフト「R」を紹介する。
漫画や小説などをレビューしたサイトや同人誌は、いろいろなところでよく見かけると思います。3年くらい前の文学フリマでしたか、私の大好きな、所謂「萌え系」の4コマ漫画を総合的にレビューした同人誌がありまして(『5M vol.04』サークルファイブエム、2010年5月)、その同人誌には『ふおんコネクト!』(芳文社、全4巻)作者のざら氏のインタビューのほか、いろいろと納得させられるレビューが書かれていました。適切な評論やレビューは、作品世界の読解や、あるいは創作に対してプラスに働くものだと思いますので、どんどん行い、そしてレビューする側も、他の人の評論やレビューを参照して、作品・評論共に質が上がっていけばいいかなと思います。
ところで、こういう風な、複数の作品をレビューしたもので、またそのレビューの内容が優れたものであっても、複数のレビューを総合的に評価して、作品の傾向を見たり、あるいはレビューがどのような思想に基づいているかについて示してみせたものは少ないように思えます。確かにレビューから個々の作品がどういうものであるかを読むことはできますが、作者が作品群を「全体として」どのように評価しているのかについては不明です。これは別に昨今の評論の傾向を批判しているわけではないのですが、でも評論の全体像が見えれば面白いのになぁ、と考えることはよくあります。
さて、このシリーズのタイトルは、「レビュー系サイト・同人誌のための多変量解析入門」です。実をいうと、先ほど述べたような「評論の全体像を見る」という行為は、統計学を使って行うことができるのです。方法としては次の2つが挙げられます。
1. レビューそのものを統計分析の対象にする。
2. 作品をレビューする際にタグをつけて、そのタグについて統計分析する。
1については特に言うことはないと思いますが、レビューのテキストそのものについて分析する必要があるため、若干手間がかかります。2については、いくつかの評価基準を設定する(例えば、「学園もの」「ファンタジー」「百合要素強い」など)を設定して、それに作品が当てはまるかどうかをチェックした後、その評価に対して統計分析を行うというものです。こちらの方が手法も簡単であり、また結果もわかりやすいのでおすすめです。このシリーズでは、一応両方について取り扱っていきますが、後者の手法に基づく分析はいくつかあります。
まず読者の皆様におすすめしたいのは、同人サークル「でいひま」の作品「エロマンガ統計」シリーズです。これは、成人向け漫画などについて、作品の傾向をリストアップし、それについて統計解析を行っていくというシリーズの総集編で、その中には先ほど説明した2の手法に基づく分析がたくさん収められています。使用されている手法は主に数量化3類(対応分析)と呼ばれているものですが、他にも様々な分析が試みられているので、是非とも目を通しておいてください。COMIC ZINで委託されておりますが、残念ながら総集編は通販では品切れのようです…。
http://shop.comiczin.jp/products/list.php?category_id=2661
しかし今回は、分析手法について説明する前に、分析ツールの導入について説明していきたいと思います。
作品の分析には、多変量解析という手法を使う必要があります。多変量解析を用いると、たくさんの作品の性質について全体像を見渡すような分析ができますが、そもそも多変量解析を行うには専用のソフトが必要になります。しかし、有名な統計解析ソフトとしてはSPSSやSASがありますが、いずれもかなり高額です。またエクセルを使って多変量解析ができるようになるソフトも発売されていますが、その代表格である社会情報サービスの「エクセル統計」もかなり高価です(http://software.ssri.co.jp/ex/)。
ただ、近年はフリーソフトでも複雑な統計処理ができるようになっています。そのソフトこそ、「R」(R言語)です。RはS言語をベースに1990年代終わり頃からオープンソースで開発されているプログラミング言語・統計解析環境です。Rについては、日本では、岡田昌史氏によるサイト「RjpWiki」が充実しているため、是非とも読んでみてください。
http://www.okada.jp.org/RWiki/index.php?RjpWiki
さて、Rをインストールするわけですが、先ほども述べたとおりRはオープンソースのソフトウェアのため、誰でも無料でダウンロード・インストールすることが可能です(その代わり無保証です)。Windows, Macintosh, Linuxのいずれにも対応しているので、まずはRjpWikiの「Rのインストール」のページから、最新版を入手しましょう(以下、ここではWindows版を想定して説明します)。
Rをインストールしたら、まずはパッケージをインストールする必要があります。Rにおけるパッケージとは、特に複雑な統計解析を行う上で必要不可欠なもので、これがないとRは最低限の機能しか持たなくなります。今後説明する予定の数量化3類などは特定のパッケージがないとできないため、まずはパッケージを入手しましょう。パッケージを入手する際には、上のメニューから「パッケージ」を選び、さらに「パッケージのインストール」を選びます。
そうすると、最初にどこのCRAN(Rのサーバーです)を選択するかの画面になります。これは基本どこでも構いません(私は筑波大学のミラーを使っています)。次にインストールするパッケージを選びますが、まずは一番上のパッケージをクリックし、スクロールバーを一番下に持っていって、Shiftキーを押しながら一番下のパッケージをクリックしましょう。そうすると、全てのパッケージが選択されます。
あとは、全てのパッケージがインストールされるのを待つだけです(なお、パッケージを入れるために、ハードディスクにだいたい3GBくらいの空きを作っておきましょう)。ブロードバンド環境でも数時間かかるので、その間はインターネットを使わない作業をするか、あるいは出かけるなり寝るなりしましょう。ここまできてようやくRをフルに使用する準備が整います。
次回からは、実際にRを使って分析をする方法を見ていきましょう。
(次回はブロマガ第13回に掲載予定。次回の内容は「対応分析/数量化3類」の予定です。)
【今後の掲載予定:定期コンテンツ(原則として毎月5,15,25日更新予定)】
第10回:【政策】若者雇用戦略を総括する(第2回)(2013年2月5日掲載予定)
第11回:【思潮+政策】ロスジェネ系雇用規制緩和論者の俗流新自由主義を批判する(2013年2月15日掲載予定)
第12回:【思潮】「デジタルネイティブ」論を批判的に読むために(第2回)(2013年2月25日掲載予定)
【今後の掲載予定:書評(不定期配信)】
第1回:和久井みちる『生活保護とあたし』あけび書房、2012年12月
第2回:浜田宏一『アメリカは日本経済の復活を知っている』講談社、2012年12月
第3回:山口智美ほか『社会運動の戸惑い』勁草書房、2012年10月
第4回:出井智将『派遣鳴動』日経BP社、2010年5月
【近況】
・「コミティア103」にサークル参加します。
開催日:2013年2月3日(日)
開催場所:東京ビッグサイト
スペース:東5ホール「と」ブロック20b
備考:イベントの規定により、二次創作同人誌である『幻想論壇案内』『紅魔館の統計学なティータイム』の頒布は行いません。
・「コミックマーケット83」新刊の『紅魔館の統計学なティータイム――市民のための統計学Special』ですが、好評につき重版しました。とらのあなに大幅に補充したほか、COMIC ZINにも補充する予定です。また、電子版がメロンブックスDLにて販売中です。下記の告知ページをご覧下さい。
http://ameblo.jp/kazutomogoto/entry-11422949903.html
・同じく「コミックマーケット83」新刊の『社会の見方、専門知の関わり方――俗論との対峙から考える』がCOMIC ZINにて委託販売中です。
http://shop.comiczin.jp/products/detail.php?product_id=14728
・「コミックマーケット80」(2011年夏コミ)で出した『青少年言説Commenatries――後藤和智/後藤和智事務所OffLine発言集』を、ニセ科学関係、政策論関係を中心に再編集した普及版『青少年言説Commenatries Lite』がKindleストアで販売中です。筆者の2010年頃の思考の集大成となっています。是非ともお買い求め下さい。Amazonの著者セントラルはこちらです。
http://www.amazon.co.jp/後藤-和智/e/B004LUVA6I
・電子書籍の新シリーズとして、書き下ろしの「平成日本若者論史Plus」を始めます。第一弾として、『ロスジェネ・メディアの世代認識:『AERA』に見るロスジェネ世代の特別視と他世代への攻撃性に関する考察』の配信を開始しました。さらに、2月初旬には、第2弾となる『「ニート」肯定言説の甘い罠』の刊行も予定しております。
・「仙台コミケ204」新刊の『徹底批判 新日本国憲法ゲンロン草案』の冊子版がCOMIC ZIN、コミックとらのあな、模索舎で、電子書籍版がKindleストア及びブクログのパブーで販売しております。詳しくはこちらをご参照ください。
http://ameblo.jp/kazutomogoto/entry-11394353097.html
・「コミックマーケット82」新刊の『現代学力調査概論――平成日本若者論史3』がCOMIC ZIN及びコミックとらのあなにて委託販売中です。詳しくはこちらをご覧下さい。
http://ameblo.jp/kazutomogoto/entry-11322783067.html
・筆者が以前刊行した同人誌の電子書籍版、『「若者論」を狙え! Electronic Publication Version』がKindleストア及びブクログのパブーで販売中です。
・筆者が以前刊行した「ヤンキー風俗研究会」との合同誌『義家汚染――ヤンキー脳の恐怖』『俗・義家汚染――人として軸がぶれている』をブクログのパブーにて無料公開しています。
(2013年1月25日)
奥付
後藤和智の若者論と統計学っぽいブロマガ・第9回「【科学・統計】レビュー系サイト・同人誌のための多変量解析入門/第1回:フリーソフト「R」を導入しよう」
著者:後藤 和智(Goto, Kazutomo)
発行者:後藤和智事務所OffLine
発行日:2013(平成25)年1月25日
連絡先:kgoto1984@nifty.com
チャンネルURL:http://ch.nicovideo.jp/channel/kazugoto
著者ウェブサイト:http://www45.atwiki.jp/kazugoto/
Twitter:@kazugoto
Facebook…
個人:http://www.facebook.com/kazutomo.goto.5
サークル:http://www.facebook.com/kazugotooffice
コメント
コメントはまだありません
コメントを書き込むにはログインしてください。