研究にはいろいろな分野がありますが,そのひとつ,テキストマイニングをつかって,みなさんの文章からちがいをかんがえましょう。学年,性別で,文章の内容にちがいはあるでしょうか?
今回は文章を動画形式に変えてみましょう。
1 テキストマイニングってなに?
霊夢「こんにちは。ゆっくり霊夢です」
魔理沙「魔理沙もいるぜ」
霊夢「今回は動画の方ではおなじみのわたしたちが解説してみようと思います」
霊夢・魔理沙「ゆっくりしていってね!!」
魔理沙「霊夢。テキストマイニングと言われても,私にはサッパリだぜ。かんたんに説明するんだぜ」
霊夢「では,魔理沙さん。『ゆっくり魔理沙』という単語をグーグルで検索してください」
魔理沙「おおっ!たくさんの美少女が表示されたんだぜ。これはだれなんだぜ?」
霊夢「そういうのはいいですから。一番上に表示されている記事はなんですか?」
魔理沙「ええと……『ゆっくり魔理沙とは (ユックリマリサとは) [単語記事] - ニコニコ大百科』だぜ」
霊夢「これが一番かんたんな例です。検索エンジンは,魔理沙さんが入力した言葉から,もっともその内容に適したと思われる記事を選んでいます。文章をしらべて,その意味を探す方法,これがテキストマイニングです」
魔理沙「なるほどなんだぜ!」
霊夢「では,つぎにBingでおなじように検索してください。一番上に表示されている記事はなんですか?」
魔理沙「Bing,Bingと。あれ?一番上はおなじだけど,ほかの記事がちがうんだぜ。あと美少女の絵のならびもちがうんだぜ」
霊夢「グーグルとBingでは,検索エンジン,つまりテキストマイニングの方法がちがうため,もっとも適していると思われる内容がちがっているということです」
魔理沙「なんでおなじにしないんだぜ?」
霊夢「テキストマイニングは,現在でも研究が進められている分野だからです。どの方法が一番良いかを競っているんですよ」
魔理沙「最先端の技術ってことなんだぜ。スゴイんだぜ!」
霊夢「そこで,今回は人力飛行機の記事をつかって,テキストマイニングについて紹介したいと思います」
2 見える化エンジン
霊夢「このプログラムでつかっているテキストマイニングは,プラスアルファ・コンサルティング社の『見える化エンジン』です」
参考URL:見える化エンジン
霊夢「企業がつくった商品の評判をあつめて,良いところと改善が必要なところとしらべたりする方法としてつかわれています。このプログラムでは,この方法をつかって,みなさんの学びをしらべて,みなさんの成長と,より良い人材育成プログラムの開発につなげることを目的にしています」
魔理沙「霊夢。話を聞いただけじゃピンと来ないぜ。実際の結果を見せるんだぜ。論より証拠なんだぜ」
霊夢「魔理沙さん,古いですね。最近はハンズオンというらしいですよ」
3 人力飛行機の記事をテキストマイニングしよう!
霊夢「【人力飛行機】理系のセンパイをインタビューしよう!【二宮翔会】の記事を,見える化エンジンにいれてテキストマイニングしてみましょう」
図1 全員の記事のマッピング
霊夢「これが,全員の記事の結果です。テキストマイニングの結果をわかりやすく,地図に表しているので,マッピングとよびます」
霊夢「青い丸は出てくる回数が多い単語で,オレンジの線はその単語とつながりが強い単語,灰色の線は,その単語といっしょに出てくることが多い単語です」
魔理沙「いくつかにわかれているのは,なんでなんだぜ?」
霊夢「単語どうしのつながりが多いものがグループ化されているのです。記事では話題が4つにわかれているということです」
霊夢「丸の下にある数値は,その単語が出てきた回数です」
魔理沙「一番よく出てきた単語は『鳥人間』,つぎに『コンテスト』,『二宮』の順番なんだぜ」
4 学年のちがいは?
霊夢「では,つぎに小学生と中学生を別にしてテキストマイニングしてみましょうか」
魔理沙「そんなこともできるんだぜ?」
図2 小学生のマッピング
図3 中学生のマッピング
霊夢「魔理沙さん。小学生と中学生をくらべると,なにがちがうでしょうか?」
魔理沙「小学生は,飛行機という単語を中心にして文章が書かれているようなんだぜ」
魔理沙「中学生は……話題がいくつかあって,マッピングが広がっているように感じるんだぜ。なかでもコンテストが話題の中心みたいなんだぜ」
魔理沙「機体に注目すると,小学生も中学生も軽さを重要と感じているんだぜ。小学生は空を飛ぶことに注目しているけど,中学生はコンテストに出ることに注目しているみたいなんだぜ」
霊夢「ほんとうは,いろいろな方法で見る必要がありますが,マッピングだけでもいろいろなことがわかりますね」
魔理沙「学年で注目している点がちがう理由なんかも研究テーマになりそうだぜ」
5 男女のちがいは?
霊夢「男女のちがいを,かんがえてみましょう」
図4 男子のマッピング
図5 女子のマッピング
魔理沙「おお!かなりちがうんだぜ!」
霊夢「男子と女子で人数がちがうせいもありますが,女子は話題が集中していますね」
魔理沙「『機体』が一番ちがうように思えるんだぜ」
魔理沙「男子は,機体の素材に注目していてカーボンでできているという具体的な構造に注目しているんだぜ」
魔理沙「女子は,機体を操縦するパイロットに注目していることがわかるんだぜ」
霊夢「とても大まかですが,ものを中心にして記述している男子と,操縦するパイロットを中心にして記述している女子というちがいがあるかもしれませんね」
魔理沙「それは取材の仕方のちがいかもしれないんだぜ」
霊夢「そうですね。男子は説明文などを重視にしていて,女子は直接聞いたことを重視しているというちがいもあるかもしれません」
魔理沙「そういったことは実際の文章を読んでみると,ハッキリしそうだぜ!」
霊夢「そうですね。もう一度,文章を読み直してテキストマイニングについてかんがえてみましょうか」
霊夢「最先端技術,テキストマイニングについて,かんたんに紹介しました。このプログラムは,みなさんに見えないところでも,さまざまな最先端技術をつかっています。こうした分野でも,将来みなさんは活躍していくかもしれませんね」
魔理沙「それにはまず,プログラミングをしっかり学ぶ必要があるんだぜ」
霊夢「そうですね。今後の理系分野は,こういったコンピュータをつかった方法は,どんどん発展していくでしょうから,プログラミングになれておく必要はありそうですね」
霊夢「それは今回の説明を終わります」
愛媛大学ジュニアドクター育成塾
【テキストマイニング】学年や男女のちがいは文章にあらわれる?【見える化エンジン】
2017/09/12 17:00 投稿
コメント:4
- タグ:
-
愛媛大学
-
ジュニアドクター育成塾
-
小学生
-
中学生
-
テキストマイニング
-
見える化エンジン
(ID:1421491)
1は理解できた。でも2以降は投げた