データ分析内容の決め方![実際に役に立つデータ分析の仕方]

こんにちは、大学でデータ分析や機械学習を専攻しているけーぷろです!

私は大学でデータ分析から機械学習まで勉強しています!大学でデータの集め方からデータを実際に分析するまで一通りしてきました。

そこで今回は大学で実際に学んできたことをブログで全て公開していきます!

ジェイソン

これを見ればあんな事やこんな事を分析できるんだね!

公開する内容はデータ分析の流れなので、身の回りの気になることや社会の小さな問題をデータ分析の力で解決する方法を紹介していきます!

データ分析の流れが何か掴めてない人のためにデータ分析の流れを簡単に説明します

データ分析の主な流れ

データ分析の流れ

何を分析するか決める

データを集める

データ分析・考察を行う

すごい単純でしょ?笑

データ分析は何を分析するのか決めて、データを収集し、PythonやRといった分析ツールを用いて分析を行っていきます。そして、分析した結果をグラフや図に表示して考察を行っていくのです!考察から得られた内容が分析結果となります

今回はデータ分析の流れを全て説明すると量が多いので、「データ分析の決め方」をテーマに紹介していきます!

それでは本編へ移りましょう!!

まずは何を分析したいかを決める

データ分析する以前に自分は何を分析したいかを決める必要があります。

  • 学生のテストの点数の特徴を分析したい
  • 全国都道府県の住みやすい地域を分析したい
  • 子供を多く産む都道府県はどこか

まずは自分が気になる内容を見つけることから始めていきましょう!

初めは身近なものからデータ分析するのがおすすめです!

身近な分析内容の主な例は「友達の身長・体重の特徴を分析したい」や「住んでいる市の街ごとにある各コンビニの数」でもいいです!

身近な内容以外にも「全国都道府県の住みやすい街がどこか分析してみたい」や「飲食店の売り上げを下げている原因を分析したい」など大きな内容を分析するでも良いと思います

分析するのに必要なデータは何か

気になる内容が決まればその内容に必要なデータは何かを考えて行きます!

分析内容にどんなデータが必要になるのか掘り出していく作業をしていきます。

この作業は規模が小さい分析内容でしたら簡単ですが、規模が大きい分析内容になると考えるのが難しくなっていきます。

規模が小さい内容の場合

規模が小さい内容は自力でデータを集められそうなものです!

例えばクラスメイトのテストの点数の特徴を分析したい場合を考えてみましょう!

例:学生のテストの点数の特徴を分析したい場合

対象学年を決める(クラスメイトにする!)

対象学生のテスト教科を決める(国・数・理・社・英のテストの点数を集める!)

数学の点数が高い人の苦手な教科の特徴を見つける

学生のテストの点数の特徴を分析したい場合はテストの点数のデータさえあれば分析はできますよね笑

実際にテストの点数データを集めるのは難しいので架空で作るのでもいいと思います!

それでは規模が大きいデータを分析する場合に必要なデータを見ましょう

規模が大きい内容の場合

規模が大きい内容は自力でデータを収集することが困難で、googleを使ってデータを集めていくものです

例えば、全国の住みやすい街はどこなのかを分析する場合を考えてみましょう!

例:全国の住むやすい地域を分析する

住みやすい街の条件を決める

「仕事がしやすい街が住みやすい」、「生活の暮らしが便利が住みやすい」、「教育の充実さは必要」

条件から必要なデータを決める

教育の充実さ・・「全国の塾の数」、「図書館の数」、「大学の数」

生活の暮らしが便利・・「コンビニの数」、「マンションの数」、「医療施設の数」

仕事がしやすい街・・「失業率」、「一人当たりの平均所得」

この中から飛び抜けた値の都道府県が住みやすい街だ!

住みやすい街といった曖昧な内容を分析したい場合はかなり大規模なデータ量になります。

既に大規模のデータを会社や学校からもらえる場合はそれを使って何かを分析するのもいいと思います!

データを持っていると言うのはそれだけでかなりの市場価値です!!

分析内容に必要な条件・カテゴリーを決めてあげる

全国の住みやすい街のような大きな規模のデータを分析したい場合はそれに必要な条件・カテゴリーを決める必要があります。

住みやすい街ってどんなところが住みやすいのだろ??

住みやすい街には何が必要なのかを考えていきましょう!

仕事が多い方が住みやすいのか、教育面が充実している方が住みやすいのか、考えだすとたくさん出てきますね。考えても思い浮かばない場合は友人や家族に聞いてみるのもいいでしょう。

この条件決定がこれからのデータ分析する鍵になるので慎重に決めましょう!

条件・カテゴリーが決まるとそこから具体的に必要なデータを決めていく

住みやすい街は教育面に適していて仕事もしやすく、生活しやすい街が住みやすいよね!

具体的な条件が決まれば条件に対するデータを決めましょう!

教育面と言えば「図書館の数」、「教員の数」、「塾の数」とたくさんできますよね

同じように他の条件からも具体的に決めていきます!

具体的に決まればどれも数値化できる内容なはずなのでデータ収集がしやすいと思います

最後に

今回は以上になります!

データ分析するのにデータ分析の内容を決めるのが非常に重要なことが理解したと思います。

データ分析の内容を深堀りすればデータを集めやすく分析まで持っていくことができます!

この作業はデータ分析のスタートの部分なので諦めずに頑張りましょう

今回は以上になります。ありがとうございました。

アーカイブ