1 イントロダクション

𠮷田政之

近畿大学経営学部

2026/04/17

1 講義の概要

  1. 講義の概要

  2. 分析の流れ

  3. この講義でやること

  4. 参考文献

1.1 講義の概要・到達目標

pythonを用いて基礎的な統計分析ができる

  • 前期のほとんどの時間は、定量的な分析を行う際の分析方法について扱います
  • 「分析ができる」というのにもさまざまなレベルがありますが、「基本的な分析手法を理解し、正しく運用できる」ようになることを目指します

1.2 この講義の位置付け

データ分析をするための基礎的知識を確認します

平均値

Aクラスのテストの結果は
100, 50, 30, 50, 40, 50, 40, 80, 30, 30 → 平均50点

Bクラスのテストの結果は
100,0,0,100,0,100,0,0,100,100 → 平均50点

  • 平均値50点とは何を意味している?
  • これを知って何に使える?
  • 同じ平均点でも、AとBでは全く違うような気もするけど?

分析をするための道具としてのRの使い方を学びます

  • 統計的分析は、エクセルでもできないことはない
  • でも専門のツールを使った方がはるかに便利

さっきの平均値はこんなふうに計算できる

x = [100, 50, 30, 50, 40, 50, 40, 80, 30, 30]
sum(x) / len(x)
50.0
y = [100, 0, 0, 100, 0, 100, 0, 0, 100, 100]
sum(y) / len(y)
50.0
x = c(100, 50, 30, 50, 40, 50, 40, 80, 30, 30)
mean(x)
[1] 50
y = c(100, 0, 0, 100, 0, 100, 0, 0, 100, 100)
mean(y)
[1] 50

データ分析の考え方と、実行方法を並行して学びます

理論的枠組みや先行研究を踏まえて適切な問いを立て、確実な分析技法を用いて良質のデータを獲得し、的確な方法で分析を行うことによって、問いに対する答えを導き出す(佐藤 2015a, 25)

1.2.1 新しい知識と情報?

  • 研究というものは、何かを知るために行われるもの
    • 新しい知見を得るために行われている
    • 特に社会的もしくは理論的に重要だけどわかっていない何かを明らかにしたい

1.2.2 システマティックに探求?

  • 社会科学の領域で広く認められた手順や方法を踏まえて分析する
    • 適当な方法では、明らかにしたいことがわからない
    • もっと酷い場合は間違った結論を出してしまうかもしれない

  • 適切な方法で獲得したデータを的確な方法で分析することで、問いに対する答えを証拠を持って提示する事ができることを目指す

1.3 エビデンスの提供元としてのデータ分析

  • データ分析結果は、国家・地方公共団体の政策や企業の経営判断に役立てられる(かもしれない)

いわゆる「目利き」はどれぐらい有効なのか?

データが集計されていないと、経験や勘に頼るしかない

  • 勘や経験も重要
    • 全てをデータ分析に置き換えることはできない
  • でも、データを蓄積して、それをうまく分析できたらより良い判断ができるかもしれない。
    • 世の中には、直感に反する関係がいっぱいある。良いと思って実行していたことが、実は逆効果だったり
  • しかし、分析の仕方がまずいと誤った結果をエビデンスとして提供してしまう可能性も
    • 関係のないものを関係あると示す
    • 関係のあるものを関係ないと示す
    • 正の関係のものを負の関係として示す
  • 正しい分析を行えるようになりましょう

2 分析の流れ

  1. 講義の概要

  2. 分析の流れ

  3. この講義でやること

  4. 参考文献

研究は以下のような流れに従ってなされます

  1. 研究課題の設定(問い)
  2. リサーチ・デザインの策定
  3. データ収集・データ分析
  4. 論文や報告書の作成(答え)

2.1 研究課題の設定

  • 研究の目的は、何かしらの新しい知識や情報を得ることにある
  • 何かしら研究するべき課題・疑問がある
    • まだわかっていないことの中で社会的もしくは理論的に重要なもの

例:オンデマンド講義は学習成果を高めるの?

メリット:好きなペースで進められる、何度でも復習できる

デメリット:集中できない、どうせ見ない

2.2 リサーチ・デザインの設定

  • 問いが定まっても、闇雲にアンケートを行えば良いわけではない
    • 問いに関連してすでにわかっていることは何かを把握する
      • 理論や専門知識、過去の研究結果
    • 問いの答えとその理由に関する仮説を立てる
    • データをどのように取るのかを検討する

例:オンデマンド講義は学習成果を高めるの?

  • 学習成果を規定する要因についてすでにわかっていることは?
  • 教室での学習とオンデマンド学習の違いは?

2.3 データ収集・分析

  • リサーチデザインに従って収集したデータを適切に分析して、仮説を検証する
  • 仮説の検証結果を根拠に当初の問いの答えを決める

例:オンデマンド講義は学習成果を高めるの?

  • オンデマンド学習の受講生の学習成果データ
  • 教室講義の受講生の学習成果データ

(ハイブリッド講義で講義内容が一緒だと良さそう。ただしオンラインか教室かは学籍番号で決められている設定じゃないと困る)

  • 分析の結果、教室講義の受講生の方が良い成績→教室講義の方が成果が高いと結論

2.4 論文や報告書の作成

  • 分析結果は(学術研究としてなら)論文、(コンサルティングや社内プロジェクトなら)報告書のような形でまとめられます。
  • まとめられた結果は多くの場合「これからどうするか」といった将来の意思決定に役立てられます。

例:オンデマンド講義は学習成果を高めるの?

  • 「教室講義の受講生の方が良い成績→教室講義の方が成果が高い」という分析結果を、問題意識や分析設計・データの概要とともにレポートとしてまとめる
  • オンデマンド講義の拡大の是非を検討する材料として利用

3 この講義でやること

  1. 講義の概要

  2. 分析の流れ

  3. この講義でやること

  4. 参考文献

3.1 データを使って分析の形を理解する

統計分析の背後にある理論は難しいです

  • 確率論
  • 計量経済学
  • 心理統計

理論を学んで分析できるようになる、に越したことはありませんが、理論→実践だと実際分析できるようになるまでにすごく長い時間がかかります

そこで…

最低限の理屈を、実際に分析をしながら学ぶ

を目指します

3.2 定量的データの分析方法を理解する

問いの設定や、リサーチデザインについては、例えば 佐藤 (2015a), 佐藤 (2015b), 伊丹 (2001), 田村 (2006), 須田 (2019) などが詳しい。

  • ここでは定量的なデータの分析部分を中心に扱います
    • データの種類
    • データのまとめ方
    • 母集団と標本
    • 推定と検定
    • 回帰分析
  • これは、得られたデータからなるべく間違いのない結果を提示するための方法に関する部分です

3.3 プログラミング言語Python (or R)を使った分析方法の習得

  • この講義では、特に統計的な処理にRというプログラミング言語を使います
  • Rは特に統計分析に特化したプログラミング言語で、Pythonのような汎用性がない代わりに、統計的な処理に関わる機能や操作性が高いです
    • ただし、統計処理に関わる前後の処理も得意で、例えばレポートやスライド資料も作れます

3.4 この講義でのデータ分析の考え方

この講義では、ユーザーとしての統計分析方法について説明します(統計理論の証明等はしません)

車を運転するにあたって、

  • エンジンの仕組み内燃機関がどうたらこうたら、
  • ハイオクガソリンのハイオクとは?

は詳しく知っている必要はないですでも、

  • レギュラーガソリンで走る普通車にハイオクを入れても問題はないけど、軽油を入れたら壊れる
  • 一方通行の標識の意味

といった知識は運転するにあたって必要です。

統計分析でも、分析する上で

  • ガウス積分を使った正規分布の積率母関数の導出

は知らなくても支障はないけれど、

  • 統計的仮説検定の結果の意味
  • 分析上の仮定とその仮定が成り立たない時に起こる問題

等を知っていないと、間違った結果を計算してしまったりするという意味で問題です

この講義では、分析上の大きな間違い(プラスの関係があるものをマイナスと推定したり、関係ある(ない)ものを関係ない(ある)と推定したり)が起こらない程度の知識を得つつ、実際に分析作業ができるようになることを目指します。

生成AIについて

使い慣れておくに越したことはないので、この講義では各種生成AIを活用して構いません。

ただし、丸投げや頼りきりは避けてください。 学習者の観点からは、丸投げの不利益が報告されています

生成AIは常に正解を出すわけではありません。 指示した通りのものは作ってくれるかもしれませんが、意図を汲んでくれるとは限りません。ソフトウェアであれば、自分の欲した機能が付いてるかどうか触って確認することができます。一方で、分析方法や分析結果が自分の要求したものどおりになっているかは、コードを確認する必要があります。 そのためには、自分でもコードが読めないといけません。

この講義の内容であれば、AIからほぼ正しい出力が得られるでしょう。 課題も難なくこなせます。しかし、何が出力されたのかを理解しないまま終わらないでください。

コードを書くときは、AIを使わないか、使う場合は自分でも同じコードが書けると確信できる状態で提出してください。例えば、エラーの修正方法を尋ねるのは構いませんが、なぜ修正できたのかわからないまま提出しないでください。

考えの生成や整理、文章の推敲に活用するのは構いません。データを探したり、問いを一緒に練り上げるのも良い使い方だと思います。

参考文献

伊丹敬之. 2001. 創造的論文の書き方. 東京: 有斐閣
佐藤郁哉. 2015a. 社会調査の考え方 上. 東京大学出版会
———. 2015b. 社会調査の考え方 下. 東京大学出版会
田村正紀. 2006. リサーチ・デザイン : 経営知識創造の基本技術. 東京: 白桃書房
須田敏子. 2019. マネジメント研究への招待 : 研究方法の種類と選択. 東京: 中央経済社