We may earn an affiliate commission when you visit our partners.
Course image
園田 幸夫

データサイエンスには科学という名称が付いていますが、真理を探究するといった学問ではありません。問題を解決して対策を実行するための意思決定と行動選択の根拠を与えてくれる、有能な道具であり強力な武器です。道具や武器は使ってこそ意味があります。分析手法を勉強して理解するところで満足せず、大学の研究や企業の実務で直面する現実の問題を解決する実戦力を獲得することが本講座の目的です。

データサイエンスには、百年前に生まれた統計学から近年その価値が再認識されているベイズ統計学、注目の機械学習やディープラーニング、最先端のチャットボット技術まで、多種多様なデータ分析手法があります。残念ながら万能な手法というものはないので、多くの手法をマスターする必要があります。そして、積極的に複数の分析手法を適用することで、複雑な問題を様々な角度から解明して、本質に迫ることが可能になります。

本講座では、複雑な数式やプログラミングはできるだけ避け、フリーのデータ分析ソフトを利用して実務レベルの演習問題を解いてゆくことで実戦力を養います。

Enroll now

What's inside

Learning objectives

  • 改訂しました(2024/3/14)。映像と音声をすべて録り直しました。講義内容は基本的に変えていませんが、細部を手直ししました。自然現象や社会現象のメカニズムを分析するデータサイエンスの様々な手法について、複数のコースに分けて1つずつ習得していきます。
  • 第1回目のコースは統計学の基礎です。母集団と標本、記述統計と推測統計、さまざまな確率分布、中心極限定理、平均値や分散の推定、仮説検定などについて、頻度論の考え方に基づく統計学の基礎理論を丁寧に解説します。
  • 頻度論による統計学は今から100年ほど前に生まれました。コンピュータなど無い時代なので、統計学者は数学的に扱えるように様々な仮定のもとに理論を構築しました。例えば母集団は正規分布している等ですが、実際の現象には当てはまらないケースもあります。分析手法の前提条件と現実の問題に適用する上での注意点について学習します。
  • いま大きな話題になっているのが仮説検定です。アメリカ統計協会(asa)は2016年に発表した「p値に関する声明」の中でp値の誤用が多いことに注意を喚起しており、2019年には機関誌で“統計的に有意と言うのはやめよう”と提言しています。p値の意味と検定結果の正しい解釈を学びます。
  • すべてのコース、または、あなたに必要なコースを選択し、実務レベルの演習問題を解いていくことで、大学での研究や企業のビジネスの現場で遭遇する問題に対して、最善の意思決定と行動選択を可能にするデータ分析という強力な武器を手に入れることができます。

Syllabus

紹介

2024.3.14に改訂しました。映像と音声をすべて録り直しました。講義の内容は基本的に変えていませんが、分かりやすくなるように細部を見直しています。


データサイエンスとは

データサイエンスとは意思決定と行動選択のための武器です。分析手法を理解するだけでなく、現実の問題を解決する実戦力を獲得することが本講座の目的です。

データサイエンスの世界

百年前に生まれた統計学から最新のディープラーニングまで、多種多様なデータ分析手法を適用領域にマッピングしてゆくことで、データサイエンスの世界地図を描いて全体像を俯瞰します。

講座の全体構成

本講座ではデータサイエンスの多くの手法を学びます。第1回は「頻度論的統計学の基礎と『有意性検定』の終焉」です。

講師の紹介とデータ分析との関わり

講師の略歴と資格を紹介し、様々なデータ分析技術との関わりを説明します。

Read more

統計の歴史

古代国家における統計の誕生と、20世紀初頭に現代統計学を確立した人々と理論を紹介します。

統計分析の目的

自然現象や社会現象に内在するメカニズムを観測データから推定することが推測統計の目的です。分析に用いる概念と用語を学びます。

母集団と標本

統計学といえば「頻度論」の統計学を指します。現象全体(母集団)の特性を観測データ(標本)から推定する頻度論的統計学の考え方を解説します。

頻度分布と確率分布

自然現象や社会現象の実測データの頻度分布を紹介し、これらを分析するために用いられる代表的な確率密度関数とその関係性を紹介します。

中心極限定理

統計学の基本の中で最も重要な中心極限定理を学び、データの挙動を乱数シミュレーションにより体感します。

点推定と区間推定

母集団の平均値の点推定と区間推定を学びます。中心極限定理を用いた95%区間推定の原理について詳しく説明します。

95%信頼区間の意味

95%の意味とよくある誤解について解説します。

仮説検定の考え方

仮説検定を考えるうえでの設定を説明します。

仮説検定の例題

製品を改良することで性能がアップしたかどうかを試作品のデータから判定する例題を使って、統計的有意性による仮説検定の原理を開設します。

αリスクとβリスク

仮説検定には相反する性質を持つ2種類のリスクがあります。両者の内容とリスクコントロールの戦略について解説します。

検定手法一覧

仮説検定の手法の体系図で全体像が掴めます。

アメリカ統計協会の声明

2016年、アメリカ統計協会は「p値と統計的有意性に関する声明」で誤用が多いと警鐘を鳴らし、科学誌Natureは「統計的有意性を引退させよう」という論文を掲載しました。この内容について解説します。

統計的有意性の適用法と限界

統計的有意性による検定手法の正しい適用法とよくある間違いを解説し、手法の限界について考察します。

仮説検定の動向

仮説が真となる確率を推定できるベイズ統計に期待が集まっていますが、使いやすい分析ソフトの登場には時間がかかりそうです。

第1回の講義のポイントを箇条書きにまとめました。

Traffic lights

Read about what's good
what should give you pause
and possible dealbreakers
Avoids complex formulas and programming, focusing on practical exercises using free data analysis software to cultivate real-world problem-solving skills
Explores the foundations of statistics, including population, sample, descriptive and inferential statistics, probability distributions, the central limit theorem, and hypothesis testing
Examines the limitations of frequentist statistics and the correct interpretation of test results, especially regarding the use and misuse of p-values
Teaches the application of various data analysis techniques to solve complex problems from multiple angles, helping learners get closer to the essence of the problem
Discusses the historical context of statistical methods, including their origins and the assumptions made during their development, which may not always apply to real-world scenarios
Advises learners to select the courses that meet their needs, suggesting that this course is part of a larger series that comprehensively covers data science techniques

Save this course

Create your own learning path. Save this course to your list so you can find it easily later.
Save

Reviews summary

統計学基礎と有意性検定の批判的視点

受講生によると、本講座はデータサイエンスの第一歩として、統計学の基礎を学ぶのに適しています。特に頻度論的な統計の考え方仮説検定、信頼区間についての解説は分かりやすいという声が多くあります。また、p値の正しい解釈や統計的有意性の限界に焦点を当てている点がユニークで実務に役立つ視点を与えてくれると評価されています。ただし、内容によっては若干の前提知識があった方が理解しやすいと感じる受講生もいるようです。2024年3月の改訂により、映像・音声が改善され、以前よりも受講しやすくなったとの意見が見られます。
理論だけでなく実務への意識が高い。
"単なる理論学習でなく、データサイエンスを『意思決定と行動選択のための武器』と捉え、実践を重視する姿勢に共感しました。"
"現実の問題解決にどう活かすかという視点が常に意識されている講義だと感じます。"
"フリーソフトを使う演習があるとのことで、座学だけでなく手を動かす機会があるのは良いと思います。(※ただし、演習の詳細に関するレビューは限られています)"
映像・音声が改善され、受講しやすくなった。
"改訂後に受講しましたが、映像も音声もクリアで以前のバージョンより格段に分かりやすくなっていました。"
"リニューアルされたとのことで受講。聞き取りやすく、画面も見やすくて集中できました。"
"新しいバージョンは動画の質が高く、ストレスなく学習を進められました。"
頻度論統計の基本が丁寧に解説されている。
"母集団と標本、推定、検定といった統計学の基礎がとても分かりやすく説明されていた。"
"統計の基本的な考え方を整理できたのが良かったです。"
"頻度論に基づく統計学の入門として、全体像を掴むのに適していると感じました。"
p値の誤解や検定の限界に関する解説が有益。
"p値の正しい意味や統計的有意性の問題点について、 ASA声明などを引用しつつ詳しく解説しており、大変勉強になった。"
"実務で盲目的に使いがちな統計的有意性について、その限界と注意点を学べたのは大きいです。"
"単なる手法解説に留まらず、統計的結論の解釈における重要な視点を与えてくれる点がユニークです。"
全くの初心者には難しい部分があるかもしれない。
"統計学の考え方に初めて触れる人には、少し情報量が多く感じるかもしれません。簡単な予習があるとスムーズかと。"
"数式は避けているとのことですが、確率分布や中心極限定理などは、ある程度数学に抵抗がない方が理解しやすい部分もありそうです。"
"用語の解説は丁寧ですが、完全にゼロからだと消化不良になる可能性もゼロではないと感じました。"

Activities

Be better prepared before your course. Deepen your understanding during and after it. Supplement your coursework and achieve mastery of the topics covered in データサイエンス実戦講座[第1回]統計学の基礎と「統計的有意性」の終焉 with these activities:
統計学の基礎知識を復習する
統計学の基礎を復習することで、コースで扱う概念をより深く理解し、学習効果を高めます。
Show steps
  • 高校や大学の統計学の教科書や参考書を読み返す。
  • オンラインの統計学講座やチュートリアルを受講する。
  • 統計学の練習問題を解いて、理解度を確認する。
統計学入門書を読む
統計学の入門書を読むことで、コースで扱う概念の理解を深め、よりスムーズに学習を進めることができます。
View Melania on Amazon
Show steps
  • 統計学の入門書を選び、通読する。
  • 重要な箇所に線を引いたり、メモを取ったりする。
  • 理解できない箇所は、他の参考書やインターネットで調べる。
統計学の勉強会に参加する
他の受講生と勉強会に参加することで、理解を深め、モチベーションを維持することができます。
Show steps
  • オンラインまたはオフラインの統計学の勉強会を探す。
  • 勉強会に参加し、積極的に質問や議論に参加する。
  • 勉強会で学んだことを復習する。
Four other activities
Expand to see all activities and additional details
Show all seven activities
統計分析ソフトを使って演習問題を解く
統計分析ソフトを使って演習問題を解くことで、実践的なスキルを身につけ、理解を深めることができます。
Show steps
  • フリーの統計分析ソフト(R, Python)をインストールする。
  • コースで紹介された演習問題を解く。
  • 解答と解説を参考に、自分の解答を修正する。
統計学の用語集を作成する
統計学の用語集を作成することで、用語の理解を深め、知識を整理することができます。
Show steps
  • コースで出てきた統計学の用語をリストアップする。
  • 各用語の意味を調べ、わかりやすく説明を記述する。
  • 用語集を共有し、他の受講生と意見交換する。
身近なデータを使って統計分析を行う
身近なデータを使って統計分析を行うことで、実践的なスキルを向上させ、データ分析の面白さを体験できます。
Show steps
  • 興味のあるテーマを選び、データを収集する。
  • 統計分析ソフトを使ってデータを分析する。
  • 分析結果をまとめ、レポートを作成する。
統計的思考力を鍛える
統計的思考力を鍛えることで、データ分析の結果を正しく解釈し、より良い意思決定を行うことができます。
View Melania on Amazon
Show steps
  • 統計的思考力に関する書籍や記事を読む。
  • 日常生活や仕事で統計的な視点を持つように心がける。
  • 統計的な誤りや偏りに注意する。

Career center

Learners who complete データサイエンス実戦講座[第1回]統計学の基礎と「統計的有意性」の終焉 will develop knowledge and skills that may be useful to these careers:
データアナリスト
データアナリストは、データを使用してビジネス上の問題解決を支援する役割です。この講座は、データサイエンスの基礎を学ぶ上で非常に役立ちます。この講座では、統計学の基礎から始まり、仮説検定やp値の解釈など、データ分析の重要な概念を習得できるため、データアナリストとして必要な統計的知識と問題解決能力を養うことができます。特に、フリーのデータ分析ソフトを使った実務レベルの演習問題は、データアナリストとしての実践力を高める上で非常に有効です。データアナリストを目指す方は、この講座を受講することで、データ分析の基礎をしっかりと身につけ、自信を持って実務に臨むことができるでしょう。
ビジネスインテリジェンスアナリスト
ビジネスインテリジェンスアナリストは、企業のデータを分析し、ビジネス戦略の意思決定をサポートする役割です。この講座は、ビジネスインテリジェンスアナリストに必要なデータ分析の基礎知識を提供します。この講座では、データの可視化や分析手法だけでなく、統計的有意性の解釈についても学ぶことができます。頻度論に基づく統計学の基礎理論を習得することで、より正確なデータ分析が可能になり、ビジネス上の意思決定に貢献できます。特に、データから意思決定と行動選択を行うというデータサイエンスの本質を理解できる点は、ビジネスインテリジェンスアナリストにとって非常に重要です。
統計コンサルタント
統計コンサルタントは、統計的な知識や手法を用いて、企業や研究機関などの問題解決を支援する役割です。この講座は、統計コンサルタントとして必要な統計学の基礎知識と実践力を養う上で役立ちます。この講座では、統計学の基礎から始まり、仮説検定やp値の解釈など、統計分析の重要な概念を習得できます。特に、フリーのデータ分析ソフトを使った実務レベルの演習問題は、統計コンサルタントとしての実践力を高める上で非常に有効です。統計コンサルタントは、データに基づいた意思決定を支援するために、この講座で得られる知識とスキルを活用できます。
マーケティングアナリスト
マーケティングアナリストは、マーケティングデータを分析し、キャンペーンの効果測定や顧客行動の理解を深める役割です。この講座は、マーケティングアナリストとしてデータ分析スキルを向上させる上で役立ちます。この講座では、統計学の基礎から応用まで幅広く学ぶことができ、特に仮説検定やp値の正しい解釈は、マーケティングキャンペーンの効果を正確に評価するために不可欠です。フリーのデータ分析ソフトを使った演習問題を通じて、実践的な分析スキルを習得できる点も魅力です。マーケティングアナリストは、データに基づいた意思決定を行うために、この講座で得られる知識とスキルを活用できます。
人事アナリスト
人事アナリストは、従業員のデータ分析を通じて、人材戦略や組織開発を支援する役割です。従業員のパフォーマンス、離職率、採用データなどを分析し、組織の課題を特定し、改善策を提案します。この講座は、人事アナリストとして必要な統計学の基礎知識とデータ分析スキルを養う上で役立ちます。統計学の基礎から仮説検定、p値の解釈まで学ぶことで、より客観的なデータに基づいた分析が可能になります。人的資源の最適化に貢献します
研究者
研究者は、特定の分野における知識の探求や新たな発見を目指す役割です。この講座は、研究活動においてデータ分析を活用するための基盤を提供します。研究においては、実験データや観測データを統計的に分析し、有意な結果を得ることが重要です。この講座では、統計学の基礎理論から仮説検定、p値の解釈まで、研究に必要な統計的知識を習得できます。また、分析手法の前提条件と現実の問題への適用における注意点を学ぶことで、より信頼性の高い研究結果を得ることができます。研究者にとって、データ分析は不可欠なスキルであり、この講座はそのスキル習得を支援します。
金融アナリスト
金融アナリストは、金融市場や企業の財務データを分析し、投資判断やリスク評価を行う役割です。この講座は、金融アナリストとしてデータ分析スキルを向上させる上で役立ちます。金融市場の分析には、統計的な知識やモデリングが不可欠です。この講座では、統計学の基礎から応用まで幅広く学ぶことができ、特に確率分布や仮説検定の知識は、金融商品のリスク評価や収益予測に非常に重要です。また、統計的有意性の適用法と限界を理解することで、より正確な分析が可能になります。金融アナリストは、データに基づいた投資判断を行うために、この講座で得られる知識とスキルを活用できます。
リスクアナリスト
リスクアナリストは、企業や金融機関におけるリスクを評価し、管理するための戦略を策定する役割です。この講座は、リスクアナリストとしてデータ分析スキルを向上させる上で役立ちます。リスク評価には、過去のデータや統計モデルを用いた分析が不可欠です。この講座では、統計学の基礎から応用まで幅広く学ぶことができ、特に確率分布や仮説検定の知識は、リスクを定量的に評価するために非常に重要です。また、統計的有意性の適用法と限界を理解することで、より正確なリスク評価が可能になります。リスクアナリストは、データに基づいたリスク管理を行うために、この講座で得られる知識とスキルを活用できます。
機械学習エンジニア
機械学習エンジニアは、機械学習モデルの開発、実装、運用を行う役割です。この講座は、機械学習エンジニアとして必要な統計学の基礎知識を補強する上で役立ちます。機械学習モデルの性能を評価し、改善するためには、統計的な知識が不可欠です。この講座では、統計学の基礎理論や仮説検定、p値の解釈などを学ぶことができ、モデルの性能評価やハイパーパラメータの調整に役立ちます。また、データ分析手法の前提条件と現実の問題への適用における注意点を理解することで、より適切なモデル選択が可能になります。機械学習エンジニアは、統計的な知識を基に、より高度な機械学習モデルを開発することができます。
コンサルタント
コンサルタントは、様々な業界や企業の問題解決を支援する役割です。この講座は、コンサルタントがデータに基づいた提案を行うための基礎知識を提供します。現代のビジネスにおいては、データ分析に基づいた意思決定が重要であり、コンサルタントもデータ分析の知識を持つことが求められます。この講座では、統計学の基礎から仮説検定、p値の解釈まで、コンサルタントに必要な統計的知識を習得できます。特に、データから意思決定と行動選択を行うというデータサイエンスの本質を理解できる点は、コンサルタントにとって非常に重要です。コンサルタントは、データ分析の知識を基に、より効果的な問題解決策を提案できます。
製品マネージャー
製品マネージャーは、製品の企画、開発、販売戦略などを担当する役割です。この講座は、製品マネージャーがデータに基づいた意思決定を行うための基礎知識を提供します。製品開発や販売戦略においては、顧客データや市場データを分析し、改善点や新たな機会を見つけることが重要です。この講座では、統計学の基礎から仮説検定、p値の解釈まで、製品マネージャーに必要な統計的知識を習得できます。データから意思決定と行動選択を行うというデータサイエンスの本質を理解できる点は、製品戦略の策定に役立ちます。
都市計画家
都市計画家は、都市の発展や改善に関する計画を立案・実行する役割です。この講座は、都市計画家がデータに基づいた都市計画を立案するための基礎知識を提供します。都市計画においては、人口統計、交通量、環境データなど、様々なデータを分析し、将来の都市の姿を予測する必要があります。この講座では、統計学の基礎から応用まで幅広く学ぶことができ、特に統計的有意性の概念は、都市計画の効果を評価する上で役立ちます。データに基づいた意思決定は、より効果的な都市計画の実現に不可欠です。
公务员
公務員は、行政サービスを提供し、社会全体の利益のために働く役割です。政策立案や予算編成など、様々な業務においてデータ分析が活用される場面が増えています。本講座では、統計学の基礎やデータ分析の考え方を学ぶことができ、政策の効果測定や課題発見に役立ちます。特に、統計的有意性の適用法と限界を理解することで、より客観的なデータに基づいた政策立案が可能になります。公務員は、データ分析の知識を基に、より効果的な行政サービスを提供できます。
データエンジニア
データエンジニアは、データの収集、加工、保存、提供などのデータ基盤の構築と運用を行う役割です。この講座は、データエンジニアがデータ分析の基礎知識を理解する上で役立ちます。データエンジニアは、データ分析を行うデータアナリストやデータサイエンティストと協力して業務を進めることが多いため、データ分析に関する基本的な知識を持っていることが望ましいです。この講座では、統計学の基礎やデータ分析の考え方を学ぶことができ、データ分析チームとのコミュニケーションを円滑に進める上で役立ちます。データエンジニアは、データ分析の知識を理解することで、より効果的なデータ基盤を構築することができます。
教育者
教育者は、教育機関で知識やスキルを教える役割です。特に統計学やデータサイエンス関連の教育を行う教育者にとって、本講座は教材の理解を深め、教育の質を高める上で役立ちます。本講座では、統計学の基礎理論から仮説検定の注意点まで、教育に必要な知識が網羅されています。統計的有意性の解釈に関する最新の動向を把握することで、より正確な知識を学生に伝えることができます。教育者は、本講座で得た知識を基に、効果的な教育活動を展開できます。

Reading list

We've selected one books that we think will supplement your learning. Use these to develop background knowledge, enrich your coursework, and gain a deeper understanding of the topics covered in データサイエンス実戦講座[第1回]統計学の基礎と「統計的有意性」の終焉.

Share

Help others find this course page by sharing it with your friends and followers:

Similar courses

Similar courses are unavailable at this time. Please try again later.
Our mission

OpenCourser helps millions of learners each year. People visit us to learn workspace skills, ace their exams, and nurture their curiosity.

Our extensive catalog contains over 50,000 courses and twice as many books. Browse by search, by topic, or even by career interests. We'll match you to the right resources quickly.

Find this site helpful? Tell a friend about us.

Affiliate disclosure

We're supported by our community of learners. When you purchase or subscribe to courses and programs or purchase books, we may earn a commission from our partners.

Your purchases help us maintain our catalog and keep our servers humming without ads.

Thank you for supporting OpenCourser.

© 2016 - 2025 OpenCourser