検索

羽山博

羽山博がアイティメディアで執筆した記事一覧です。

やさしい推測統計(区間推定編):

初歩からステップアップしながら学んでいく『やさしいデータ分析』シリーズ第3弾。「記述統計と回帰分析編」「確率分布編」に続き、「推測統計(区間推定編)」がスタート。第1回は出発点として、推測統計の「点推定」と「区間推定」の意義や考え方を学びます。この機会に、データ分析の基礎をしっかり学んでみませんか?

()

やさしい確率分布:

データ分析の初歩から学んでいく連載(確率分布編)の第13回。ワイブル分布は機械の寿命や故障率の分析に使われる分布です。今回も具体例を基に、ワイブル分布の利用例や、確率密度関数と累積分布関数の形を見ていきます。母数(パラメーター)として指定するαやβの適切な値の決め方も解説します。

()

やさしい確率分布:

データ分析の初歩から学んでいく連載(確率分布編)の第12回。ベータ分布は「確率の確率」とも呼ばれる分布です。ある事象の成功数と失敗数が分かっているときに、成功率が一定の範囲に入っている確率を求めるのに使われます。今回も具体例を基に、ベータ分布の利用例や、確率密度関数と累積分布関数の形を見ていきます。

()

やさしい確率分布:

データ分析の初歩から学んでいく連載(確率分布編)の第11回。ガンマ分布やアーラン分布は、待ち行列の分析などに使われる分布です。ある事象が起こる平均の間隔が分かっているときに、ある期間内にその事象が何回か以上起こる確率が求められます。今回は具体例を基に、その確率を求め、ガンマ分布の確率密度関数や累積分布関数の形を見ていきます。

()

やさしい確率分布:

データ分析の初歩から学んでいく連載(確率分布編)の第10回。指数分布は待ち行列の分析などに使われる分布です。一定期間に起こる事象の数が分かっているときに、ある期間内にその事象が起こる確率が求められます。今回は具体例を基に、確率を求めたり、指数分布の確率密度関数や累積分布関数の形を見ていきます。

()

やさしい確率分布:

データ分析の初歩から学んでいく連載(確率分布編)の第9回。F分布は分散の比に関連する分布です。2つの母集団から取り出されたサンプルを基に「それぞれの母集団の分散に違いがあるのか」を調べる場合などに使われます。F分布の確率変数と自由度の求め方を見た後、その確率密度関数や累積分布関数について解説します。

()

やさしい確率分布:

データ分析の初歩から学んでいく連載(確率分布編)の第8回。t分布は母分散が分からない場合の平均値に関連する分布です。中心極限定理を出発点とし、正規分布と比較しながらt分布の姿を明らかにしていきます。続けて、確率密度関数や累積分布関数の求め方や可視化の方法を解説し、利用例などを紹介します。

()

やさしい確率分布:

データ分析の初歩から学んでいく連載(確率分布編)の第7回。カイ二乗分布は標準得点の二乗和の分布です。標準得点とは何か、二乗することはどういう意味を持つのか、といった基本的なところからカイ二乗分布の姿を明らかにしていきます。続けて、確率密度関数や累積分布関数の求め方や可視化の方法を解説し、利用例などを紹介します。

()

やさしい確率分布:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載(確率分布編)の第6回。正規分布は平均値を「山」の中心として、標準偏差によって左右対称に「すそ」が広がるような形の連続型確率分布です。正規分布がどのようなものかを確認した後、確率密度関数や累積分布関数の求め方や可視化の方法を解説し、利用例などを紹介していきます。

()

やさしい確率分布:

データ分析の初歩からステップアップしながら学んでいく連載(確率分布編)の番外編。代表的な離散型確率分布に対する累積分布関数の逆関数を紹介。例えば、二項分布の累積分布関数ではn回中k回まで成功する確率が求められますが、その逆関数では何%か(以上)の確率で成功するまでの回数を求められます。

()

やさしい確率分布:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載(確率分布編)の第5回。幾何分布とは、k回目に成功する確率の分布です。一方、負の二項分布は、n回成功するまでにk回失敗する確率の分布です。これらの確率分布が利用できる事例を確認した後、確率質量関数や累積分布関数の求め方、可視化の方法などを解説していきます。

()

やさしい確率分布:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載(確率分布編)の第4回。ポアソン分布とは、出来事(事象)が、まれにしか起こらない場合に、独立な試行を何回も繰り返したときの確率分布です。そのような事例を紹介した後、確率の求め方や可視化の方法などを解説していきます。

()

やさしい確率分布:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の確率分布編です。第1回は出発点として、推測統計の基礎となる確率分布の意味や種類、特徴を解説します。離散型分布と連続型分布の違いや種類、確率分布を表す確率質量関数/確率密度関数と累積分布関数の意味や特徴などを見ながら連載の全体像を紹介します。

()

やさしいデータ分析:

データ分析の初歩から学んでいく連載の第16回(最終回)。分析に適した形にデータを入力/変換する方法を、Excelを使って手を動かしながら学んでいきましょう。スタック形式のレコードをアンスタック形式に変換する方法、CVSファイルやWebページからデータを読み込む方法などについて解説します。

()

やさしいデータ分析:

データ分析の初歩からステップアップしながら学んでいく連載の第15回。複数の説明変数を基に目的変数の値を予測する重回帰分析について、Excelを使って手を動かしながら学んでいきましょう。カテゴリーなどの数値ではないデータを説明変数として利用する方法や、二次関数などの多項式を基に回帰分析する方法も紹介します。

()

やさしいデータ分析:

データ分析の初歩からステップアップしながら学んでいく連載の第14回。既知のデータから未知の値を「予測」する回帰分析の式の可視化や、求め方、実際の予測を、Excelを使って手を動かしながら学んでいきましょう。直線の式だけでなく指数関数の式での予測や時系列分析についても触れます。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第13回。変数同士の関係の強さを表す相関係数の計算内容を仕組みから理解します。Excelを使って手を動かしながら、相関係数の意味や求め方、落とし穴などについて学んでいきましょう。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第12回。グラフを利用して項目同士の関係や、その中での値の大きさを可視化します。散布図やバブルチャートの詳細な取り扱いと視覚的な分析について、ケーススタディを通して学びましょう。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第11回。グラフを利用して分布や項目同士の関係を多角的に可視化します。ピボットテーブルの詳細な取り扱いとヒートマップによる視覚的な分析について、ケーススタディを通して学びましょう。

()

やさしいデータ分析:

データ分析を初歩から学ぶ連載の第10回。グラフを使って集団の特徴や外れ値を可視化します。ヒストグラムや箱ひげ図の作成方法と、ピボットテーブル/ピボットグラフによる視覚的な分析のコツを、ケーススタディを通して学びましょう。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第9回。グラフを利用して「重要度」を可視化する方法と、それに関連するさまざまな考え方を追いかけます。具体的には円グラフやパレート図、積み上げ棒グラフなどを使いますが、データの取り扱い、結果の見方などに関して、考慮すべき点や見落としがちな点について、ケーススタディーを通して見ていきます。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第8回。グラフを利用して時間的な変化を可視化する方法と、それに関連するさまざまな考え方を追いかけます。具体的には折れ線グラフを使いますが、データの取り扱い、結果の見方などに関して、考慮すべき点や見落としがちな点について見ていきます。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第7回。グラフを利用して規模や効果の差、つまり大きさの差を可視化する方法や、考え方などについて説明します。具体的には棒グラフを使いますが、慣れ親しんだ棒グラフでも、作成時の準備や意外な落とし穴など、改めて考慮すべき点がたくさんあります。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の特別予告編。次回から数回に分けてグラフを利用した可視化の方法を見ていきます。それに先だって、今回は可視化の目的と手法を概観します。「何を見たい」→「どのグラフを使うのか」→「何がうれしいのか」という流れをひととおり確認し、次回以降のお話にスムーズに入れるようにします。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第6回。集団の中での位置をパーセント単位で求めたり、偏差値を求めたりする方法と、その考え方を説明します。偏差値は大学や高校のランク付けによく使われていますが、序列を付けるためのものではなく、異なる分布の集団の間でも位置が比較できるとても便利な値です。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第5回。分布のばらつきの度合いを表す値として散布度を取り上げ、尺度や分布によって適切な散布度を利用する必要があることを説明します。順序尺度の散布度として使われる四分位範囲と、名義尺度の散布度として使われる平均情報量のお話です。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第4回。分布のばらつきの度合いを表す値として散布度を取り上げ、尺度や分布によって適切な散布度を利用する必要があることを説明します。今回は間隔尺度・比率尺度の散布度として使われる分散/標準偏差のお話です。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第3回。分布の中心的な位置を表す値として代表値を取り上げ、尺度や分布によって適切な代表値を利用する必要があることを説明します。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第2回。データ分析の流れを概観した後、取り扱うデータの種類について見ていきます。また、オープンデータを利用した簡単なデータ分析についても紹介します。

()

やさしいデータ分析:

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載のスタート。今回は、なぜデータ分析の重要性が高まっているか、ビジネスに生かすために何を学ぶべきかを概観した後、連載の全体像を紹介します。

()

数学×Pythonプログラミング入門:

データ分析において最もよく使われる表形式のデータを取り扱う方法を見ていく。まず、pandasデータフレームの基本的な取り扱い方法を確認し、次に、各種の基本統計量を求める。また、基本統計量の可視化を行い、データの「見方」についても触れる。最後に、scikit-learnを使った回帰と分類の簡単な例を紹介する。

()

数学×Pythonプログラミング入門:

三角関数の基本を確認し、Pythonでプログラミングしてみよう。練習問題では、三角関数を使ってサウンドを作成したり、サウンドデータを読み込んで波形を表示したりするための初歩的なプログラムを作成する。また、サウンドを分析するために使われる離散フーリエ変換の利用についても発展的な話題として簡単に触れる。

()

数学×Pythonプログラミング入門:

AI/機械学習で使われるデータを表現するためにはベクトルや行列などの線形代数を理解することが必要不可欠。今回は行列式と固有値/固有ベクトルの求め方、さらに、それらの応用について、プログラミングの方法を初歩から見ていく。

()

AI・機械学習の数学入門:

連載の通常の流れとは別の番外編。前回の行列式に続いて、今回は固有値と固有ベクトルについて、ポイントを押さえて見ていく。名付けて「挫折しない固有値・固有ベクトル」というお話(にするつもり)。統計学や機械学習のさまざまな手法の背景にあるこれらの考え方に触れてみよう。

()

AI・機械学習の数学入門:

連載の通常の流れとは別の番外編。ベクトルや行列の四則演算から内積あたりまでは比較的スムーズに理解できるのだが、突如、行列式や固有値、固有ベクトルといった謎キャラが登場して挫折してしまう、というのはありがちな話。統計学や機械学習のさまざまな手法の背景にあるこれらの考え方を見ていきたい。

()

数学×Pythonプログラミング入門:

AI/機械学習で使われるデータを表現するためにはベクトルや行列などの線形代数を理解することが必要不可欠。今回は行列の内積の計算方法とその応用について、プログラミングの方法を初歩から見ていく。

()

数学×Pythonプログラミング入門:

AI・機械学習で使われるデータを表現するためにはベクトルや行列などの線形代数を理解することが必要不可欠。今回は行列の各種計算や行、列の抽出、形状の変更方法などについて、プログラミングの方法を初歩から見ていく。

()

数学×Pythonプログラミング入門:

AI/機械学習で使われるデータを表現するためにはベクトルや行列などの線形代数を理解することが必要不可欠。今回はベクトルを中心に、その考え方や各種計算のプログラミング方法を初歩から見ていく。

()

数学×Pythonプログラミング入門:

再帰に対して多くの人が持つであろう苦手意識を払拭(ふっしょく)するために、再帰の基本から、その考え方とプログラミングの方法を見ていく。動的計画法を利用した最小コストの計算法などについても紹介する。

()

数学×Pythonプログラミング入門:

積分法に関する数値計算のプログラミングの方法を見ていく。最初に台形公式やシンプソンの公式を使った方法を紹介し、次に乱数を使ったモンテカルロ法による近似方法を見る。

()

数学×Pythonプログラミング入門:

微分法に関する数値計算のプログラミング方法を見ていく。最初に定義通りに計算する方法を、次に微分方程式を簡単に数値計算する方法を紹介。最後に、ルンゲ・クッタ法と呼ばれる精度のよい近似方法を見る。

()
ページトップに戻る