標準偏差とは?求め方・公式・分散との違いを初心者向けにわかりやすく解説

【PR】この記事には広告を含みます。
標準偏差とは何かを初心者向けに説明した画像

標準偏差とは、データのばらつきがどれくらい大きいかを表す数値です。

かんたんに言うと、数字が平均の近くに集まっているのか、それとも広く散らばっているのかを見るためのものです。

この記事では、標準偏差の意味、求め方、公式、分散との違い、Excelでの出し方を初心者向けにわかりやすく解説します。

ここだけ読めばOK

標準偏差とは、データのばらつきの大きさを表す数値です。

標準偏差が小さいほど、数字は平均の近くにまとまっています。

標準偏差が大きいほど、数字は平均から広く散らばっています。

関連するIT用語をまとめて確認したい方は、IT用語一覧もあわせてご覧ください。

目次

標準偏差とは

かんたんに言うと「ばらつきの大きさ」を表す数値

標準偏差とは、データが平均からどれくらい離れているかを表す数値です。

ここでいうデータとは、テストの点数、売上、気温、作業時間など、比べたい数字のことです。

ばらつきとは、数字がどれくらいそろっていないかという意味です。

たとえば、点数が「78点、79点、80点」のように近い場合は、ばらつきが小さいです。

反対に、「40点、80点、120点」のように大きく離れている場合は、ばらつきが大きいです。

標準偏差が小さいとデータはまとまっている

標準偏差が小さい場合、データは平均の近くに集まっています。

たとえば、5人の点数が「78点、79点、80点、81点、82点」なら、点数はかなり近いです。

このような場合は、標準偏差が小さくなります。

標準偏差が大きいとデータはばらついている

標準偏差が大きい場合、データは平均から大きく離れているものが多いです。

たとえば、5人の点数が「40点、60点、80点、100点、120点」のように広く散らばっている場合です。

このような場合は、標準偏差が大きくなります。

標準偏差を身近な例で考える

標準偏差は、テストの点数で考えると分かりやすいです。

次の図では、平均点が同じでも、点数の広がり方が違う例を示しています。

標準偏差とはデータのばらつきの大きさを表す数値であることを示す図

同じ平均点でも点数のばらつきは違う

たとえば、次の2つのクラスがあるとします。

クラス点数の例平均点特徴
A組78点、79点、80点、81点、82点80点点数がまとまっている
B組40点、60点、80点、100点、120点80点点数がばらついている

どちらも平均点は80点です。

しかし、A組は点数が平均の近くに集まっています。B組は点数が大きく散らばっています。

平均だけでは分からないことがある

平均とは、いくつかの数を全部足して、数の個数で割ったものです。

平均はとても便利ですが、平均だけではデータの広がりまでは分かりません。

同じ平均でも、数字がそろっている場合と、数字が大きく散らばっている場合があります。

標準偏差を見るとデータの広がりが分かる

標準偏差を見ると、平均だけでは見えない「データの広がり」が分かります。

IT分野でも、標準偏差はデータのばらつきを見るときに使われます。

たとえば、売上データ、アンケート結果、作業時間、アクセス数などを比べるときに役立ちます。

たとえると

平均は「クラス全体のだいたいの点数」です。

標準偏差は「その点数がどれくらい散らばっているか」を見るものです。

ITやデータ分析では、この考え方を使って数字の安定度や広がりを見ます。

標準偏差で何がわかるのか

データが平均の近くに集まっているか分かる

標準偏差を見ると、データが平均の近くに集まっているかが分かります。

標準偏差が小さい場合、データは平均の近くに多くあります。

結果が安定しているかを見るときに便利です。

平均との差が大きいデータが多いか分かる

標準偏差が大きい場合、平均から離れたデータが多いと考えられます。

たとえば、同じ平均売上でも、毎日ほぼ同じ売上なのか、日によって大きく違うのかが分かります。

このように、平均だけでは見えない違いをつかめます。

結果の安定度を見やすくなる

標準偏差は、結果が安定しているかを見るときにも使えます。

たとえば、ある作業にかかる時間が毎回ほぼ同じなら、標準偏差は小さくなります。

反対に、ある日は短く、ある日は長い場合は、標準偏差が大きくなります。

標準偏差の求め方

標準偏差は、いくつかの手順で求められます。

次の図では、データ「2、4、6、8、10」を使って、計算の流れを示しています。

標準偏差の求め方を平均、平均との差、二乗、分散、平方根の流れで示す図

ここでは、同じ例を使って、1つずつ見ていきます。

データ2、4、6、8、10

手順1:平均を求める

まず、すべてのデータを足します。

2 + 4 + 6 + 8 + 10 = 30 です。

データは5個あるので、30を5で割ります。

30 ÷ 5 = 6 です。平均は6です。

手順2:それぞれのデータと平均の差を求める

次に、それぞれのデータが平均からどれくらい離れているかを見ます。

データ平均との差
22 – 6 = -4
44 – 6 = -2
66 – 6 = 0
88 – 6 = 2
1010 – 6 = 4

この平均との差のことを「偏差」といいます。

偏差とは、平均からどれくらい離れているかを表す差のことです。

手順3:差を二乗する

次に、平均との差を二乗します。

二乗とは、同じ数を2回かけることです。

たとえば、4の二乗は4 × 4 = 16です。

平均との差二乗した値
-416
-24
00
24
416

二乗するのは、マイナスの値をそのまま足すと打ち消し合ってしまうためです。

二乗すると、マイナスの差もプラスの値として扱えます。

手順4:二乗した値の平均を求める

二乗した値をすべて足します。

16 + 4 + 0 + 4 + 16 = 40 です。

データは5個なので、40を5で割ります。

40 ÷ 5 = 8 です。

この8が「分散」です。

分散は、標準偏差を求める途中で出てくる数値です。

手順5:最後に平方根を求める

最後に、分散の平方根を求めます。

平方根とは、二乗する前の数を求めることです。

たとえば、3を二乗すると9になります。このとき、9の平方根は3です。

今回の例では、分散は8でした。

標準偏差 = √8 ≒ 2.83

つまり、このデータの標準偏差は約2.83です。

標準偏差が約2.83ということは、データが平均の6から、だいたい2.83くらいの幅でばらついていると考えられます。

一言でいうと

標準偏差の求め方は、平均との差を出し、その差を二乗し、平均を出し、最後に平方根を求める流れです。

計算が苦手な方は、まず「平均からどれくらい離れているかを見る」と考えると理解しやすくなります。

標準偏差の公式

標準偏差の基本公式

標準偏差の公式は、次のように表せます。

初心者の方は、最初からむずかしい数式を暗記しなくても大丈夫です。

標準偏差(σ)= √分散

分散とは、平均との差を二乗して平均したものです。

標準偏差は、その分散の平方根です。

つまり、分散をもとにして、元のデータと比べやすい形にしたものが標準偏差です。

公式の中に出てくる記号の意味

標準偏差の説明では、いくつかの記号が出てくることがあります。

記号意味
xそれぞれのデータ
平均データを足して個数で割った値
σ標準偏差を表す記号
平方根を表す記号

記号が出てくると難しく見えますが、考え方は同じです。

標準偏差は、平均からのばらつきをまとめた数値です。

標準偏差の記号はσやSDで表される

標準偏差の記号には、σやSDが使われます。

σは「シグマ」と読みます。

SDは「Standard Deviation」の略です。英語で標準偏差という意味です。

標準偏差と分散の違い

分散とは平均との差を二乗して平均したもの

分散とは、データが平均からどれくらい離れているかを見るための数値です。

平均との差を二乗し、その平均を求めます。

標準偏差を求める前の途中の数値だと考えると分かりやすいです。

標準偏差は分散の平方根

標準偏差は、分散の平方根です。

平方根を求めることで、元のデータと比べやすい形に戻します。

項目意味特徴
分散平均との差を二乗して平均したもの標準偏差を出す途中で使う
標準偏差分散の平方根元のデータと比べやすい

標準偏差の方が元のデータと同じ単位で見やすい

分散は、平均との差を二乗しているため、単位も二乗になります。

たとえば、点数のデータなら、分散の単位は「点の二乗」のような形になります。

そのままだと少し見にくいため、平方根を求めて標準偏差にします。

標準偏差は元のデータと同じ単位で見られます。

標準偏差の単位

標準偏差の単位は元のデータと同じ

標準偏差の単位は、元のデータと同じです。

点数の標準偏差なら単位は「点」です。

時間の標準偏差なら単位は「秒」や「分」です。

分散の単位は二乗になる

分散は、平均との差を二乗して求めます。

そのため、単位も二乗になります。

初心者には少し分かりにくいため、データを見るときは標準偏差の方が使いやすいことが多いです。

単位で迷ったら標準偏差を見ると分かりやすい

データのばらつきを実感として見たいときは、標準偏差を見ると分かりやすいです。

たとえば、平均点が70点で標準偏差が5点なら、点数のばらつきは「点」で考えられます。

元のデータと同じ単位なので、意味をつかみやすくなります。

標準偏差が大きい・小さいとはどういう意味か

標準偏差が小さい場合

標準偏差が小さい場合、データは平均の近くにまとまっています。

たとえば、商品の売上が毎日ほぼ同じなら、標準偏差は小さくなります。

結果に大きな差が出にくい状態です。

標準偏差が大きい場合

標準偏差が大きい場合、データは大きくばらついています。

たとえば、ある日は売上が高く、別の日はかなり低い場合です。

結果に差が出やすい状態といえます。

標準偏差が0になる場合

標準偏差が0になることもあります。

すべてのデータが同じ値のとき、平均との差がすべて0になります。

たとえば「10、10、10、10」のようなデータです。

この場合、ばらつきがないため標準偏差は0です。

標準偏差にマイナスはない

標準偏差はマイナスにはなりません。

平均との差を二乗し、最後に平方根を求めるためです。

標準偏差は、0以上の数になります。

標準偏差をExcelで求める方法

標準偏差は、Excelを使うとかんたんに計算できます。

次の図では、STDEV.S関数を使って標準偏差を出す流れを示しています。

ExcelでSTDEV.S関数を使って標準偏差を求める方法を示す図

ExcelではSTDEV.S関数を使う

Excelで標準偏差を求める場合は、STDEV.S関数を使うことが多いです。

関数とは、Excelで計算をかんたんに行うための命令のようなものです。

たとえば、A1からA5にデータがある場合は、次のように入力します。

=STDEV.S(A1:A5)

これで、A1からA5までのデータの標準偏差を求められます。

初心者の方は、まずSTDEV.Sを使うと考えると分かりやすいです。

全体のデータならSTDEV.P関数を使う

Excelには、STDEV.P関数もあります。

STDEV.Pは、手元にあるデータが調べたい全体そのものの場合に使います。

たとえば、5人だけの小さなグループ全員の点数を調べる場合などです。

=STDEV.P(A1:A5)

STDEV.SとSTDEV.Pの違いは、最初から深く理解しなくても大丈夫です。

迷ったときは、何を調べたいのかに合わせて使い分けます。

Excelで標準偏差を出すときの注意点

Excelで標準偏差を出すときは、空白や文字が混ざっていないかを確認します。

また、データの範囲を正しく選ぶことも大切です。

範囲がずれると、求めたい標準偏差と違う結果になることがあります。

標準偏差と正規分布の関係

標準偏差は、正規分布という考え方と一緒に使われることがあります。

正規分布は少し難しく見えますが、まずは「平均の近くに多くのデータが集まる形」と考えると分かりやすいです。

標準偏差と正規分布の関係を1σ、2σ、3σの範囲で示す図

正規分布とは山のような形でデータが集まる考え方

正規分布とは、多くのデータが平均の近くに集まり、平均から離れるほど少なくなる形のことです。

グラフにすると、中央が高く、左右にゆるやかに広がる山のような形になります。

テストの点数、身長、測定値などで使われることがあります。

1σ・2σ・3σの意味

標準偏差は、σという記号で表されることがあります。

σは「シグマ」と読みます。

1σは、平均から標準偏差1つ分だけ離れた範囲です。

2σは標準偏差2つ分、3σは標準偏差3つ分の範囲を表します。

表し方意味その範囲に入るデータの目安
平均から標準偏差1つ分の範囲約68%
平均から標準偏差2つ分の範囲約95%
平均から標準偏差3つ分の範囲約99.7%

たとえば、テストの点数が山型に分布している場合で考えてみます。

平均点が70点、標準偏差が10点なら、1σの範囲は「60点から80点くらい」です。

この範囲に、全体の約68%の人が入ると考えられます。

2σなら「50点から90点くらい」で、全体の約95%が入る目安です。

3σなら「40点から100点くらい」で、全体の約99.7%が入る目安です。

ただし、この割合はデータが正規分布に近い場合の目安です。

すべてのデータで必ずこの割合になるわけではありません。

まずは「平均からどれくらい離れているか」と考える

正規分布や1σ・2σ・3σは、最初は難しく感じるかもしれません。

まずは「平均からどれくらい離れているかを見るために標準偏差を使う」と考えると理解しやすくなります。

1σ・2σ・3σは、平均からの離れ具合を段階的に見るための目安です。

標準偏差と偏差値の違い

標準偏差はばらつきの大きさ

標準偏差は、データ全体のばらつきを表します。

ひとりの点数ではなく、集団全体の点数がどれくらい広がっているかを見る数値です。

偏差値は自分の位置を見やすくした数値

偏差値は、集団の中で自分がどのあたりにいるかを見やすくした数値です。

標準偏差を使って計算されます。

つまり、標準偏差は偏差値を考えるときの土台になる数値です。

テストの点数で考えると違いが分かりやすい

テストで考えると、標準偏差はクラス全体の点数のばらつきです。

偏差値は、その中で自分の点数がどの位置にあるかを表します。

用語見るもの
標準偏差データ全体のばらつき
偏差値集団の中での自分の位置

初心者が間違えやすい点

平均だけでデータを判断してしまう

平均は便利ですが、平均だけではデータの広がりまでは分かりません。

同じ平均でも、データがまとまっている場合と、大きくばらついている場合があります。

その違いを見るために標準偏差を使います。

分散と標準偏差を同じものだと思ってしまう

分散と標準偏差は似ていますが、同じではありません。

分散は標準偏差を求める途中で使う数値です。

標準偏差は分散の平方根です。

標準偏差が大きいほど良いと考えてしまう

標準偏差は、大きいほど良いというものではありません。

標準偏差が大きいということは、データのばらつきが大きいという意味です。

良いか悪いかは、何のデータを見るかによって変わります。

標準偏差にマイナスがあると思ってしまう

標準偏差にマイナスはありません。

標準偏差は、データのばらつきの大きさを表します。

そのため、0以上の数になります。

標準偏差とは?よくある質問

標準偏差は何がわかるものですか?

標準偏差を見ると、データのばらつきが分かります。

標準偏差が小さいほどデータはまとまり、標準偏差が大きいほどデータは広く散らばっています。

標準偏差の求め方を簡単に言うと何ですか?

平均を求め、それぞれのデータと平均の差を出します。

その差を二乗して平均し、最後に平方根を求めます。

標準偏差と分散の違いは何ですか?

分散は、平均との差を二乗して平均したものです。

標準偏差は、その分散の平方根です。

標準偏差の方が元のデータと比べやすいです。

標準偏差が大きいほど何を意味しますか?

標準偏差が大きいほど、データのばらつきが大きいことを意味します。

平均から大きく離れたデータが多いと考えられます。

標準偏差が0になることはありますか?

あります。

すべてのデータが同じ値の場合、ばらつきがないため標準偏差は0になります。

標準偏差にマイナスはありますか?

標準偏差にマイナスはありません。

標準偏差は、0以上の数になります。

標準偏差と偏差値の違いは何ですか?

標準偏差は、データ全体のばらつきを表します。

偏差値は、その集団の中で自分がどの位置にいるかを見やすくした数値です。

標準偏差はExcelで求められますか?

はい、求められます。

Excelでは、STDEV.S関数やSTDEV.P関数を使うと標準偏差を計算できます。

初心者の方は、まずSTDEV.Sを使う場面が多いと考えると分かりやすいです。

1σ・2σ・3σとは何ですか?

1σ・2σ・3σは、平均から標準偏差何個分だけ離れているかを表す言い方です。

正規分布に近いデータでは、1σに約68%、2σに約95%、3σに約99.7%のデータが入る目安があります。

まとめ:標準偏差とはデータのばらつきを見るための数値

標準偏差とは、データのばらつきの大きさを表す数値です。

平均や中央値だけでは、データがまとまっているのか、広く散らばっているのかまでは分かりません。

標準偏差を見ることで、平均からどれくらい離れているデータが多いのかを確認できます。データの関係を見るときは、散布図も使われます。

  • 標準偏差が小さいと、データは平均の近くにまとまっている
  • 標準偏差が大きいと、データは広くばらついている
  • 標準偏差は、分散の平方根で求められる
  • 標準偏差の単位は、元のデータと同じ
  • Excelでは、STDEV.S関数やSTDEV.P関数で求められる
  • 正規分布に近いデータでは、1σ・2σ・3σの目安も使われる

標準偏差は、平均や最頻値だけでは見えにくい、データの違いや広がりを見やすくするための考え方です。

まずは「平均からどれくらい離れているかを見る数値」と考えると、理解しやすくなります。

よかったらシェアしてね!
  • URLをコピーしました!
目次