定規の説明、応用および例



スタージスルール 統計データのセットをグラフィカルに表すために必要なクラスまたは区間の数を決定するために使用される基準です。この規則は、1926年にドイツの数学者Herbert Sturgesによって発表されました。.

スタージスは、クラスの数とその範囲の振幅を見つけることができるサンプル数xに基づいて、簡単な方法を提案しました。 Sturgesルールは、特に統計の分野で、特に頻度ヒストグラムを作成するために広く使用されています。.

索引

  • 1説明
  • 2アプリケーション
  • 3例
  • 4参考文献

説明

Sturgesルールは、標本または母集団を表す一連のデータを分類するために、頻度ヒストグラムに存在しなければならないクラスの数を決定するために記述統計学で広く使用されている経験的方法です。.

基本的に、この規則はグラフィックコンテナの幅、頻度ヒストグラムを決定します。.

彼の規則を確立するために、Herbert SturgesはK個の区間からなる理想的な周波数図を考えました。ここで、i番目の区間は、次のように表されます。

そのサンプル数は、セットのサブセットを抽出できる方法の数によって決まります。つまり、二項係数によって、次のように表されます。

式を簡単にするために、彼は方程式の両方の部分に対数の性質を適用しました。

したがって、Sturgesは、最適な間隔数kが次の式で与えられることを証明しました。

次のように表現することもできます。

この表現では:

- kはクラス数.

- Nは標本の観測値の総数です.

- 対数は10を底とする常用対数です。.

たとえば、142人の子供の身長の無作為標本を表す頻度ヒストグラムを作成するには、分布の間隔またはクラスの数は次のようになります。

k = 1 + 3,322 * 丸太10年 (N)

k = 1 + 3,322* ログ(142)

k = 1 + 3,322* 2,1523

k = 8.14≈8

したがって、分布は8間隔になります.

間隔の数は常に整数で表す必要があります。値が10進数の場合は、最も近い整数に近似する必要があります。.

アプリケーション

Sturgesの法則は主に統計学に適用されます、なぜならそれはクラスの数(k)と、これらのそれぞれの長さ(振幅としても知られている)の計算を通して頻度の分布を作ることを許す.

振幅は、クラスの上限と下限の差をクラス数で割ったもので、次のように表されます。

度数分布を作成することを可能にする多くの経験的規則があります。ただし、Sturgesルールは、一般に5〜15の範囲のクラス数に近いため、一般的に使用されています。.

このように、標本または母集団を適切に表す値を検討します。つまり、近似は極端なグループ化を表すものではなく、サンプルの要約を許可しないクラスの数が多すぎる場合も機能しません。.

地元のジムでエクササイズをしている男性の調査で得られた年齢に対応する、与えられたデータに従って頻度ヒストグラムを実行する必要があります。.

間隔を決定するには、標本のサイズや観測数を知っておく必要があります。この場合は、30.

次に、Sturgesの規則が適用されます。

k = 1 + 3,322 * 丸太10年 (N)

k = 1 + 3,322* ログ(30)

k = 1 + 3,322* 1,4771

k = 5.90≈6間隔.

間隔の数から、これらが持つ振幅を計算することができます。つまり、度数ヒストグラムで表される各バーの幅です。

下限はデータの最小値と見なされ、上限は最大値と見なされます。上限と下限の差は、変数の範囲またはパスと呼ばれます(R).

表から、上限は46、下限は13です。このようにして、各クラスの振幅は次のようになります。

間隔は上限と下限で構成されます。以下のように、これらの間隔を決定するには、下限からカウントを開始し、それに規則(6)によって決定された振幅を加えます。

次に絶対頻度を計算して、各区間に対応する男性の数を決定します。この場合は、

- インターバル1:13 - 18 = 9

- インターバル2:19 - 24 = 9

- 間隔3:25 - 30 = 5

- インターバル4:31 - 36 = 2

- インターバル5:37 - 42 = 2

- 間隔6:43 - 48 = 3

各クラスの絶対頻度を加算するとき、これはサンプルの総数と等しくなければなりません。この場合、30.

続いて、各区間の相対頻度が計算され、この区間の絶対頻度が観測の総数で割られます。

- 間隔1:fi = 9÷30 = 0.30

- 間隔2:fi = 9÷30 = 0.30

- 間隔3:fi = 5÷30 = 0.1666

- 間隔4:fi = 2÷30 = 0.0666

- 間隔5:fi = 2÷30 = 0.0666

- 区間4:fi = 3÷30 = 0.10

次に、データを反映した表を作成することができます。また、次の図に示すように、取得した間隔に関連した相対頻度からダイアグラムも作成できます。

このように、Sturgesルールでは、表やグラフを作成してデータのサンプルをまとめるために、サンプルを分割できるクラスまたは区間の数を決定できます。.

参考文献

  1. AlfonsoUrquía、M. V.(2013)。離散事象のモデリングとシミュレーション未使用,.
  2. Altman Naomi、M. K.(2015)。 "単純線形回帰"自然法 .
  3. Antúnez、R. J.(2014)。教育における統計デジタルUNID.
  4. Fox、J.(1997)。応用回帰分析、線形モデル、および関連方法SAGE出版物.
  5. HumbertoLlinásSolano、C.R。(2005)。記述統計と確率分布ノース大学.
  6. Panteleeva、O. V.(2005)。確率と統計の基礎.
  7. O. Kuehl、M. O.(2001)。実験計画法設計の統計的原理と研究分析トムソンエディタ.