それが何を提供するのか、それがどのように撮影されるのか、そして例のクラスマーク
の クラスブランド, ミドルポイントとも呼ばれる、クラスの中心にある値であり、そのカテゴリに含まれるすべての値を表します。基本的に、クラスマークは算術平均や標準偏差などの特定のパラメータの計算に使用されます。.
その場合、クラスマークは任意の区間の中間点です。この値は、すでにクラスにグループ化されている一連のデータの分散を見つけるためにも非常に役立ちます。これにより、これらの決定されたデータが中心からどれだけ離れているかを理解できます。.
索引
- 1度数分布
- 1.1考慮すべきクラスの数?
- 2どうしますか?
- 2.1例
- 3それは何のためですか??
- 3.1例
- 4参考文献
頻度分布
クラスのブランドが何であるかを理解するためには、頻度分布の概念が必要です。データセットを考えると、度数分布はそのようなデータをクラスと呼ばれるいくつかのカテゴリに分割するテーブルです。.
この表は、各クラスに属する要素の数を示しています。後者は周波数として知られています.
この表では、データから取得した情報の一部が犠牲にされています。これは、各要素の個々の値を取得するのではなく、それが上記のクラスに属することだけを知っているためです.
他方、このようにして確立されたパターンを理解することはより容易であり、それは前記データの操作を容易にするので、我々はデータセットのより良い理解を得る。.
考慮すべきクラス数?
頻度分布を作成するには、まず受講したいクラスの数を決定し、それらのクラス制限を選択します。.
少数のクラスは学習したいデータに関する情報を隠すことができ、非常に多数のクラスは必ずしも有用ではない多くの詳細を生成する可能性があることを考慮すると、取るクラス数の選択は便利です。.
受講するクラスの数を選択する際に考慮する必要がある要因はいくつかありますが、これら2つの間で際立っています。最初に考慮する必要があるデータの量を考慮します。 2つ目は、分布の範囲がどのサイズであるかを知ることです(つまり、最大観測値と最小観測値の差)。.
クラスを定義した後、各クラスに存在するデータ量を数えます。この数はクラス頻度と呼ばれ、fiで表されます。.
前述したように、頻度分布では各データまたは観測値から個別に取得された情報が失われます。したがって、値が属するクラス全体を表す値が求められます。この値はクラスのブランドです.
どうやって得ますか?
クラスマークは、クラスが表す中心的な値です。これは、間隔の制限を加算し、この値を2で割ることによって得られます。これは、数学的には次のように表現できます。
×私は=(下限値+上限値)/ 2.
この式ではx私は i番目のクラスのマークを表します.
例
次のデータセットを与えられて、代表的な度数分布を与えて、対応するクラスマークを得てください.
最も高い数値のデータは391、最も小さいデータは221であるため、範囲は391 -221 = 170となります。.
5つのクラスを選びます。すべて同じサイズです。クラスを選択する1つの方法は以下のとおりです。
各データはクラス内にあり、それらは互いに素であり、同じ値を持つことに注意してください。クラスを選択するもう1つの方法は、データを連続変数の一部と見なすことです。これは、実際の値に達する可能性があります。この場合、以下の形式のクラスを考えることができます。
205-245、245-285、285-325、325-365、365-405
ただし、この方法でデータをグループ化すると、ボーダーとあいまいな点があります。例えば、245の場合、どのクラスに属しているのか、最初のクラスと2番目のクラスのどちらに属しているのでしょうか。?
これらの混乱を避けるために、極端な点の慣例が作られています。このように、最初のクラスは間隔(205,245)、2番目(245,285)というようになります。.
クラスが定義されたら、頻度の計算に進みます。次の表があります。
データの頻度分布を取得した後、各区間のクラスマークを見つけます。実際には、次のことが必要です。
×1=(205 + 245)/ 2 = 225
×2=(245 + 285)/ 2 = 265
×3=(285 + 325)/ 2 = 305
×4=(325 + 365)/ 2 = 345
×5=(365+ 405)/ 2 = 385
これを次の図で表すことができます。
それは何のためですか??
前述のように、クラスマークは、すでに異なるクラスに分類されているデータグループの算術平均と分散を見つけるのに非常に機能的です。.
算術平均は、サンプルサイズ間で得られた観測値の合計として定義できます。物理的な観点からは、その解釈はデータセットの均衡点のようなものです。.
データ全体を単一の数値で識別するのは危険な場合があるため、この平衡点と実際のデータとの違いも考慮する必要があります。これらの値は算術平均からの偏差として知られており、これらを使用して、データの算術平均がどの程度変動するかを判断しようとしています。.
この値を見つける最も一般的な方法は、分散によるものです。これは、算術平均からの偏差の2乗の平均です。.
クラスにグループ化されたデータセットの算術平均と分散を計算するために、それぞれ次の公式を使用します。
これらの式ではx私は 第iクラスのブランド、f私は 対応する頻度を表し、kはデータがグループ化されたクラスの数を表します.
例
前の例のデータを使用して、頻度分布表のデータをもう少し拡張することができます。次のようになります。
それで、式の中のデータを置き換えるとき、算術平均は次のようになります。
その分散と標準偏差は次のとおりです。
これから元のデータは306.6の算術平均と39.56の標準偏差を持つと結論づけることができます。.
参考文献
- フェルナンデスF.サンティアゴ、コルドバL.アレハンドロ、コーデロS.ホセM.記述統計。エシック編集.
- Jhonson Richard A.MillerとFreundの確率とエンジニアの政治家。Pearson教育.
- Miller I&Freund J.エンジニアの確率と政治家。元に戻す.
- サラビアA.ホセマリア、パスカルマルタ。企業向け統計基礎コース
- LlinásS. Humberto、Rojas A. Carlos記述統計学および確率分布。Universidad del Norte社説