
データ分散では、分散指数が非常に重要な役割を果たします。 これらの測定値は、データの変動性を特徴付けることによって、いわゆる中心位置の測定値を補完します。
の 分散指数 中心的な傾向を補完します。これらはデータ配布にも不可欠です。これは、それらがその変動性を特徴付けるためです。統計トレーニングにおけるそれらの関連性は、Wild と Pfannkuch (1999) によって強調されました。
データの変動性の認識は、平均に対するデータの分散に関する情報を提供するため、統計的思考の基本的な要素の 1 つです。
平均値の解釈
の 算術平均 実際には広く使用されていますが、誤解されることもよくあります。これは、変数値が非常にまばらな場合に発生します。このような場合には、平均分散指数 (2) を添付する必要があります。
分散指数には、ランダム変動に関連する 3 つの重要な要素があります。 (2):
- 私たちの周りの世界にそれが遍在しているという認識。
- その解説を競うコンテスト。
- それを定量化する能力 (分散の概念を理解し、適用する方法を知っていることを意味します)。

分散指数は何に使用されますか?
母集団のサンプルのデータを一般化する必要がある場合 分散指数は、扱う誤差に直接影響するため、非常に重要です。 。サンプル内で収集する散乱が多くなるほど、同じ誤差を処理するために必要なサイズが大きくなります。
一方、これらのインデックスは、データが中心値から離れているかどうかを判断するのに役立ちます。彼らは、この中心値が研究対象集団を表すのに適切かどうかを教えてくれます。これは、分布を比較するのに非常に役立ちます。 理解する 意思決定プロセスにおけるリスク (1)。
これらの比率は、分布を比較し、意思決定におけるリスクを理解するのに非常に役立ちます。 分散が大きいほど、中心値の代表性が低くなります .
最もよく使用されるものは次のとおりです。
- 範囲。
- 統計的偏差 .
- 分散。
- 標準偏差または典型偏差。
- 変動係数。
分散指数の関数
範囲
ランクは主な比較のために使用されます。このようにして、2 つの極端な観察のみが考慮されます。 。このため、小規模なサンプルに対してのみ推奨されます (1)。これは、変数の最後の値と最初の値 (3) の差として定義されます。

統計的偏差
平均偏差は、全員が算術平均から同じ距離にある場合にデータがどこに集中するかを示します (1)。変数値の偏差は、その変数値と系列の算術平均の間の絶対値の差であると考えられます。したがって、これは偏差の算術平均とみなされます (3)。
分散
分散はすべての値の代数関数です 推論統計タスクに適しています (1)。これは二次偏差 (3) として定義できます。
標準偏差または典型偏差
同じ母集団から採取されたサンプルの場合、標準偏差は最もよく使用されるものの 1 つです (1)。それは分散 (3) の平方根です。
変動係数
これは主に、異なる単位で測定された 2 つのデータセット間の変化を比較するために使用される尺度です。 そして。例えば 身長と体重 サンプル内の生徒の体。これは、どの分布でデータが最も集中しており、平均が最も代表的であるかを判断するために使用されます (1)。

変動係数は抽象的な数値であるため、これまでの分散係数よりも代表的な分散指標となります。言い換えると それは独立しています 変数値が表示される単位によって異なります。一般に、この変動係数はパーセンテージ (3) で表されます。
分散指数に関する結論
インデックス 分散度は、一方ではサンプル内のばらつきの程度を示します。一方、中心値の代表性は 低い値が得られた場合、それは値がその中心の周りに集中していることを意味するためです。これは、データの変動がほとんどなく、中心がすべてをよく表していることを意味します。
逆に高い値が得られた場合は、値が集中しておらず、分散していることを意味します。これは、ばらつきが大きく、中心があまり代表的ではないことを意味します。一方、推論を行う場合、必要に応じてより大きなサンプルが必要になります。 エラーを減らす まさに変動性の増加により増加しました。