メニュー
無料で
登録
 /  オオムギ/ 算術平均の計算方法。 記述統計に関連する落とし穴。 異種データの平均を計算する方法

算術平均を計算する方法。 記述統計に関連する落とし穴。 異種データの平均を計算する方法

最も重要なのはeqです。 実際には、単純な加重算術平均として計算できる算術平均を使用する必要があります。

算術平均 (SA)-n最も一般的なタイプの平均。 これは、集団全体のさまざまな特性の量が、その個々のユニットの特性の値の合計である場合に使用されます。 社会現象は、さまざまな特性のボリュームの加算性 (全体性) によって特徴付けられます。これにより、SA の適用範囲が決定され、一般的な指標としての蔓延が説明されます。 たとえば、一般給与基金は全従業員の給与の合計です。

SA を計算するには、すべての特徴値の合計をその数で割る必要があります。 SA は 2 つの形式で使用されます。

まず単純な算術平均について考えてみましょう。

1-CA シンプル (初期、定義形式) は、平均化される特性の個々の値の単純合計を、これらの値の合計数で割ったものと等しくなります (特性のグループ化されていないインデックス値がある場合に使用されます)。

行われた計算は次の式に一般化できます。

(1)

どこ - 変動する特性の平均値、つまり単純な算術平均。

合計を意味します。つまり、個々の特性を追加することです。

バツ- バリアントと呼ばれる、さまざまな特性の個々の値。

n - 人口の単位数

例1、 15 人の作業者がそれぞれ何個の部品を生産したかがわかっている場合、1 人の作業者 (整備士) の平均生産量を見つける必要があります。 一連の ind が与えられると、 属性値、個数: 21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20.

単純な SA は式 (1) を使用して計算されます。個数:

例2。 商社に含まれる20店舗の条件データに基づいてSAを計算してみます(表1)。 表1

商社「Vesna」の店舗の販売面積、平方メートルごとの分布。 M

店番号。

店番号。

平均店舗面積を計算するには ( ) すべての店舗の面積を合計し、その結果を店舗数で割る必要があります。

したがって、この小売企業グループの平均店舗面積は 71 平方メートルです。

したがって、単純な SA を決定するには、特定の属性のすべての値の合計を、この属性を所有するユニットの数で割る必要があります。

2

どこ f 1 , f 2 , … ,f n 重み(同じ符号の繰り返しの頻度)。

– 特徴の大きさとその頻度の積の合計。

– 人口単位の総数。

- SA加重 - と異なる回数繰り返されるオプション、または、よく言われるように、異なる重みを持つオプションの中間。 重みは、母集団の異なるグループ内のユニットの数です (同じオプションが 1 つのグループに結合されます)。 SA加重 グループ化された値の平均 バツ 1 , バツ 2 , .., バツん、 計算された: (2)

どこ バツ- オプション;

f- 周波数(重み)。

加重 SA は、オプションとそれに対応する周波数の積の合計をすべての周波数の合計で割った商です。 周波数 ( f) SA 式に現れるものは、通常、次のように呼ばれます。 天秤その結果、重みを考慮して計算された SA は重み付きと呼ばれます。

前述の例 1 を使用して重み付き SA を計算する手法を説明します。これを行うために、初期データをグループ化し、テーブルに配置します。

グループ化されたデータの平均は、次のように決定されます。まず、オプションに頻度が乗算され、次に積が加算され、結果の合計が頻度の合計で除算されます。

式 (2) によると、重み付けされた SA は次のようになります。

部品生産における作業員の配置

P

前の例 2 で示されたデータは、表に示されている同種のグループに結合できます。 テーブル

販売面積別の Vesna 店舗の分布 (平方メートル) メートル

したがって、結果は同じでした。 ただし、これはすでに加重算術平均値になります。

前の例では、絶対頻度 (店舗数) がわかっている場合に算術平均を計算しました。 ただし、多くの場合、絶対周波数は存在しませんが、相対周波数は既知です。つまり、一般に次のように呼ばれています。 割合を示す周波数、またはセット全体における周波数の割合。

SA加重利用計算時 周波数を使用すると、周波数が大きな複数桁の数値で表される場合に計算を簡素化できます。 同様に計算しますが、平均値は100倍になるので、結果を100で割ります。

この場合、算術加重平均の式は次のようになります。

どこ d- 頻度、つまり すべての周波数の合計における各周波数の割合。

(3)

例 2 では、まず、Vesna 社の総店舗数におけるグループ別の店舗のシェアを決定します。 したがって、最初のグループの比重は 10% に相当します。
。 次のデータが得られます 表3

中のすべての人が 現代世界ローンを組む計画を立てたり、冬に向けて野菜を買いだめしたりするとき、「平均値」という概念に定期的に遭遇します。 それが何であるか、どのようなタイプとクラスが存在するか、そしてなぜそれが統計や他の分野で使用されるのかを調べてみましょう。

平均値 - それは何ですか?

類似名 (SV) は、任意の 1 つの量的変数特性によって決定される、均一な現象のセットの一般化された特性です。

しかし、そのような難解な定義から遠く離れている人々は、この概念を何かの平均的な量として理解します。 たとえば、銀行員はローンを組む前に、潜在的な顧客に年間の平均収入、つまり人が稼ぐ合計金額に関するデータの提供を必ず求めます。 年間全体の収入を合計し、月数で割ることで計算されます。 したがって、銀行は顧客が期日までに借金を返済できるかどうかを判断できます。

なぜ使われるのでしょうか?

原則として、平均値は、集団的な性質の特定の社会現象の概要を説明するために広く使用されています。 上記の例のローンの場合のように、小規模な計算にも使用できます。

ただし、ほとんどの場合、平均値は依然としてグローバルな目的で使用されます。 そのうちの 1 つの例は、1 暦月中に国民が消費する電力量の計算です。 得られたデータに基づいて、さらに確立されます 最高基準国家からの恩恵を享受している人口のカテゴリー向け。

また、平均値を使用して、特定の家電製品、自動車、建物などの保証耐用年数が作成され、このようにして収集されたデータに基づいて、かつては現代の仕事と休憩の基準が作成されました。

事実上あらゆる現象 現代の生活、それは大衆的な性質のものであり、何らかの形で検討中の概念と必然的に結びついています。

応用分野

この現象は、ほぼすべての精密科学、特に実験的な性質のもので広く使用されています。

平均値を見つけることは、医学、工学、料理、経済、政治などにおいて非常に重要です。

このような一般化から得られたデータに基づいて、彼らは治療薬、教育プログラムを開発し、最低生活レベルと賃金を確立し、 トレーニングスケジュール、家具、衣類、靴、衛生用品などを生産しています。

数学では、この用語は「平均値」と呼ばれ、さまざまな例や問題を解くために使用されます。 最も単純なものは、通常の分数による加算と減算です。 結局のところ、ご存知のとおり、このような例を解くには、両方の分数を共通の分母にする必要があります。

精密科学の女王でも、似た意味の「確率変数の平均値」という用語がよく使われます。 これは「数学的期待値」として多くの人によく知られており、確率論で考慮されることがよくあります。 同様の現象が統計計算を実行する場合にも当てはまることに注意してください。

統計における平均値

ただし、研究されている概念は統計で最もよく使用されます。 知られているように、この科学自体は、大衆社会現象の定量的特性の計算と分析に特化しています。 したがって、統計における平均値は、情報の収集と分析という主な目的を達成するための特殊な方法として使用されます。

この統計手法の本質は、考慮中の特性の個々の固有の値を特定のバランスの取れた平均値に置き換えることです。

例としては、有名な食べ物のジョークがあります。 で、ある工場の火曜日のランチは、上司が肉キャセロールを食べて、一般の従業員が食べるのが常なんですが…。 キャベツの煮込み。 これらのデータに基づいて、工場スタッフは平均して火曜日にロールキャベツを食べていると結論付けることができます。

この例は少し誇張されていますが、この検索方法の主な欠点を示しています。 平均サイズ- 物体や人格の個々の特性を平準化する。

平均値では、収集された情報を分析するだけでなく、さらなる行動を計画および予測するためにも使用されます。

また、達成された結果 (たとえば、春夏シーズンの小麦の栽培と収穫の計画の実施) を評価するためにも使用されます。

正しい計算方法

SVの種類によって計算式は異なりますが、 一般理論統計では、原則として、特性の平均値を計算するために 1 つの方法のみが使用されます。 これを行うには、まずすべての現象の値を合計し、次に結果の合計をそれらの数で割る必要があります。

このような計算を行う場合、平均値は常に母集団の個々の単位と同じ次元 (または単位) を持つことを覚えておく価値があります。

正しく計算されるための条件

上で説明した式は非常にシンプルで普遍的なものであるため、間違いを犯すことはほとんどありません。 ただし、常に 2 つの側面を考慮する価値があります。そうしないと、取得されるデータが実際の状況を反映しなくなります。


SVクラス

「平均値とは何ですか?」「どこで使用されますか?」という基本的な質問に対する答えが見つかりました。 「どうやって計算するの?」と疑問に思ったら、どのようなクラスとタイプの SV が存在するのかを調べてみる価値があります。

まず、この現象は2つに分類される。 これらは構造的な平均と電力の平均です。

パワーSVの種類

上記の各クラスはさらにタイプに分類されます。 鎮静クラスは4名です。

  • 算術平均は、SV の最も一般的なタイプです。 これは、データ セット内で考慮されている特性の合計量が、このセットのすべてのユニットに均等に配分されるかを決定する際の平均項です。

    このタイプは、単純な算術 SV と加重算術 SV のサブタイプに分類されます。

  • 調和平均は、考慮中の特性の逆数値から計算される、単純算術平均の逆数である指標です。

    属性や製品の個別の値はわかっているが、頻度データはわかっていない場合に使用されます。

  • 幾何平均は、経済現象の成長率を分析するときに最もよく使用されます。 これにより、特定の量の個々の値の合計ではなく積を変更せずに保存することが可能になります。

    シンプルでバランスのとれたものにすることもできます。

  • 平均 二次量計算に使用される 個別の指標生産リズムを特徴付ける変動係数などの指標。

    また、パイプ、車輪、正方形の平均辺、および同様の図形の平均直径を計算するためにも使用されます。

    他のすべてのタイプの平均と同様に、二乗平均平方根は単純で重み付けできます。

構造量の種類

平均 SV に加えて、構造タイプも統計でよく使用されます。 これらは、さまざまな特性の値の相対的な特性を計算するのに適しています。 内部構造配布行。

このようなタイプは 2 つあります。


分析を目的として、要約とグループ化の結果に基づいて統計的結論を得るために、一般化指標 (平均値と相対値) が計算されます。

平均値の問題 – 統計母集団のすべての単位を 1 つの特性値で特徴付けます。

平均値は品質指標を特徴づけます 起業家活動:物流コスト、利益、収益性など

平均値- これは、さまざまな特性に応じた集団の単位の一般化された特性です。

平均値を使用すると、異なる集団の同じ形質のレベルを比較し、これらの不一致の理由を見つけることができます。

研究中の現象の分析では、平均値の役割は非常に大きくなります。 英国の経済学者 W. ペティ (1623-1687) は平均値を広く使用しました。 V. ペティは、1 人の労働者の平均的な毎日の食費のコストの尺度として平均値を使用したいと考えました。 平均値の安定性は、調査対象のプロセスの規則性を反映しています。 彼は、元のデータが十分でなくても、情報は変換できると信じていました。

英国の科学者 G. キング (1648-1712) は、英国の人口データを分析する際に平均値と相対値を使用しました。

ベルギーの統計学者 A. ケトレ (1796-1874) の理論的発展は、自然界の不一致に基づいています。 社会現象– 塊としては非常に安定していますが、純粋に個別です。

A.ケトレによると 永続的な理由研究対象の各現象に均等に作用し、これらの現象を互いに類似させ、すべての現象に共通のパターンを作成します。

A. ケトレの教えの結果は、統計分析の主な手法として平均値の特定でした。 同氏は、統計的平均は客観的な現実のカテゴリーを表すものではないと述べた。

A. ケトレは、平均的な人間についての理論の中で、平均に関する彼の見解を表明しました。 平均的な人とは、平均的な体格のすべての資質(平均的な死亡率または出生率、平均的な身長と体重、平均的な走る速度、結婚と自殺に対する平均的な傾向、善行に対する平均的な傾向など)を備えた人のことです。 A.ケトレの場合 平均的な人- これは人の理想です。 A. ケトレの平均的な人間の理論の矛盾は、ロシアの統計文献で証明されました。 XIX-XX 後半何世紀にもわたって

有名なロシアの統計学者ユー・E・ヤンソン(1835-1893)は、A・ケトレはある種の平均的な人間の自然界の存在を与えられたものとして想定しており、平均的な人々の人生はそこから逸脱していると書いている。 この会社のそして時間を与えられると、彼は運動法則の完全に機械的な見方にたどり着きます。 社会生活:動きは人の平均的な特性の徐々に増加し、タイプが徐々に回復することです。 その結果、社会体の生活のあらゆる現れがそのように平準化され、それを超えるといかなる前進も停止する。

この理論の本質は次のとおりです。 更なる発展真の量の理論として多くの統計理論家の研究に取り入れられています。 A.ケトレには、真の価値の理論を移したドイツの経済学者で統計学者のV.レクシス(1837-1914)という信奉者がいました。 経済現象 公開生活。 彼の理論は安定理論として知られています。 理想主義的な平均理論の別のバージョンは、次の哲学に基づいています。

その創設者は英国の統計学者 A. ボウリー (1869 ~ 1957 年) で、平均理論の分野における最近の最も著名な理論家の 1 人です。 彼の平均の概念は、著書『Elements of Statistics』で概説されています。

A. ボーリーは平均値を定量的な側面からのみ考慮するため、量と質を分離します。 平均値(または「その関数」)の意味を決定するために、A. Boleyはマキアンの思考原理を提唱しています。 A. ボーリーは、平均値の関数は複雑なグループを表現する必要があると書きました

いくつかの素数を使用します。 統計データは単純化され、グループ化され、平均値に削減されるべきです。これらの見解は、R. Fisher (1890-1968)、J. Yule (1871 - 1951)、Frederick S. Mills (1892) などによって共有されています。

30代 XX世紀 そしてその後の年には、平均値が社会的に考慮される 重要な特徴、その情報内容はデータの均一性に依存します。

イタリア学派の最も著名な代表者である R. ベニニ (1862-1956) と C. ジーニ (1884-1965) は、統計を論理の一分野と考え、統計帰納法の適用範囲を拡大しましたが、論理の認知原理を結び付けました。統計の社会学的解釈の伝統に従って、研究されている現象の性質を伴う統計。

K. マルクスと V. I. レーニンの作品では、平均値には特別な役割が与えられています。

K. マルクスは、平均は一般的なレベルからの個人の偏差を補償し、 平均レベル平均値が質量現象の一般化特性となるのは、かなりの数の単位が取られ、これらの単位が定性的に均一である場合に限られます。 マルクスは、求められる平均値は「同じ種類の多くの異なる個別の値」の平均であるべきだと書いています。

市場経済では平均値が特別な意味を持ちます。 必要かつ一般的なパターンの傾向を判断するのに役立ちます 経済発展単数形とランダムを介して直接。

平均値は、一般的な条件の作用と研究対象の現象のパターンを表す一般化指標です。

統計的平均は、統計的に正しく組織化された質量観察からの質量データに基づいて計算されます。 統計的平均が質的に均一な集団(集団現象)の集団データから計算される場合、それは客観的になります。

平均値は抽象的な単位の値を特徴付けるため、抽象的です。

特性の多様性から 個々のオブジェクト平均は抽象化されます。 抽象化はステップです 科学研究。 平均値においては、個人と一般の弁証法的統一が実現される。

平均値は、個人と一般、個人と集団というカテゴリーの弁証法的理解に基づいて適用されるべきです。

中央のものは、特定の単一オブジェクトに含まれる共通のものを表示します。

集団的な社会的プロセスのパターンを特定するには、平均値が非常に重要です。

一般からの個人の逸脱は、発達の過程の現れです。

平均値は、研究対象の現象の特徴、典型、実際のレベルを反映しています。 平均値の役割は、これらのレベルと時間と空間におけるその変化を特徴付けることです。

平均値は、正常で自然な状態で形成されるため、一般的な値です。 一般的な条件全体として考えられる特定の質量現象の存在。

統計的プロセスまたは現象の客観的な特性は、平均値に反映されます。

研究対象の統計的属性の個々の値は、母集団の単位ごとに異なります。 あるタイプの個々の値の平均値は必然の産物であり、人口のすべての単位の組み合わせた行動の結果であり、繰り返される事故の塊として現れます。

いくつかの個別の現象は、すべての現象に存在する特性を持っていますが、 異なる量人の身長または年齢です。 質的に異なる、個々の現象のその他の兆候 さまざまな現象、つまり、それらはある人には存在しますが、他の人には観察されません(男性は女性にはなりません)。 平均値は、特定のセット内のすべての現象に固有の、質的に均一で量的にのみ異なる特性に対して計算されます。

平均値は研究対象の特性の値を反映しており、この特性と同じ次元で測定されます。

弁証法的唯物論の理論は、世界のすべてのものは変化し発展すると教えています。 また、平均値によって特徴付けられる特性も変化し、それに応じて平均値自体も変化します。

人生には、何か新しいものを生み出す継続的なプロセスがあります。 新しい品質を保持するものは単一の物体であり、その後これらの物体の数が増加し、新しいものは典型的には塊になります。

平均値は、調査対象の母集団を 1 つの特性のみに従って特徴付けます。 シリーズ内の研究対象集団を完全かつ包括的に表現するため 特定の兆候さまざまな角度から現象を説明できる平均値のシステムが必要です。

2. 平均の種類

資料の統計処理では、解決すべきさまざまな問題が発生するため、統計の実践ではさまざまな平均値が使用されます。 数学統計次のようなさまざまな平均を使用します。 算術平均。 幾何平均。 調和平均。 正方形を意味します。

上記のタイプの平均のいずれかを適用するには、調査対象の母集団を分析し、調査対象の現象の重要な内容を決定する必要があります。これはすべて、結果の意味の原則から引き出された結論に基づいて行われます。重さを量ったり、合計したりすること。

平均値の研究では、次の指標と表記法が使用されます。

平均を求めるための符号は次のように呼ばれます。 平均化された特性 x で表されます。 統計的母集団の任意の単位の平均化された特性の値は、と呼ばれます。 その個々の意味、または オプション、そして次のように表されます バツ 1 、 バツ 2 、 バツ 3 、… バツ P ; 周波数は、文字で示される特性の個々の値の再現性です。 f.

算術平均

最も一般的な媒体のタイプの 1 つは、 算術平均、 これは、平均化された特性の量が、研究対象の統計母集団の個々の単位での値の合計として形成されるときに計算されます。

算術平均を計算するには、属性のすべてのレベルの合計をその数で割ります。


いくつかのオプションが複数回発生する場合、属性のレベルの合計は、各レベルに母集団内の対応するユニット数を乗算し、その結果の積を加算することによって取得できます。この方法で計算された算術平均は、加重平均と呼ばれます。算術平均。

加重算術平均の式は次のとおりです。


ここで、х i はオプションです。

f i – 周波数または重み。

オプションの数値が異なる場合はすべて、加重平均を使用する必要があります。

算術平均は、いわば、属性の合計値を個々のオブジェクト間で均等に分配しますが、実際には属性の合計値はオブジェクトごとに異なります。

平均値の計算は、平均が計算される特性のバリエーションが間隔(から〜まで)の形式で表される場合、間隔分布系列の形式でグループ化されたデータを使用して実行されます。

算術平均のプロパティ:

1) 平均 算術和変動量は算術平均の合計に等しい: x i = y i +z i の場合、


このプロパティは、どのような場合に平均値を集計できるかを示します。

2)一方向​​の偏差の合計は他の方向の偏差の合計によって補償されるため、平均からの変動する特性の個々の値の偏差の代数的合計はゼロに等しくなります。


このルールは、平均が結果であることを示しています。

3) 一連のオプションすべてが同じ数値だけ増加または減少した場合、平均は同じ数値だけ増加または減少しますか?:


4) 系列のすべてのバリアントが A 倍増加または減少した場合、平均的なバリアントも A 倍増加または減少します。


5) 平均の 5 番目の特性は、平均がスケールのサイズには依存せず、スケール間の関係に依存することを示しています。 相対値だけでなく、絶対値もスケールとして取ることができます。

系列のすべての周波数を同じ数値 d で割るか乗算しても、平均は変わりません。


調和平均。算術平均を決定するには、多数のオプションと頻度、つまり値が必要です。 バツそして f.

特性の個々の値がわかっていると仮定しましょう バツそして作品 バツ/、と周波数 fが不明な場合、平均を計算するには、積 = と表します。 バツ/;どこ:



この形式の平均は調和加重平均と呼ばれ、次のように表されます。 ×害。 上

したがって、調和平均は算術平均と同じになります。 実際の重量が不明な場合に適用されます f、そしてその作品は知られています FX = z

工事のとき FX同一または等しい単位 (m = 1) の場合、調和単純平均が使用され、次の式で計算されます。


どこ バツ– 個別のオプション。

n- 番号。

幾何平均

n 個の成長係数がある場合、平均係数の式は次のとおりです。


これが幾何平均の公式です。

幾何平均はべき乗の根に等しい n前の期間の値に対する後続の各期間の値の比率を特徴付ける成長係数の積から。

フォームで表現された値が平均化の対象となる場合 二次関数、二乗平均が適用されます。 たとえば、二乗平均平方根を使用して、パイプやホイールなどの直径を決定できます。

単純平均二乗は、属性の個々の値の二乗和をその数で割った商の平方根を取ることによって決定されます。


加重平均二乗は次と等しくなります。

3. 構造の平均。 最頻値と中央値

統計的母集団の構造を特徴付けるには、と呼ばれる指標が使用されます。 構造的な平均。これらには、最頻値と中央値が含まれます。

ファッション(M) ) - 最も一般的なオプション。 ファッション理論的な分布曲線の最大点に対応する属性の値です。

ファッションは、最も頻繁に発生する、または典型的な意味を表します。

ファッションは、消費者の需要を調査し、価格を記録するために商行為に使用されます。

離散系列では、モードは最も高い周波数を持つバリアントです。 一連の間隔変動では、モードは最高の頻度 (特異性) を持つ間隔の中心の変動であるとみなされます。

間隔内で、モードである属性の値を見つける必要があります。


どこ バツ – モーダル間隔の下限。

h– モーダル間隔の値。

fm– モーダル区間の周波数;

フィート-1 – モーダルインターバルに先行するインターバルの頻度。

fm+1 – モーダルインターバルに続くインターバルの周波数。

モードは、グループのサイズとグループ境界の正確な位置によって異なります。

ファッション– 実際に最も頻繁に発生する数値 (明確な値) で、実際には最も広範囲に適用されます (最も一般的なタイプの購入者)。

中央値 (M eは、順序付けられた変動系列の数を 2 つの等しい部分に分割する量です。1 つの部分には、平均的な変動よりも小さい変動特性の値が含まれ、もう 1 つの部分には、より大きな値が含まれます。

中央値分布系列の残りの要素の半分以上であると同時に半分以下である要素です。

中央値の特性は、中央値からの属性値の絶対偏差の合計が他の値からの絶対偏差の合計よりも小さいことです。

中央値を使用すると、他の形式の平均を使用するよりも正確な結果を得ることができます。

間隔変動系列で中央値を求める順序は次のとおりです。特性の個々の値をランキングに従って配置します。 特定のランク付けされたシリーズの累積頻度を決定します。 蓄積された頻度データを使用して、間隔の中央値を求めます。


どこ ×私– 中央間隔の下限。

自分– 中央間隔の値。

f/2– 系列の周波数の半分の合計。

S 自分-1 – 中央間隔に先行する累積頻度の合計。

f 自分– 中央間隔の頻度。

中央値は系列の数を半分に分割するため、累積頻度が頻度の合計の半分または半分を超え、以前の (累積) 頻度が母集団の数の半分未満になる場所になります。


平均値は、現象の典型的なレベルを特徴付ける一般的な指標です。 集団の単位当たりの特性の値を表します。

平均値は次のとおりです。

1) 母集団の属性の最も典型的な値。

2) 人口属性の体積。人口の単位間で均等に配分されます。

平均値を求める特性のことを統計学では「平均化」といいます。

平均は常に形質の量的変動を一般化します。 平均値では、ランダムな状況による集団内のユニット間の個人差が排除されます。 平均とは対照的に、集団の個々の単位の特性のレベルを特徴付ける絶対値では、異なる集団に属する単位間で特性の値を比較することはできません。 したがって、2 つの企業の従業員の報酬レベルを比較する必要がある場合、これに基づいて異なる企業の 2 人の従業員を比較することはできません。 比較対象として選択された従業員の報酬は、これらの企業では一般的ではない可能性があります。 対象企業の賃金基金の規模を比較する場合、従業員数は考慮されていないため、どこの賃金水準が高いかを判断することは不可能である。 最終的には、平均的な指標のみを比較できます。 各企業の従業員 1 人は平均していくら稼いでいますか? したがって、母集団の一般化された特性として平均値を計算する必要があります。

平均化プロセス中、属性レベルの合計値またはその最終値 (ダイナミクス系列で平均レベルを計算する場合) は変更されない必要があることに注意することが重要です。 言い換えれば、平均値を計算するときに、調査対象の特性のボリュームが歪んではならず、平均を計算するときに編集された式が必ず意味をなすものでなければなりません。

平均の計算は一般的な一般化手法の 1 つです。 平均指標は、調査対象の母集団のすべての単位に共通する(典型的な)ものを否定すると同時に、個々の単位の違いを無視します。 あらゆる現象とその発展には、偶然と必然性が組み合わされています。 平均値を計算する場合、法律により 多数事故は相殺され、バランスが保たれるため、現象の重要ではない特徴や、特定のケースごとの属性の定量的な値を抽象化することができます。 個々の値や変動のランダム性を抽象化する能力には、集合体の一般化特性としての平均の科学的価値があります。

平均が真に代表的なものとなるためには、特定の原則を考慮して計算する必要があります。

いくつか見てみましょう 一般原理平均値の適用。

1. 平均は、質的に均一な単位からなる集団に対して決定されなければなりません。

2. 平均は、十分に大きな数のユニットから構成される母集団に対して計算する必要があります。

3. 平均は、ユニットが正常な自然状態にある集団に対して計算されなければなりません。

4. 平均は、調査対象の指標の経済的内容を考慮して計算される必要があります。

5.2. 平均の種類と計算方法

ここで、平均値の種類、その計算の特徴、および応用分野について考えてみましょう。 平均値は、電力平均と構造平均の 2 つの大きなクラスに分類されます。

べき乗平均には、幾何平均、算術平均、二乗平均など、最もよく知られ頻繁に使用されるタイプが含まれます。

最頻値と中央値は構造平均とみなされます。

電力平均に注目してみましょう。 検出力平均は、ソース データの表現に応じて、単純にすることも、重み付けすることもできます。 単純平均これはグループ化されていないデータに基づいて計算され、次の一般的な形式になります。

,

ここで、X i は平均化される特性のバリアント (値) です。

n – 数値オプション。

加重平均グループ化されたデータに基づいて計算され、一般的な外観を持ちます

,

ここで、X i は平均化される特性のバリアント (値)、またはバリアントが測定される間隔の中間値です。

m – 平均次数指数。

f i – 発生回数を示す周波数 つまり値平均化特性。

同じ初期データに対してすべての種類の平均を計算すると、それらの値は異なることがわかります。 ここでは平均値の多数決の法則が適用されます。つまり、指数 m が増加すると、対応する平均値も増加します。

統計実務では、算術平均と調和加重平均が、他のタイプの加重平均よりも頻繁に使用されます。

動力手段の種類

力の種類
平均

索引
度(メートル)

計算式

単純

加重

高調波

幾何学的な

算術

二次関数

キュービック

調和平均にはさらに多くの値があります 複雑なデザイン算術平均よりも。 調和平均は、母集団の単位(特性のキャリア)が重みとして使用されるのではなく、これらの単位と特性の値の積(つまり、m = Xf)が計算に使用されます。 平均調和単純は、例えば、製造に従事する 2 社 (3 社、4 社など) の企業、労働者の 1 つの部品あたり、生産単位あたりの労働力、時間、材料の平均コストを決定する場合に使用する必要があります。同じ種類の製品、同じ部品、製品。

平均値を計算する式の主な要件は、計算のすべての段階に実際に意味のある正当性があることです。 結果として得られる平均値は、個別インジケーターと概要インジケーターの間の接続を中断することなく、各オブジェクトの属性の個別の値を置き換える必要があります。 言い換えれば、平均値は、平均化されたインジケーターの個々の値がその平均値に置き換えられたときに、最終的な要約インジケーターの一部が変更されないように計算する必要があります。 関連トピックまたは別の方法で平均化されたものを使用します。 この合計を次のように呼びます。 定義する個々の値との関係の性質によって、平均値を計算するための特定の式が決まるためです。 幾何平均の例を使用して、この規則を示してみましょう。

幾何平均の公式

個々の相対的なダイナミクスに基づいて平均値を計算する場合に最もよく使用されます。

幾何平均は、チェーンの相対的なダイナミクスのシーケンスが与えられた場合に使用され、たとえば、レベルと比較した生産量の増加を示します。 前年: i 1、i 2、i 3、…、i n。 の生産量が一目瞭然です。 去年は、初期レベル (q 0) とその後の長年にわたる増加によって決まります。

q n =q 0 × i 1 × i 2 ×…×i n 。

q n を決定指標として取り、ダイナミクス指標の個々の値を平均値に置き換えると、次の関係が得られます。

ここから



特別なタイプの平均値 - 構造平均 - は、属性値の分布系列の内部構造を調査するため、および利用可能な統計データによると、平均値 (検出力タイプ) を推定するために使用されます。計算は実行できません(たとえば、検討されている例で、企業グループごとの生産量とコストの両方のデータが存在しない場合)。

指標は構造的な平均として最もよく使用されます。 ファッション -最も頻繁に繰り返される属性の値 – そして 中央値 –値の順序付けされたシーケンスを 2 つの等しい部分に分割する特性の値。 その結果、母集団の半分のユニットでは、属性の値は中央値レベルを超えず、残りの半分ではそれより小さくなりません。

研究対象の特性が離散値を持つ場合、最頻値と中央値を計算するのに特別な困難はありません。 属性 X の値に関するデータが、その変化の順序付けられた間隔 (間隔シリーズ) の形式で表される場合、最頻値と中央値の計算は多少複雑になります。 中央値は母集団全体を 2 つの等しい部分に分割するため、最終的に特性 X の区間の 1 つに収まります。内挿を使用すると、中央値の値はこの中央値区間で求められます。

,

ここで、X Me は中央値間隔の下限です。

h Me – その価値。

(合計 m)/2 – 平均値 (絶対的または相対的) を計算する式の重みとして使用される観測値の総数の半分、またはインジケーターのボリュームの半分。

S Me-1 – 中央値間隔の開始前に蓄積された観測値 (または重み付け属性の量) の合計。

m Me – 中央値間隔における観測値または重み付け特性の量 (絶対値または相対値でも)。

計算するとき 様相の意味間隔系列のデータによる特性では、特性 X の値の再現性指標がこれに依存するため、間隔が同一であるという事実に注意する必要があります。等間隔の間隔系列の場合、モードの大きさは次のように決定されます。

,

ここで、X Mo はモーダル間隔の下限値です。

m Mo – モーダル区間内の重み付け特性の観測値またはボリューム (絶対的または相対的)。

m Mo-1 – モーダルインターバルに先行するインターバルについても同じ。

m Mo+1 – モーダル区間に続く区間でも同じ。

h – グループ内の特性の変化間隔の値。

タスク1

報告年の産業企業グループについては、次のデータが利用可能です。


企業

製品の量、100万ルーブル。

平均従業員数、人数。

利益、千ルーブル

197,7

10,0

13,5

22,8

1500

136,2

465,5

18,4

1412

97,6

296,2

12,6

1200

44,4

584,1

22,0

1485

146,0

480,0

119,0

1420

110,4

57805

21,6

1390

138,7

204,7

30,6

466,8

19,4

1375

111,8

292,2

113,6

1200

49,6

423,1

17,6

1365

105,8

192,6

30,7

360,5

14,0

1290

64,8

280,3

10,2

33,3

製品を交換するには、次の間隔で企業をグループ化する必要があります。

    最大2億ルーブル

    2億から4億ルーブル。

  1. 4億から6億ルーブル。

    各グループおよび全体について、企業の数、生産量、平均従業員数、従業員あたりの平均生産高を決定します。 グループ化の結果を統計表の形式で表示します。 結論を導き出します。

    解決

    製品交換ごとに企業をグループ化し、単純な平均式を用いて企業数、生産量、平均従業員数を算出します。 グループ化と計算の結果は表にまとめられます。

    製品ボリュームごとにグループ化


    企業

    製品の量、100万ルーブル。

    固定資産の年間平均コスト、100万ルーブル。

    中程度の睡眠

    素晴らしい数の従業員、人々。

    利益、千ルーブル

    従業員一人当たりの平均生産高

    1グループ

    最大2億ルーブル

    1,8,12

    197,7

    204,7

    192,6

    10,0

    9,4

    8,8

    900

    817

    13,5

    30,6

    30,7

    28,2

    2567

    74,8

    0,23

    平均レベル

    198,3

    24,9

    第2グループ

    2億から4億ルーブル。

    4,10,13,14

    196,2

    292,2

    360,5

    280,3

    12,6

    113,6

    14,0

    10,2

    1200

    1200

    1290

    44,4

    49,6

    64,8

    33,3

    1129,2

    150,4

    4590

    192,1

    0,25

    平均レベル

    282,3

    37,6

    1530

    64,0

    3グループ

    400から

    6億

    2,3,5,6,7,9,11

    592

    465,5

    584,1

    480,0

    578,5

    466,8

    423,1

    22,8

    18,4

    22,0

    119,0

    21,6

    19,4

    17,6

    1500

    1412

    1485

    1420

    1390

    1375

    1365

    136,2

    97,6

    146,0

    110,4

    138,7

    111,8

    105,8

    3590

    240,8

    9974

    846,5

    0,36

    平均レベル

    512,9

    34,4

    1421

    120,9

    合計

    5314,2

    419,4

    17131

    1113,4

    0,31

    平均して

    379,6

    59,9

    1223,6

    79,5

    結論。 したがって、考慮した母集団では、 最大の数生産面での企業は 3 番目のグループ、すなわち企業の半数にあたる 7 社に分類されました。 固定資産の年間平均コストもこのグループに含まれます。 大きな値平均従業員数は 9974 人で、最初のグループの企業は最も収益性が低いです。

    タスク 2

    同社の企業に関する次のデータが入手可能です。

    会社に含まれる企業の数

    私は四分の一

    第Ⅱ四半期

    製品生産量、千ルーブル。

    労働者の労働工数

    労働者 1 人あたりの 1 日あたりの平均生産量、こすります。

    59390,13

最も一般的なタイプの平均は算術平均です。

単純な算術平均

単純算術平均は、データ内の特定の属性の総体積が特定の母集団に含まれるすべてのユニットに均等に配分されるかを決定する際の平均項です。 それで、 平均年間生産量労働者あたりの製品 - これは、生産量全体が 同程度に組織の全従業員に配布されます。 単純な算術平均値は、次の式を使用して計算されます。

単純な算術平均— 特性の個々の値の合計と全体の特性の数の比率に等しい

例1 。 6人の労働者のチームは月に3 3.2 3.3 3.5 3.8 3.1千ルーブルを受け取ります。

平均給与を求める
解: (3 + 3.2 + 3.3 +3.5 + 3.8 + 3.1) / 6 = 3.32 千ルーブル。

加重算術平均

データセットの量が大きく、分布系列を表す場合は、加重算術平均が計算されます。 生産単位あたりの加重平均価格は次のようにして決定されます。つまり、総生産コスト (生産数量と生産単位の価格の積の合計) を総生産量で割ります。

これを次の式の形で想像してみましょう。

加重算術平均— (特徴の値とこの特徴の繰り返し頻度の積の合計) と (すべての特徴の頻度の合計) の比に等しい。研究対象の母集団に変異が発生する場合に使用される。回数が等しくない。

例 2 。 工場労働者の月平均給与を求める

平均給与は合計を割れば求められます 賃金ワーカーの総数:

答え:3.35千ルーブル。

区間系列の算術平均

区間変動系列の算術平均を計算する場合は、まず上限と下限の半分の合計として各区間の平均を決定し、次に系列全体の平均を決定します。 開いた間隔の場合、下側または上側の間隔の値は、それらに隣接する間隔のサイズによって決まります。

間隔シリーズから計算された平均は近似値です。

例 3。 定義する 平均年齢夕方の学生たち。

間隔シリーズから計算された平均は近似値です。 近似の程度は、区間内の人口単位の実際の分布が一様分布にどの程度近づくかによって異なります。

平均を計算する場合、絶対値だけでなく相対値(頻度)も重みとして使用できます。

算術平均には、その本質をより完全に明らかにし、計算を簡素化するいくつかの特性があります。

1. 平均と頻度の合計との積は、常に、頻度とバリアントの積の合計と等しくなります。

2. さまざまな量の合計の算術平均は、これらの量の算術平均の合計に等しくなります。

3. 平均からの特性の個々の値の偏差の代数的合計はゼロに等しくなります。

4. 平均からのオプションの偏差の二乗の合計は、他の任意の値からの偏差の二乗の合計よりも小さい。