메뉴
무료
등록
 /  사람을 박탈/ 표준편차 공식을 수정했습니다. 표준 편차 값의 해석. 평균 지수, 그 정의

표준 편차 공식을 수정했습니다. 표준 편차 값의 해석. 평균 지수, 그 정의

평균 표준 편차

대부분 완벽한 특성변동은 표준편차이고 ĸᴏᴛᴏᴩᴏᴇ은 표준편차(또는 표준편차)라고 합니다. 표준 편차()는 산술 평균에서 개별 기능 값의 편차의 평균 제곱의 제곱근과 같습니다.

표준 편차는 간단합니다.

가중 표준 편차는 그룹화된 데이터에 적용됩니다.

정규 분포 조건에서 평균 제곱과 평균 선형 편차 사이에 다음 관계가 발생합니다. ~ 1.25.

변동의 주요 절대 측정 인 표준 편차는 정규 분포 곡선의 세로 좌표 값을 결정하고 표본 관찰 구성과 관련된 계산 및 표본 특성의 정확도 설정에 사용됩니다. 동질 집단에서 형질의 변이의 경계를 평가하는 것.

18. 분산, 그 유형, 표준 편차.

확률 변수의 분산- 주어진 랜덤 변수의 퍼짐 정도, 즉 수학적 기대치로부터의 편차. 통계에서 지정 또는 자주 사용됩니다. 분산의 제곱근이라고 합니다. 표준 편차, 표준 편차또는 표준 스프레드.

총 분산 (σ2) 이 변이를 일으킨 모든 요인의 영향을 받는 전체 인구의 특성 변이를 측정합니다. 동시에 그룹화 방법 덕분에 그룹화 특성으로 인한 변동과 설명되지 않은 요인의 영향으로 발생하는 변동을 분리하여 측정할 수 있습니다.

그룹간 분산 (σ 2 m.gr) 체계적인 변이, 즉 그룹화의 기본 요소인 특성의 영향으로 발생하는 연구된 특성의 가치 차이를 특성화합니다.

표준 편차(동의어: 표준 편차, 표준 편차, 표준 편차; 관련 용어: 표준 편차, 표준 스프레드) - 확률 이론 및 통계에서 수학적 기대치에 대한 확률 변수 값의 분산에 대한 가장 일반적인 지표입니다. 값 샘플의 제한된 배열에서는 수학적 기대값 대신 샘플 세트의 산술 평균이 사용됩니다.

표준편차는 확률변수 자체의 단위로 측정되며, 산술평균의 표준오차 계산, 신뢰구간 구성, 가설의 통계적 검정, 확률변수 간의 선형관계 측정에 사용된다. 로써 정의 된 제곱근확률 변수의 분산에서.

표준 편차:

표준 편차 (확률변수의 표준편차 추정 엑스분산의 편향되지 않은 추정치를 기반으로 한 수학적 기대치에 대한 상대적):

분산은 어디에 있습니까? - -번째 샘플 요소; - 표본의 크기; - 샘플의 산술 평균:

두 추정 모두 편향되어 있다는 점에 유의해야 합니다. 일반적으로 편향되지 않은 추정치를 구성하는 것은 불가능합니다. 동시에 편향되지 않은 분산 추정치를 기반으로 한 추정치는 일관성이 있습니다.

19. 모드와 중앙값을 결정하기 위한 본질, 범위 및 절차.

변수 속성의 크기의 상대적인 특성에 대한 통계의 멱법칙 평균 외에도 내부 구조분포 시리즈는 주로 다음으로 표시되는 구조적 평균을 사용합니다. 모드와 중앙값.

패션- 시리즈의 가장 일반적인 변형입니다. 예를 들어 패션은 구매자 사이에서 가장 수요가 많은 옷, 신발의 크기를 결정할 때 사용됩니다. 개별 시리즈의 모드는 주파수가 가장 높은 변형입니다. 간격 변동 시리즈의 모드를 계산할 때 먼저 모달 간격(최대 빈도로)을 결정한 다음 공식에 따라 속성의 모달 값 값을 결정하는 것이 매우 중요합니다.

§ - 패션 가치

§ - 모달 간격의 하한

§ - 간격 값

§ - 모달 간격 주파수

§ - 모달 이전 간격의 빈도

§ - 모달 다음 간격의 빈도

중앙값 -이 기능 값 ĸᴏᴛᴏᴩᴏᴇ은 순위 시리즈의 기초에 있으며 이 시리즈를 숫자가 동일한 두 부분으로 나눕니다.

중앙값을 결정하려면 별개의 시리즈로빈도가 있는 경우 빈도의 절반 합이 먼저 계산된 다음 해당 변형 값이 결정됩니다. (정렬된 행에 홀수기호가 있으면 중앙값의 수는 다음 공식에 의해 계산됩니다.

M e \u003d (n(집계의 기능 수) + 1) / 2,

특성이 짝수인 경우 중앙값은 계열 중간에 있는 두 특성의 평균과 같습니다.

중앙값을 계산할 때 간격 변화 시리즈의 경우먼저 중앙값이 있는 중앙값 간격을 결정한 다음 공식에 따라 중앙값 값을 결정합니다.

§ - 원하는 중앙값

§ - 중앙값을 포함하는 구간의 하한

§ - 간격 값

§ - 주파수의 합 또는 시리즈의 구성원 수

§ - 중앙값 이전 구간의 누적 빈도의 합

§ - 중간 간격의 빈도

예시. 모드와 중앙값을 찾으십시오.

해결책: 이 예에서 모달 간격은 가장 높은 빈도(1054)를 설명하기 때문에 25-30세의 연령 그룹 내에 있습니다.

모드 값을 계산해 보겠습니다.

이는 학생의 모달 연령이 27세임을 의미합니다.

중앙값을 계산해 봅시다. 중간 간격은 25-30세 연령 그룹에 있습니다. 이 간격 내에 인구를 두 개의 동일한 부분으로 나누는 변형이 있기 때문입니다(Σf i /2 = 3462/2 = 1731). 다음으로 필요한 숫자 데이터를 공식에 대입하고 중앙값을 얻습니다.

이는 학생의 절반이 27.4세 미만이고 나머지 절반이 27.4세 이상임을 의미합니다.

모드 및 중앙값 외에도 사분위수와 같은 지표가 사용되어 순위가 매겨진 시리즈를 4개의 동일한 부분으로 나누고 십분위수(10개 부분 및 백분위수)를 100개 부분으로 나눕니다.

20. 선택적 관찰의 개념과 범위.

선택적 관찰연속관찰 적용시 적용 물리적으로 불가능많은 양의 데이터로 인해 경제적으로 불가능하다. 예를 들어 승객 흐름, 시장 가격, 가족 예산을 연구할 때 물리적 불가능이 발생합니다. 경제적 불편은 예를 들어 시식, 벽돌의 강도 테스트 등과 같이 파괴와 관련된 상품의 품질을 평가할 때 발생합니다.

관찰을 위해 선택된 통계 단위는 샘플링 프레임또는 견본 추출, 및 전체 배열 - 일반 인구(GS). 어디에서 샘플의 단위 수가리키다 N, 그리고 모든 HS에서 - N. 태도 해당 없음~라고 불리는 상대적 크기또는 샘플 공유.

샘플링 결과의 품질은 표본 대표성, 즉, HS에서 얼마나 대표성이 있는지에 대한 것입니다. 표본의 대표성을 보장하기 위해서는 다음이 필수적입니다. 무작위 단위 선택의 원리, 이는 표본에 HS 단위를 포함하는 것이 우연 이외의 다른 요인에 의해 영향을 받을 수 없다고 가정합니다.

존재 무작위 선택의 4가지 방법샘플:

  1. 실제로 무작위선택 또는 '로또 방법', 통계 할당 시 시퀀스 번호, 특정 물건(예: 술통)을 가져온 다음 특정 용기(예: 가방)에 혼합하여 무작위로 선택합니다. 실제로이 방법은 난수 생성기 또는 난수 수학 테이블을 사용하여 수행됩니다.
  2. 기계각각에 따라 선택( 해당 없음)번째 수량 인구. 예를 들어, 100,000개의 값이 포함되어 있고 1,000개를 선택하려는 경우 모든 100,000/1000 = 100번째 값이 샘플에 포함됩니다. 또한 순위가 지정되지 않은 경우 첫 번째 것은 처음 100에서 무작위로 선택되고 다른 숫자는 100이 더 됩니다. 예를 들어, 첫 번째 단위가 숫자 19인 경우 다음 단위는 숫자 119, 그 다음 숫자 219, 숫자 319 등이어야 합니다. 일반 인구의 단위가 순위가 매겨지면 50번이 먼저 선택되고 150번이 선택되고 250번이 차례로 선택됩니다.
  3. 이기종 데이터 배열에서 값 선택이 수행됩니다. 계층화(계층화) 방법은 일반 인구가 사전에 동질적인 그룹으로 분할되어 무작위 또는 기계적 선택이 적용되는 경우입니다.
  4. 특별한 방법샘플링은 연속물개별 수량을 무작위로 또는 기계적으로 선택하는 것이 아니라 연속적인 관찰이 수행되는 시리즈(몇몇 숫자에서 연속으로 몇 개까지의 순서)를 선택합니다.

표본 관찰의 품질도 샘플링 유형: 반복또는 비반복적.~에 재선정표본에 빠진 통계 값 또는 그 계열은 사용 후 일반 인구에게 반환되어 새 표본에 들어갈 기회를 갖습니다. 동시에 일반 모집단의 모든 값은 표본에 포함될 확률이 동일합니다. 반복되지 않는 선택표본에 포함된 통계값 또는 그 계열이 사용 후 일반 모집단에 반환되지 않으므로 후자의 나머지 값에 대해 다음 표본에 들어갈 확률이 증가함을 의미합니다.

비반복적 샘플링은 더 정확한 결과를 제공하므로 더 자주 사용됩니다. 다만 적용이 안 되는 상황(여객 흐름, 소비자 수요 등 조사) 후 재선정하는 경우도 있다.

21. 관찰의 표본오차 제한, 표본오차 평균, 계산 순서.

위의 표본 모집단 구성 방법과 이 경우 발생하는 대표성 오류에 대해 자세히 살펴보겠습니다. 실제로 무작위표본은 일관성 요소 없이 무작위로 일반 모집단에서 단위 선택을 기반으로 합니다. 기술적으로 적절한 무작위 선택은 추첨(예: 복권)이나 난수 표를 통해 수행됩니다.

실제로 선택적 관찰의 실천에서 "순수한 형태의" 무작위 선택은 거의 사용되지 않지만, 다른 유형의 선택 중에서 초기이며 선택적 관찰의 기본 원칙을 구현합니다. 이론에 대한 몇 가지 질문을 고려하십시오. 샘플링 방법간단한 무작위 샘플에 대한 오류 공식.

샘플링 오류- ϶ᴛᴏ 일반 모집단의 모수 값과 표본 관찰 결과에서 계산한 값 사이의 차이. 평균 정량적 특성의 경우 샘플링 오류는 다음과 같이 결정됩니다.

지표는 일반적으로 한계 표본 오차라고 합니다. 표본 평균은 다음을 취할 수 있는 확률 변수입니다. 다양한 의미샘플에 포함된 단위를 기반으로 합니다. 따라서 샘플링 오류도 확률 변수이며 다른 값을 가질 수 있습니다. 이러한 이유로 평균 가능한 오류평균 샘플링 오류, 다음에 따라 다릅니다.

표본 크기: 숫자가 클수록 평균 오차는 작아집니다.

연구된 특성의 변화 정도: 특성의 변동이 작을수록 결과적으로 변이가 작을수록 평균 샘플링 오류가 작아집니다.

~에 무작위 재선택평균 오차가 계산됩니다. 실제로 일반 분산은 정확히 알려져 있지 않지만 확률 이론에서 다음과 같이 입증되었습니다. . 충분히 큰 n에 대한 값은 1에 가까우므로 다음을 가정할 수 있습니다. 그런 다음 평균 샘플링 오류를 계산해야 합니다. 그러나 작은 표본의 경우(n<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

~에 무작위 샘플링주어진 공식은 값으로 수정됩니다. 그러면 비표본의 평균 오차는 다음과 같습니다. 그리고 . 왜냐하면 가 항상 보다 작으면 계수()는 항상 1보다 작습니다. 이는 비반복 선택의 평균 오차가 항상 반복 선택의 평균 오차보다 작다는 것을 의미합니다. 기계적 샘플링인구가 어떤 식으로든 정렬될 때 사용됩니다(예: 알파벳 순서의 유권자 목록, 전화 번호, 집 번호, 아파트). 단위 선택은 샘플 백분율의 역수와 동일한 특정 간격으로 수행됩니다. 따라서 2% 샘플의 경우 모든 50단위 = 1/0.02가 선택되고 5%의 경우 일반 모집단의 각 1/0.05 = 20단위가 선택됩니다.

원점은 다양한 방식으로 선택됩니다. 즉, 간격 중간에서 원점을 변경하면서 무작위로 선택합니다. 핵심은 체계적인 오류를 피하는 것입니다. 예를 들어 5% 샘플의 경우 13번째가 첫 번째 단위로 선택되면 다음 33, 53, 73 등입니다.

정확도 측면에서 기계적 선택은 적절한 무작위 샘플링에 가깝습니다. 이러한 이유로 기계적 샘플링의 평균 오차를 결정하기 위해 적절한 무작위 선택 공식이 사용됩니다.

~에 전형적인 선택조사된 인구는 미리 동질의 단일 유형 그룹으로 나뉩니다. 예를 들어, 기업을 조사할 때 이들은 부문, 하위 부문이고 인구를 조사할 때는 지역, 사회 또는 연령 그룹입니다. 다음으로, 기계적 또는 무작위적인 방법으로 각 그룹에서 독립적인 선택이 이루어집니다.

일반적인 샘플링은 다른 방법보다 더 정확한 결과를 제공합니다. 일반 모집단의 유형화는 표본의 각 유형학적 그룹의 표현을 보장하므로 평균 표본 오차에 대한 집단 간 분산의 영향을 배제할 수 있습니다. 따라서 분산의 가산법칙()에 따라 대표 표본의 오차를 구할 때 그룹 분산의 평균만을 고려하는 것은 매우 중요하다. 그런 다음 평균 샘플링 오류: 반복 선택, 비반복 선택 , 어디 표본에서 그룹 내 분산의 평균입니다.

직렬(또는 중첩) 선택표본조사를 시작하기 전에 모집단을 계열 또는 그룹으로 나눌 때 사용합니다. 이 시리즈는 완제품, 학생 그룹, 팀의 패키지입니다. 검사할 시리즈는 기계적으로 또는 무작위로 선택되며 시리즈 내에서 단위에 대한 전체 조사가 수행됩니다. 이러한 이유로 평균 샘플링 오류는 다음 공식으로 계산되는 그룹간(계열간) 분산에만 의존합니다. 여기서 r은 선택된 시리즈의 수입니다. i번째 시리즈의 평균입니다. 평균 직렬 샘플링 오류가 계산됩니다. 재선택 시, 비반복 선택 시 , 여기서 R은 시리즈의 총 수입니다. 결합선택은 고려된 선택 방법의 조합입니다.

모든 선택 방법에 대한 평균 샘플링 오류는 주로 샘플의 절대 크기에 따라 달라지며 덜하지만 샘플의 백분율에 따라 달라집니다. 4500개 단위의 모집단 중 첫 번째 경우와 225000개 단위 중 두 번째 경우에 225개의 관측이 수행되었다고 가정합니다. 두 경우의 분산은 모두 25입니다. 그런 다음 첫 번째 경우 5% 선택에서 샘플링 오류는 다음과 같습니다. 두 번째 경우 0.1% 선택 시 다음과 같습니다.

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, 표본 크기가 변경되지 않았기 때문에 표본 추출 비율이 50배 감소하면서 표본 추출 오류가 약간 증가했습니다. 표본 크기가 625개 관측값으로 증가했다고 가정합니다. 이 경우 샘플링 오류는 다음과 같습니다. 일반 모집단과 동일한 크기로 표본이 2.8배 증가하면 표본 오차의 크기는 1.6배 이상 감소합니다.

22. 표본 모집단을 형성하는 방법 및 방법.

통계에서는 연구 목적에 따라 결정되고 연구 대상의 특성에 따라 다양한 표본 집합을 형성하는 방법이 사용됩니다.

표본조사를 실시하기 위한 주된 조건은 모집단의 각 단위 표본에 대한 평등한 기회의 원칙을 위반하여 발생하는 계통오류의 발생을 방지하는 것이다. 체계적인 오류 예방은 표본 모집단 형성을 위한 과학적 기반 방법을 사용한 결과입니다.

일반 모집단에서 단위를 선택하는 방법은 다음과 같습니다. 1) 개별 선택 - 표본에서 개별 단위가 선택됩니다. 2) 그룹 선택 - 연구 중인 질적으로 균질한 그룹 또는 일련의 단위가 샘플에 포함됩니다. 3) 조합선발은 개인선발과 집단선정을 합친 것이다. 선택 방법은 표본 모집단 형성 규칙에 따라 결정됩니다.

샘플은 다음과 같아야 합니다.

  • 적절한 무작위표본이 일반 모집단에서 개별 단위를 무작위로(의도하지 않은) 선택한 결과로 형성된다는 사실로 구성됩니다. 이 경우 표본 집합에서 선택한 단위 수는 일반적으로 표본의 허용 비율에 따라 결정됩니다. 표본 점유율은 표본 모집단 n의 단위 수와 일반 모집단 N의 단위 수 ᴛ.ᴇ의 비율입니다.
  • 기계적표본의 단위 선택이 동일한 간격 (그룹)으로 나누어 진 일반 모집단에서 이루어졌다는 사실로 구성됩니다. 이 경우 일반 모집단의 구간 크기는 표본 점유율의 역수와 같습니다. 따라서 2% 샘플에서는 50번째 단위마다(1:0.02), 5% 샘플에서는 20번째 단위마다(1:0.05) 등으로 선택됩니다. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, 수용된 선택 비율에 따라 일반 인구는 기계적으로 동일한 그룹으로 나뉩니다. 샘플의 각 그룹에서 하나의 단위만 선택됩니다.
  • 전형적인 -일반 인구가 먼저 동질의 전형적인 그룹으로 나뉩니다. 또한, 각 전형적인 그룹에서 샘플에 대한 개별 단위 선택은 무작위 또는 기계적 샘플에 의해 이루어집니다. 일반적인 샘플의 중요한 특징은 샘플에서 단위를 선택하는 다른 방법에 비해 더 정확한 결과를 제공한다는 것입니다.
  • 연속물- 일반 인구가 동일한 크기의 그룹으로 나뉘는 시리즈. 시리즈는 샘플 세트에서 선택됩니다. 계열 내에서 계열에 속하는 단위에 대한 지속적인 관찰이 수행됩니다.
  • 결합- 샘플은 2단계여야 합니다. 이 경우 일반 인구는 먼저 그룹으로 나뉩니다. 다음으로 그룹이 선택되고 후자 내에서 개별 단위가 선택됩니다.

통계에서 샘플의 단위를 선택하는 다음과 같은 방법이 구별됩니다.

  • 단일 단계샘플 - 선택된 각 단위는 주어진 기준에 따라 즉시 연구 대상이 됩니다(실제로는 무작위 및 연속 샘플).
  • 다단계샘플링 - 개별 그룹의 일반 모집단에서 선택하고 그룹에서 개별 단위를 선택합니다(샘플 모집단에서 단위를 선택하는 기계적 방법을 사용하는 일반적인 샘플).

또한, 구별:

  • 재선택- 반환 된 공의 계획에 따라. 동시에 표본에 포함된 각 단위 또는 시리즈는 일반 모집단으로 반환되므로 다시 표본에 포함될 수 있습니다.
  • 비반복 선택- 반환되지 않은 공의 계획에 따라. 동일한 샘플 크기에 대해 더 정확한 결과가 있습니다.

23. 임계 표본 크기 결정(학생 표 사용).

표본 추출 이론의 과학적 원칙 중 하나는 충분한 수의 단위가 선택되도록 하는 것입니다. 이론적으로, 이 원칙을 준수하는 것의 극한의 중요성은 확률 이론의 극한 정리의 증명에서 제시되며, 이를 통해 충분하고 표본의 대표성을 보장하기 위해 일반 모집단에서 얼마나 많은 단위를 선택해야 하는지를 설정할 수 있습니다.

표본의 표준 오차가 감소하고 따라서 추정치의 정확도가 증가하면 항상 표본 크기의 증가와 관련이 있습니다. 이와 관련하여 이미 표본 관찰을 구성하는 단계에서 다음이 필요합니다. 관찰 결과의 요구되는 정확성을 보장하기 위해 표본 크기를 결정하는 것. 매우 중요한 표본 크기의 계산은 하나 또는 다른 유형 및 선택 방법에 해당하는 한계 표본 오차(A)에 대한 공식에서 파생된 공식을 사용하여 작성됩니다. 따라서 무작위 반복 표본 크기(n)에 대해 다음을 얻습니다.

이 공식의 핵심은 매우 중요한 숫자를 무작위로 재선택할 때 표본 크기가 신뢰 계수의 제곱에 정비례한다는 것입니다. (t2)및 변이 특성의 분산(α2)이고 한계 샘플링 오차(α2)의 제곱에 반비례합니다. 특히 한계 오차가 2배가 되면 필요한 표본 크기를 4배로 줄여야 합니다. 3개의 매개변수 중 2개(t 및?)는 연구자가 설정합니다. 동시에 연구자는 목표를 바탕으로

샘플 설문조사의 목적은 다음과 같은 질문을 결정해야 합니다. 최상의 옵션을 제공하기 위해 이러한 매개변수를 포함하는 것이 더 나은 양적 조합은 무엇입니까? 한 경우에, 그는 정확도 측정(α)보다 얻은 결과(t)의 신뢰성에 더 만족할 수 있고, 다른 경우도 마찬가지입니다. 표본 관측치를 설계하는 단계에서 연구자가 이 지표를 가지고 있지 않기 때문에 한계표본오차의 값에 대한 문제를 해결하는 것이 더 어렵습니다. 이와 관련하여 실무에서 한계표본오차를 설정하는 것이 관례입니다. , 일반적으로 특성의 예상 평균 수준의 10% 이내 . 추정된 평균 수준을 설정하는 것은 유사한 이전 조사의 데이터를 사용하거나 샘플링 프레임의 데이터를 사용하고 작은 파일럿 샘플을 사용하는 등 다양한 방법으로 접근할 수 있습니다.

표본 관찰을 설계할 때 설정하기 가장 어려운 것은 공식 (5.2)의 세 번째 매개변수인 표본 모집단의 분산입니다. 이 경우 이전의 유사 및 예비 조사에서 조사자가 사용할 수 있는 모든 정보를 사용하는 것이 필수적입니다.

표본 조사가 표본 추출 단위의 여러 기능에 대한 연구를 포함하는 경우 매우 중요한 표본 크기를 결정하는 문제는 더욱 복잡해집니다. 이 경우 일반적으로 각 특성의 평균 수준과 그 변이가 다르며 이와 관련하여 목적 만 고려하여 특성 중 어느 분산을 선호할지 결정할 수 있습니다 및 설문조사의 목적.

표본 관찰을 설계할 때 특정 연구의 목적과 관찰 결과에 따른 결론의 확률에 따라 허용 가능한 표본 오차의 미리 결정된 값을 가정합니다.

일반적으로 표본 평균값의 한계 오차 공식을 통해 다음을 결정할 수 있습니다.

‣‣‣ 표본 모집단의 지표에서 일반 모집단 지표의 가능한 편차의 크기;

‣‣‣ 가능한 오류의 한계가 특정 지정된 값을 초과하지 않는 필수 정확도를 제공하는 필요한 샘플 크기

‣‣‣ 표본의 오류가 주어진 한계를 가질 확률.

학생 분포확률 이론에서 그것은 절대적으로 연속적인 분포의 1-모수 패밀리입니다.

24. 일련의 역학(간격, 순간), 일련의 역학 종료.

역학 시리즈- 이것은 특정 시간 순서로 표시되는 통계 지표의 값입니다.

각 시계열에는 두 가지 구성 요소가 포함됩니다.

1) 기간 표시기(년, 분기, 월, 일 또는 날짜);

2) 연구중인 대상을 특징 짓는 지표기간 또는 해당 날짜에 대해 숫자의 수준.

계열의 수준은 절대값과 평균값 또는 상대값으로 모두 표시됩니다. 지표의 특성에 대한 의존성을 감안할 때 절대, 상대 및 평균 값의 동적 시리즈가 작성됩니다. 상대 및 평균 값의 동적 계열은 절대 값의 미분 계열을 기반으로 작성됩니다. 역학의 간격 및 모멘트 시리즈가 있습니다.

동적 간격 시리즈특정 기간 동안 지표의 값을 포함합니다. 간격 시리즈에서 수준을 요약하여 더 긴 기간 동안의 현상 볼륨 또는 소위 누적 합계를 얻을 수 있습니다.

다이나믹 모멘트 시리즈특정 시점(날짜)의 지표 값을 반영합니다. 모멘트 계열에서 연구자는 특정 날짜 사이의 계열 수준의 변화를 반영하여 현상의 차이에만 관심을 가질 수 있습니다. 여기에서 수준의 합은 실제 내용이 없기 때문입니다. 누적 합계는 여기에서 계산되지 않습니다.

시계열의 올바른 구성을 위한 가장 중요한 조건은 다음과 같습니다. 시리즈 수준 비교 가능성다른 기간과 관련이 있습니다. 수준은 균질한 양으로 제시되어야 하며 현상의 다양한 부분에 대한 동일한 완전성이 있어야 합니다.

실제 역학의 왜곡을 피하기 위해 시계열의 통계 분석에 선행하는 통계 연구(시계열 종료)에서 예비 계산이 수행됩니다. 아래에 역학 행 닫기두 개 이상의 행으로 구성된 한 행으로 조합을 이해하는 것이 일반적이며, 그 수준은 다른 방법론에 따라 계산되거나 영토 경계 등에 해당하지 않습니다. 일련의 역학을 닫는 것은 일련의 역학 수준의 비호환성을 제거하는 공통 기반으로 일련의 역학의 절대 수준을 감소시키는 것을 의미할 수도 있습니다.

25. 일련의 역학, 계수, 성장률 및 성장률의 비교 가능성 개념.

역학 시리즈- 이들은 시간에 따른 자연 및 사회 현상의 발전을 특성화하는 일련의 통계 지표입니다. 러시아 국가 통계 위원회에서 발행한 통계 컬렉션에는 많은 시계열이 표 형식으로 포함되어 있습니다. 일련의 역학을 통해 연구된 현상의 발전 패턴을 드러낼 수 있습니다.

시계열에는 두 가지 유형의 지표가 있습니다. 시간 표시기(년, 분기, 월 등) 또는 시점(연초, 매월 초 등). 행 수준 표시기. 시계열 수준의 지표는 절대값(톤 또는 루블 단위 생산), 상대 값(도시 인구 비율(%)) 및 평균 값(연도별 산업 근로자의 평균 임금 등)으로 표시됩니다. .). 표 형식에서 시계열에는 두 개의 열 또는 두 개의 행이 있습니다.

시계열을 올바르게 구성하려면 다음과 같은 여러 요구 사항을 충족해야 합니다.

  1. 일련의 역학에 대한 모든 지표는 과학적으로 입증되고 신뢰할 수 있어야 합니다.
  2. 일련의 역학의 지표는 시간, ᴛ.ᴇ에서 비교할 수 있어야 합니다. 동일한 기간 또는 동일한 날짜에 대해 계산되어야 합니다.
  3. 여러 역학의 지표는 영토 전체에서 비교할 수 있어야합니다.
  4. 일련의 역학 지표는 내용 면에서 비교할 수 있어야 합니다. ᴛ.ᴇ. 동일한 방식으로 단일 방법론에 따라 계산됩니다.
  5. 일련의 역동성에 대한 지표는 고려되는 농장의 범위에 걸쳐 비교할 수 있어야 합니다. 일련의 역학에 대한 모든 지표는 동일한 측정 단위로 제공되어야 합니다.

통계 지표는 일정 기간 동안 연구 중인 프로세스의 결과 또는 특정 시점(ᴛ.ᴇ)에서 연구 중인 현상의 상태를 특성화할 수 있습니다. 표시기는 간격(주기적) 및 일시적입니다. 따라서 처음에 일련의 역학은 간격 또는 모멘트입니다. 모멘트 시리즈의 역동성은 차례로 동일하거나 동일하지 않은 시간 간격으로 나타납니다.

역학의 초기 시리즈는 일련의 평균값과 일련의 상대값(체인 및 베이스)으로 변환됩니다. 이러한 시계열을 파생 시계열이라고 합니다.

일련의 역학의 유형에 따라 일련의 역학에서 평균 수준을 계산하는 방법이 다릅니다. 예를 사용하여 시계열의 유형과 평균 수준을 계산하는 공식을 고려하십시오.

절대 이득 (△y) 시리즈의 후속 수준이 이전 수준(3열 - 체인 절대 증분) 또는 초기 수준(4열 - 기본 절대 증분)과 비교하여 변경된 단위 수를 표시합니다. 계산 공식은 다음과 같이 작성할 수 있습니다.

시리즈의 절대 값이 감소하면 각각 "감소", "감소"가 발생합니다.

절대 성장률은 예를 들어 1998년 ᴦ을 나타냅니다. 제품 "A"의 생산량은 1997년에 비해 증가했습니다 ᴦ. 4,000톤, 1994년 대비 ᴦ. - 34,000톤까지; 다른 해에 대해서는 표를 참조하십시오. 11.5g
ref.rf에서 호스팅
3과 4.

성장 인자시리즈의 수준이 이전 수준(5열 - 연쇄 성장 또는 감소 요인) 또는 초기 수준(6열 - 기본 성장 또는 감소 요인)과 비교하여 몇 배나 변경되었는지 보여줍니다. 계산 공식은 다음과 같이 작성할 수 있습니다.

성장률시리즈의 다음 수준이 이전 수준(7열 - 연쇄 성장률) 또는 초기 수준(8열 - 기본 성장률)과 비교하여 몇 퍼센트인지 표시합니다. 계산 공식은 다음과 같이 작성할 수 있습니다.

예를 들어, 1997년 ᴦ. 1996년 대비 제품 "A"의 생산량 ᴦ. 105.5%(

성장률보고 기간의 수준이 이전 수준(9열 - 사슬 성장률) 또는 초기 수준(10열 - 기본 성장률)과 비교하여 몇 퍼센트 증가했는지 보여줍니다. 계산 공식은 다음과 같이 작성할 수 있습니다.

T pr \u003d T p - 100% 또는 T pr \u003d 절대 증가/이전 기간의 수준 * 100%

예를 들어, 1996년 ᴦ. 1995년에 비해 ᴦ. 제품 "A"는 1994 ᴦ에 비해 3.8%(103.8% - 100%) 또는 (8:210)x100% 더 많이 생산되었습니다. - 9%(109% - 100%).

시리즈의 절대 수준이 감소하면 비율은 100% 미만이 되므로 감소 비율(마이너스 부호가 있는 성장률)이 있습니다.

1% 증가의 절대값(그.
ref.rf에서 호스팅
11) 이전 기간의 수준이 1% 증가하기 위해 주어진 기간에 얼마나 많은 단위를 생산해야 하는지를 나타냅니다. 이 예에서는 1995 ᴦ. 2.0 천 톤을 생산해야했고 1998 년에 ᴦ. - 230만 톤, ᴛ.ᴇ. 훨씬 더 큰.

1% 성장의 절대값의 크기를 결정하는 두 가지 방법이 있습니다.

§ 이전 기간의 수준을 100으로 나눈 값

§ 체인 절대 증분을 해당 체인 성장률로 나눈 값.

1% 증가의 절대값 =

역학에서는 특히 장기간에 걸쳐 증가 또는 감소하는 각 백분율의 내용과 함께 성장률을 공동으로 분석하는 것이 중요합니다.

시계열 분석을 위해 고려한 방법론은 절대값(t, 천 루블, 직원 수 등)으로 표현되는 시계열과 시계열에 모두 적용 가능합니다. 이는 상대적 지표(스크랩의 %, 석탄의 회분 함량 % 등) 또는 평균 값(c/ha의 평균 수확량, 평균 급여 등)으로 표시됩니다.

이전 또는 초기 수준과 비교하여 각 연도에 대해 계산된 고려 분석 지표와 함께 시계열을 분석할 때 해당 기간의 평균 분석 지표를 계산하는 것이 매우 중요합니다. 시리즈의 평균 수준, 평균 연간 절대 증가 (감소) 및 평균 연간 성장률 및 성장률 .

일련의 역학의 평균 수준을 계산하는 방법은 위에서 논의되었습니다. 우리가 고려하고 있는 역학의 간격 시리즈에서 시리즈의 평균 수준은 단순 산술 평균의 공식으로 계산됩니다.

1994-1998년 제품의 평균 연간 생산량. 218.4천 톤에 달했다.

평균 연간 절대 증가는 또한 산술 평균의 공식으로 계산됩니다

표준 편차 - 개념 및 유형. 2017년, 2018년 "표준 편차" 범주의 분류 및 특징.

표준 편차는 대화나 프레젠테이션에서 성공적으로 망쳐 놓은 사람들의 프로필을 높이는 기업 세계의 통계 용어 중 하나이며, 그것이 무엇인지 모르지만 당황하는 사람들에게는 모호한 오해를 남깁니다. 물어보기. 사실, 대부분의 관리자는 표준 편차의 개념을 이해하지 못하고 있으며, 당신이 그들 중 하나라면 거짓말을 그만둘 때입니다. 오늘 기사에서는 이 과소 평가된 통계가 작업 중인 데이터를 더 잘 이해하는 데 어떻게 도움이 되는지 보여 드리겠습니다.

표준 편차는 무엇을 측정합니까?

당신이 두 가게의 주인이라고 상상해보십시오. 그리고 손실을 피하기 위해서는 주식 잔고를 명확하게 통제하는 것이 중요합니다. 누가 최고의 주식 관리자인지 알아보기 위해 지난 6주 동안의 주식을 분석하기로 결정합니다. 두 매장의 평균 주간 재고 비용은 거의 동일하며 약 32개의 기존 단위입니다. 언뜻보기에 주식의 평균 가치는 두 관리자가 같은 방식으로 일하는 것을 보여줍니다.

하지만 2호점의 활동을 자세히 살펴보면 평균값은 맞지만 재고변동성은 매우 높다(10~58달러). 따라서 평균이 항상 데이터를 정확하게 추정하는 것은 아니라는 결론을 내릴 수 있습니다. 여기에서 표준편차가 나옵니다.

표준 편차는 값이 평균에 대해 어떻게 분포되어 있는지 보여줍니다. 즉, 유출수가 매주 얼마나 큰지 이해할 수 있습니다.

이 예에서는 Excel 함수 STDEV를 사용하여 평균과 함께 표준 편차를 계산했습니다.

첫 번째 관리자의 경우 표준 편차가 2였습니다. 이것은 표본의 각 값이 평균에서 평균 2만큼 벗어남을 알려줍니다. 좋은가요? 다른 각도에서 질문을 살펴보겠습니다. 표준 편차가 0이면 샘플의 각 값이 평균 값(이 경우 32.2)과 동일하다는 것을 알 수 있습니다. 예를 들어, 2의 표준 편차는 0과 크게 다르지 않아 대부분의 값이 평균에 가깝다는 것을 나타냅니다. 표준 편차가 0에 가까울수록 평균이 더 신뢰할 수 있습니다. 또한 0에 가까운 표준 편차는 데이터의 변동성이 거의 없음을 나타냅니다. 즉, 표준 편차가 2인 싱크 값은 첫 번째 관리자의 놀라운 일관성을 나타냅니다.

두 번째 매장의 경우 표준편차는 18.9였다. 즉, 유출의 비용은 주별로 평균 값에서 평균 18.9만큼 벗어납니다. 미친 확산! 표준편차가 0에서 멀어질수록 평균의 정확도가 떨어집니다. 우리의 경우 18.9라는 숫자는 평균 값(주당 $32.8)을 단순히 신뢰할 수 없음을 나타냅니다. 또한 주간 유출수가 매우 가변적임을 알려줍니다.

이것은 한 마디로 표준편차의 개념입니다. 다른 중요한 통계 측정치(Mode, Median…)에 대한 통찰력을 제공하지는 않지만 실제로 표준 편차는 대부분의 통계 계산에서 중요한 역할을 합니다. 표준 편차의 원리를 이해하면 활동에 있는 많은 프로세스의 본질을 밝힐 수 있습니다.

표준 편차를 계산하는 방법?

이제 우리는 표준 편차 수치가 무엇을 말하는지 압니다. 어떻게 계산하는지 봅시다.

10부터 70까지의 데이터 세트를 10씩 증가시킨다고 가정해 보십시오. 보시다시피, H2 셀(주황색)의 STDEV 함수를 사용하여 이미 표준 편차를 계산했습니다.

다음은 Excel이 21.6에 도달하기 위해 취하는 단계입니다.

모든 계산은 더 나은 이해를 위해 시각화되었습니다. 실제로 Excel에서는 계산이 즉각적으로 이루어지므로 모든 단계가 뒤에서 그대로 유지됩니다.

Excel은 먼저 표본의 평균을 찾습니다. 우리의 경우 평균은 40으로 밝혀졌으며 다음 단계의 각 샘플 값에서 뺍니다. 각각의 결과 차이는 제곱되어 합산됩니다. 합은 2800이며 샘플 요소 수에서 1을 빼야 합니다. 요소가 7개이므로 2800을 6으로 나누어야 합니다. 결과에서 제곱근을 찾습니다. 이 그림 표준편차가 됩니다.

시각화를 사용하여 표준 편차를 계산하는 원리에 대해 완전히 명확하지 않은 사람들을 위해 이 값을 찾는 수학적 해석을 제공합니다.

Excel의 표준 편차 계산 기능

Excel에는 여러 종류의 표준 편차 수식이 있습니다. =STDEV를 입력하면 직접 확인할 수 있습니다.

STDEV.V 및 STDEV.G 함수(목록의 첫 번째 및 두 번째 함수)는 이전 버전과의 호환성을 위해 유지되었던 STDEV 및 STDEV(목록의 다섯 번째 및 여섯 번째 함수) 기능을 각각 복제합니다. 엑셀 버전.

일반적으로 결말의 차이 In 및. G 함수는 표본 또는 모집단의 표준 편차를 계산하는 원리를 나타냅니다. 이 두 어레이의 차이점은 이전 어레이에서 이미 설명했습니다.

STDEV 및 STDEVPA 함수(목록의 세 번째 및 네 번째 함수)의 특징은 배열의 표준 편차를 계산할 때 논리 값과 텍스트 값이 고려된다는 것입니다. Text와 true boolean은 1, false boolean은 0입니다. 이 두 함수가 필요한 상황을 상상하기 어렵기 때문에 무시해도 된다고 생각합니다.

표준 편차는 기술 통계의 변동성을 나타내는 고전적인 지표입니다.

표준 편차, 표준 편차, RMS, 표본 표준 편차(영어 표준 편차, STD, STDev)는 기술 통계에서 분산의 매우 일반적인 척도입니다. 하지만, 왜냐하면 기술적 분석은 통계와 유사하며, 이 지표는 기술적 분석에서 시간 경과에 따른 분석된 상품 가격의 분산 정도를 감지하는 데 사용할 수 있고 사용해야 합니다. 그리스 기호 시그마 "σ"로 표시됩니다.

표준 편차를 사용할 수 있는 기회가 있다는 사실에 대해 Karl Gauss와 Pearson에게 감사드립니다.

사용 기술 분석의 표준 편차, 우리는 이것을 돌린다 "산란 지수" 안에 "변동성 지표“의미는 유지하되 용어를 바꾸는 것.

표준편차란?

그러나 중간 보조 계산 외에도 표준 편차는 자체 계산에 매우 적합합니다.및 기술적 분석의 응용. 우리 잡지 우엉의 적극적인 독자가 언급했듯이 " 국내 딜링센터의 표준지표에 RMS가 포함되지 않은 이유를 아직도 모르겠다.«.

진짜, 표준 편차는 고전적이고 "순수한" 방식으로 기기의 변동성을 측정할 수 있습니다.. 그러나 불행히도 이 지표는 증권 분석에서 그렇게 일반적이지 않습니다.

표준편차 적용하기

표준 편차를 수동으로 계산하는 것은 그다지 흥미롭지 않습니다.그러나 경험에 유용합니다. 표준편차는 표현될 수 있다공식 STD=√[(∑(x-x ) 2)/n] , 샘플 항목과 평균 간의 차이 제곱근을 샘플의 항목 수로 나눈 값처럼 들립니다.

표본의 요소 수가 30을 초과하면 근 아래 분수의 분모는 n-1 값을 취합니다. 그렇지 않으면 n이 사용됩니다.

단계별로 표준편차 계산:

  1. 데이터 샘플의 산술 평균을 계산합니다.
  2. 샘플의 각 요소에서 이 평균을 뺍니다.
  3. 모든 결과 차이는 제곱됩니다.
  4. 모든 결과 제곱의 합
  5. 결과 합계를 샘플의 요소 수로 나눕니다(또는 n>30인 경우 n-1).
  6. 결과 몫의 제곱근을 계산합니다( 분산)

지침

특성을 나타내는 여러 숫자 또는 균질한 양이 있게 하십시오. 예를 들어, 측정 결과, 칭량, 통계적 관찰 등 제시된 모든 양은 동일한 측정으로 측정되어야 합니다. 표준 편차를 찾으려면 다음을 수행하십시오.

모든 숫자의 산술 평균을 결정합니다. 모든 숫자를 더하고 합계를 총 숫자로 나눕니다.

숫자의 분산(산란) 결정: 이전에 발견된 편차의 제곱을 더하고 결과 합계를 숫자의 수로 나눕니다.

병동에는 7명의 환자가 있고 체온은 34도, 35도, 36도, 37도, 38도, 39도, 40도입니다.

평균에서 평균 편차를 결정해야 합니다.
해결책:
"와드에서": (34+35+36+37+38+39+40)/7=37ºС;

평균으로부터의 온도 편차(이 경우 정상값): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, 결과: -3, -2, -1, 0, 1, 2, 3(ºC);

이전에 얻은 숫자의 합을 숫자로 나눕니다. 계산의 정확성을 위해 계산기를 사용하는 것이 좋습니다. 나눗셈의 결과는 summands의 산술 평균입니다.

계산의 모든 단계에 세심한 주의를 기울이십시오. 계산 중 하나 이상에서 오류가 발생하면 최종 지표가 잘못되기 때문입니다. 각 단계에서 수신된 계산을 확인합니다. 산술 평균은 숫자의 합과 동일한 미터를 갖습니다. 즉, 평균 출석을 결정하면 모든 지표가 "사람"이 됩니다.

이 계산 방법은 수학 및 통계 계산에만 사용됩니다. 예를 들어, 컴퓨터 과학의 산술 평균은 계산 알고리즘이 다릅니다. 산술 평균은 매우 조건부 지표입니다. 요인이나 지표가 하나만 있는 경우 이벤트의 확률을 보여줍니다. 가장 심층적인 분석을 위해서는 많은 요소를 고려해야 합니다. 이를 위해보다 일반적인 수량 계산이 사용됩니다.

산술평균은 중심경향의 척도 중 하나로 수학과 통계계산에 널리 사용된다. 여러 값의 산술 평균을 찾는 것은 매우 간단하지만 각 작업에는 고유한 뉘앙스가 있으며 정확한 계산을 수행하기 위해 알아야 할 뉘앙스가 있습니다.

그러한 실험의 정량적 결과.

산술 평균을 찾는 방법

평균 찾기 산수숫자 배열의 경우 이러한 값의 대수적 합을 결정하는 것으로 시작해야 합니다. 예를 들어, 배열에 숫자 23, 43, 10, 74 및 34가 포함된 경우 대수 합은 184가 됩니다. 쓸 때 산술 평균은 문자 μ(mu) 또는 x(막대가 있는 x)로 표시됩니다. . 다음으로, 대수 합을 배열의 숫자 수로 나누어야 합니다. 이 예에서는 5개의 숫자가 있으므로 산술 평균은 184/5가 되고 36.8이 됩니다.

음수 작업의 특징

배열에 포함된 경우 음수, 그런 다음 산술 평균을 찾는 것은 유사한 알고리즘에 따라 발생합니다. 프로그래밍 환경에서 계산할 때나 작업에 추가 조건이 있는 경우에만 차이가 있습니다. 이러한 경우 다음을 사용하여 숫자의 산술 평균을 구하면 다른 징후세 단계로 요약됩니다.

1. 표준 방법으로 공통 산술 평균을 구하는 것
2. 음수의 산술 평균 찾기.
3. 양수의 산술 평균 계산.

각 작업의 응답은 쉼표로 구분하여 작성됩니다.

자연 및 소수

숫자 배열이 표시되는 경우 소수, 정수의 산술평균을 구하는 방법에 따라 해가 나오지만, 답의 정확성을 위한 문제의 요구사항에 따라 결과가 줄어든다.

자연 분수로 작업할 때 배열의 숫자 수를 곱한 공통 분모로 줄여야 합니다. 답의 분자는 원래 분수 요소의 주어진 분자의 합이 됩니다.

$X$. 먼저 다음 정의를 상기해 보겠습니다.

정의 1

인구-- 주어진 유형의 무작위 변수 하나를 연구할 때 변경되지 않은 조건에서 수행되는 무작위 변수의 특정 값을 얻기 위해 관찰이 수행되는 주어진 유형의 무작위로 선택된 개체 세트.

정의 2

일반 분산-- 평균값에서 일반 인구 변이 값의 제곱 편차의 산술 평균.

변형 $x_1,\ x_2,\dots ,x_k$의 값이 각각 $n_1,\n_2,\dots,n_k$의 빈도를 갖도록 하십시오. 그런 다음 일반 분산은 다음 공식으로 계산됩니다.

특별한 경우를 생각해보자. 모든 변형 $x_1,\ x_2,\dots ,x_k$를 구별하도록 합니다. 이 경우 $n_1,\n_2,\dots,n_k=1$입니다. 이 경우 일반 분산은 다음 공식으로 계산됩니다.

또한 이 개념과 관련이 있는 것은 일반 표준 편차의 개념입니다.

정의 3

일반 표준 편차

\[(\sigma )_r=\sqrt(D_r)\]

표본 분산

임의의 변수 $X$에 대한 샘플 세트가 주어집니다. 먼저 다음 정의를 상기해 보겠습니다.

정의 4

표본 모집단 -- 일반 모집단에서 선택한 개체의 일부입니다.

정의 5

표본 분산-- 평균 산술 값샘플링 옵션.

변형 $x_1,\ x_2,\dots ,x_k$의 값이 각각 $n_1,\n_2,\dots,n_k$의 빈도를 갖도록 하십시오. 그런 다음 표본 분산은 다음 공식으로 계산됩니다.

특별한 경우를 생각해보자. 모든 변형 $x_1,\ x_2,\dots ,x_k$를 구별하도록 합니다. 이 경우 $n_1,\n_2,\dots,n_k=1$입니다. 이 경우 표본 분산은 다음 공식으로 계산됩니다.

이 개념과 관련하여 표본 표준 편차의 개념도 있습니다.

정의 6

표본 표준편차-- 일반 분산의 제곱근:

\[(\sigma )_v=\sqrt(D_v)\]

수정된 분산

수정된 분산 $S^2$를 찾으려면 샘플 분산에 분수 $\frac(n)(n-1)$를 곱해야 합니다.

이 개념은 다음 공식으로 구하는 수정된 표준 편차의 개념과도 관련이 있습니다.

변이의 값이 이산적이지 않고 구간인 경우 일반 분산 또는 표본 분산을 계산하는 공식에서 $x_i$의 값은 $가 있는 구간의 중간 값으로 간주됩니다. x_i.$가 속한

분산과 표준편차를 찾는 문제의 예

실시예 1

표본 모집단은 다음 분포표에 의해 제공됩니다.

그림 1.

이를 위해 표본 분산, 표본 표준 편차, 수정된 분산 및 수정된 표준 편차를 찾으십시오.

이 문제를 해결하기 위해 먼저 계산 테이블을 만듭니다.

그림 2.

테이블의 $\overline(x_v)$(샘플 평균) 값은 다음 공식으로 찾을 수 있습니다.

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(305)(20)=15.25\]

다음 공식을 사용하여 표본 분산을 찾습니다.

샘플 표준 편차:

\[(\sigma )_v=\sqrt(D_v)\약 5,12\]

수정된 편차:

\[(S^2=\frac(n)(n-1)D)_v=\frac(20)(19)\cdot 26.1875\약 27.57\]

수정된 표준 편차.