메뉴
무료로
등록
 /  피부염/ 심리학 사례에서의 회귀 분석. 수학적 통계 방법. 회귀 분석

심리학 사례의 회귀 분석. 수학적 통계 방법. 회귀 분석

회귀 분석은 연구 대상 특성 간의 확률적 의존성에 대한 분석적 표현을 설정하는 방법입니다. 회귀 방정식은 평균이 어떻게 변하는지 보여줍니다. ~에무엇이든 변경할 때 엑스 , 다음과 같은 형식을 갖습니다.

어디 y -종속 변수(항상 동일함)

엑스 - 독립 변수(요인)(여러 개가 있을 수 있음)

독립변수가 하나만 있는 경우 단순회귀분석이다. 여러 개가 있는 경우( 2), 그러한 분석을 다요인적 분석이라고 합니다.

회귀 분석은 두 가지 주요 문제를 해결합니다.

    회귀 방정식을 구성합니다. 즉, 결과 지표와 독립 요인 간의 관계 유형 찾기 엑스 1 , 엑스 2 , …, 엑스 N .

    결과 방정식의 중요성 평가, 즉 선택된 요인 특성이 특성의 변화를 얼마나 설명하는지 결정 유.

회귀 분석은 주로 계획 수립 및 규제 프레임워크 개발에 사용됩니다.

분석된 특성들 사이에 관계가 있는지에 대한 질문에만 대답하는 상관분석과 달리 회귀분석은 정형화된 표현도 제공합니다. 또한 상관 분석이 요인 간의 관계를 연구하는 경우 회귀 분석은 일방적 종속성을 연구합니다. 요인 특성의 변화가 유효 특성에 어떻게 영향을 미치는지 보여주는 연결입니다.

회귀 분석은 가장 발전된 수학적 통계 방법 중 하나입니다. 엄밀히 말하면, 회귀 분석을 구현하려면 여러 가지 특별한 요구 사항을 충족해야 합니다(특히, 엑스,엑스 2 ,...,엑스 N ;와이일정한 분산을 갖는 독립적인 정규 분포 확률 변수여야 합니다. 안에 실생활회귀 분석 및 상관 분석 요구 사항을 엄격하게 준수하는 경우는 매우 드물지만 이 두 방법 모두 경제 연구에서는 매우 일반적입니다. 경제학의 종속성은 직접적일 뿐만 아니라 역적이고 비선형적일 수도 있습니다. 회귀 모델은 종속성이 있는 경우 구축할 수 있지만 다변량 분석에서는 다음 형식의 선형 모델만 사용됩니다.

회귀 방정식은 일반적으로 최소 제곱법을 사용하여 구성되며, 그 본질은 계산된 값에서 결과 특성의 실제 값의 제곱 편차의 합을 최소화하는 것입니다. 즉:

어디 티-관찰 횟수;

제이 =a+b 1 엑스 1 제이 + 비 2 엑스 2 제이 + ... +b N 엑스 N 제이 - 결과 요소의 계산된 값입니다.

개인용 컴퓨터용 분석 패키지나 특수 금융 계산기를 사용하여 회귀 계수를 결정하는 것이 좋습니다. 가장 간단한 경우, 다음 형식의 1-요인 선형 회귀 방정식의 회귀 계수는 다음과 같습니다. y = a + bx다음 공식을 사용하여 찾을 수 있습니다.

클러스터 분석

군집 분석은 요소가 다양한 특성으로 특징지어지는 모집단을 그룹화(군집화)하기 위한 다차원 분석 방법 중 하나입니다. 각 특성의 값은 특성의 다차원 공간에서 연구 중인 인구의 각 단위의 좌표 역할을 합니다. 여러 지표의 값으로 특징지어지는 각 관찰은 이러한 지표 공간의 한 점으로 표현될 수 있으며, 그 값은 다차원 공간에서 좌표로 간주됩니다. 점 사이의 거리 아르 자형그리고 와 함께 케이좌표는 다음과 같이 정의됩니다.

군집화의 주요 기준은 군집 간의 차이가 동일한 군집에 할당된 관측치 간의 차이보다 더 중요해야 한다는 것입니다. 다차원 공간에서는 다음과 같은 불평등이 관찰되어야 합니다.

어디 아르 자형 1, 2 - 클러스터 1과 2 사이의 거리입니다.

회귀 분석 절차와 마찬가지로 클러스터링 절차도 상당히 노동 집약적이므로 컴퓨터에서 수행하는 것이 좋습니다.

회귀 분석-- 측정된 데이터를 모델링하고 그 특성을 연구하는 방법. 데이터는 종속변수(반응변수)와 독립변수(설명변수)의 값 쌍으로 구성됩니다. 회귀 모델은 독립 변수와 추가된 확률 변수가 있는 매개 변수의 함수입니다.

상관 분석과 회귀 분석은 수학적 통계와 관련된 섹션이며 샘플 데이터를 사용하여 여러 수량의 통계적 의존성을 연구하기 위한 것입니다. 그 중 일부는 무작위입니다. 통계적 의존성을 사용하면 수량은 기능적으로 관련되지 않지만 결합 확률 분포에 의해 무작위 변수로 정의됩니다.

확률변수의 의존성에 대한 연구는 표본 데이터를 기반으로 한 회귀 모델 및 회귀 분석으로 이어집니다. 확률이론과 수학적 통계는 통계적 의존성을 연구하기 위한 도구일 뿐 인과관계를 확립하는 것을 목표로 하지 않습니다. 인과관계에 대한 아이디어와 가설은 연구 중인 현상에 대한 의미 있는 설명을 가능하게 하는 다른 이론에서 가져와야 합니다.

수치 데이터는 일반적으로 서로 명시적(알려진) 또는 암시적(숨겨진) 관계를 갖습니다.

직접 계산 방법, 즉 이전에 알려진 공식을 사용하여 계산한 지표는 명확하게 관련되어 있습니다. 예를 들어 계획 완료율, 수준, 특정 가중치, 금액 편차, 백분율 편차, 성장률, 성장률, 지수 등이 있습니다.

두 번째 유형(암시적)의 연결은 미리 알 수 없습니다. 그러나 복잡한 현상을 관리하기 위해서는 이를 설명하고 예측(예측)할 수 있는 능력이 필요합니다. 따라서 전문가들은 관찰의 도움을 받아 숨겨진 종속성을 식별하고 공식 형식, 즉 현상이나 프로세스를 수학적으로 모델링하기 위해 노력합니다. 그러한 기회 중 하나는 상관 회귀 분석을 통해 제공됩니다.

수학적 모델은 세 가지 일반적인 목적으로 구축되고 사용됩니다.

  • * 설명을 위해;
  • * 예측을 위해;
  • * 운전용.

분석가는 상관관계 및 회귀분석 방법을 사용하여 상관계수를 사용하여 지표 간 연결의 긴밀성을 측정합니다. 이 경우 강도(강함, 약함, 보통 등)가 다르고 방향(직접, 역방향)이 다른 연결이 발견됩니다. 연결이 중요한 것으로 판명되면 회귀 모델 형태로 수학적 표현을 찾아 모델의 통계적 유의성을 평가하는 것이 좋습니다.

회귀 분석은 관측 데이터 간의 암묵적이고 가려진 연결을 식별하기 위한 현대 수학적 통계의 주요 방법이라고 합니다.

회귀분석의 문제 진술은 다음과 같이 공식화된다.

일련의 관찰 결과가 있습니다. 이 세트에서 하나의 열은 나머지 열이 나타내는 객체 및 환경의 매개 변수와 기능적 관계를 설정하는 데 필요한 표시기에 해당합니다. 필수: 지표와 요인 사이의 정량적 관계를 설정합니다. 이 경우 회귀 분석의 문제는 사용 가능한 실험 데이터를 가장 잘 설명하는 함수적 종속성 y = f(x2, x3, ..., xт)를 식별하는 작업으로 이해됩니다.

가정:

관찰 횟수는 요인과 그 관계에 관한 통계적 패턴을 입증하기에 충분합니다.

처리된 데이터에는 측정 오류 및 설명되지 않은 무작위 요인의 영향으로 인해 일부 오류(노이즈)가 포함되어 있습니다.

관찰 결과 매트릭스는 연구 시작 전에 사용할 수 있는 연구 대상 개체에 대한 유일한 정보입니다.

매개변수에 대한 지표의 의존성을 설명하는 함수 f(x2, x3, ..., xт)를 회귀 방정식(함수)이라고 합니다. "회귀"(회귀 (라틴어) - 후퇴, 무언가로 돌아가기)라는 용어는 방법 형성 단계에서 해결된 특정 문제 중 하나의 세부 사항과 관련이 있습니다.

회귀 분석 문제에 대한 솔루션을 여러 단계로 나누는 것이 좋습니다.

데이터 전처리;

회귀 방정식의 유형을 선택합니다.

회귀 방정식 계수 계산;

관찰 결과에 대해 구성된 함수의 적절성을 확인합니다.

전처리에는 데이터 매트릭스 표준화, 상관 계수 계산, 유의성 확인 및 고려 사항에서 중요하지 않은 매개 변수 제외가 포함됩니다.

회귀 방정식 유형 선택 데이터를 가장 잘 설명하는 함수 관계를 결정하는 작업에는 여러 가지 근본적인 어려움을 극복하는 작업이 포함됩니다. 일반적으로 표준화된 데이터의 경우 매개변수에 대한 지표의 기능적 의존성은 다음과 같이 나타낼 수 있습니다.

y = f(x1, x2, …, xm) + e

여기서 f는 결정될 이전에 알려지지 않은 함수입니다.

e - 데이터 근사 오류.

이 방정식을 일반적으로 표본 회귀 방정식이라고 합니다. 이 방정식은 지표의 변동과 요인의 변동 사이의 관계를 특성화합니다. 그리고 상관관계 측정은 요인의 변동과 관련된 지표의 변동 비율을 측정합니다. 즉, 지표와 요인 사이의 상관관계는 그 수준 간의 연관성으로 해석될 수 없으며, 회귀분석은 지표 생성에 있어서 요인의 역할을 설명하지 못한다.

또 다른 특징은 각 요소가 지표에 미치는 영향 정도를 평가하는 것입니다. 회귀 방정식은 지표에 대한 각 요소의 개별 영향에 대한 평가를 제공하지 않습니다. 이러한 평가는 다른 모든 요소가 연구 중인 요소와 관련이 없는 경우에만 가능합니다. 연구 중인 요인이 지표에 영향을 미치는 다른 요인과 관련되어 있는 경우 결과는 다음과 같습니다. 혼합된 특성요인 영향. 이 특성에는 요인의 직접적인 영향과 다른 요인과의 연결 및 지표에 대한 영향을 통해 발휘되는 간접적인 영향이 모두 포함됩니다.

지표와 약하게 관련되어 있지만 다른 요소와 밀접하게 관련된 요소를 회귀 방정식에 포함하는 것은 권장되지 않습니다. 기능적으로 서로 관련된 요소는 방정식에 포함되지 않습니다(상관 계수는 1입니다). 이러한 요소를 포함하면 회귀 계수를 추정하기 위한 방정식 시스템이 변형되고 해의 불확실성이 발생합니다.

오류 e가 어떤 의미에서 최소화되도록 함수 f를 선택해야 합니다. 기능적 연결을 선택하기 위해서는 함수 f가 어떤 클래스에 속할 수 있는지에 대한 가설을 미리 제시한 후 이 클래스에서 "가장 좋은" 함수를 선택합니다. 선택한 기능 클래스에는 어느 정도 "부드러움"이 있어야 합니다. 인수 값의 "작은" 변경은 함수 값의 "작은" 변경을 유발해야 합니다.

실제로 널리 사용되는 특별한 경우는 1차 다항식 또는 선형 회귀 방정식입니다.

기능적 의존성 유형을 선택하려면 다음 접근 방식을 권장할 수 있습니다.

지표 값이 있는 포인트는 매개변수 공간에 그래픽으로 표시됩니다. 많은 수의 매개변수를 사용하면 각 매개변수에 대한 점을 구성하여 값의 2차원 분포를 얻을 수 있습니다.

점의 위치를 ​​기반으로 하고 지표와 개체 매개변수 간의 관계의 본질에 대한 분석을 기반으로 대략적인 회귀 유형 또는 가능한 변형에 대한 결론이 내려집니다.

매개변수를 계산한 후 근사의 품질이 평가됩니다. 계산된 값과 실제 값 사이의 유사성 정도를 평가합니다.

전체 작업 영역에서 계산된 값과 실제 값이 비슷하면 회귀 분석 문제가 해결된 것으로 간주할 수 있습니다. 그렇지 않으면 다른 유형의 다항식이나 주기 함수와 같은 다른 분석 함수를 선택해 볼 수 있습니다.

회귀 방정식 계수 계산

미지수의 수가 항상 방정식의 수보다 크기 때문에 사용 가능한 데이터를 기반으로 방정식 시스템을 명확하게 푸는 것은 불가능합니다. 이 문제를 극복하려면 추가적인 가정이 필요합니다. 상식제안: 데이터 근사에서 최소 오류를 보장하는 방식으로 다항식의 계수를 선택하는 것이 좋습니다. 근사 오류를 평가하기 위해 다양한 측정값을 사용할 수 있습니다. 이러한 척도로는 평균 제곱근 오차가 널리 사용됩니다. 이를 토대로 개발된 특별한 방법회귀 방정식의 계수 추정 - 최소 제곱법(OLS). 이 방법을 사용하면 정규 분포 옵션 하에서 회귀 방정식의 알 수 없는 계수에 대한 최대 우도 추정을 얻을 수 있지만 다른 요인 분포에도 사용할 수 있습니다.

MNC는 다음을 기반으로합니다. 다음 조항:

오류와 요인의 값은 독립적이므로 상관 관계가 없습니다. 간섭을 생성하는 메커니즘은 요소 값을 생성하는 메커니즘과 관련이 없다고 가정합니다.

오류 e의 수학적 기대치는 0과 같아야 합니다(상수 구성 요소는 계수 a0에 포함됨). 즉, 오류는 중심 수량입니다.

오차 분산의 표본 추정치는 최소화되어야 합니다.

선형 모델이 부정확하거나 매개변수가 부정확하게 측정된 경우, 이 경우 최소 제곱법을 사용하면 선택한 표준 편차의 의미에서 선형 모델이 실제 개체를 가장 잘 설명하는 계수 값을 찾을 수 있습니다. 표준.

결과 회귀 방정식의 품질은 지표 관찰 결과와 회귀 방정식에 의해 예측된 값 사이의 근접성 정도에 의해 평가됩니다. 주어진 포인트매개변수 공간. 결과가 비슷하면 회귀 분석 문제가 해결된 것으로 간주할 수 있습니다. 그렇지 않으면 회귀 방정식을 변경하고 계산을 반복하여 매개변수를 추정해야 합니다.

지표가 여러 개인 경우 회귀 분석 문제는 각 지표에 대해 독립적으로 해결됩니다.

회귀 방정식의 본질을 분석할 때 다음 사항에 유의해야 합니다. 고려 된 접근 방식은 계수에 대한 별도의 (독립적) 평가를 제공하지 않습니다. 한 계수 값의 변경은 다른 계수 값의 변경을 수반합니다. 획득된 계수는 지표 값에 대한 해당 매개변수의 기여로 간주되어서는 안 됩니다. 회귀 방정식은 사용 가능한 데이터에 대한 훌륭한 분석 설명일 뿐이며 매개변수와 지표 간의 관계를 설명하는 법칙은 아닙니다. 이 방정식은 주어진 매개변수 변화 범위에서 지표 값을 계산하는 데 사용됩니다. 이 범위 밖의 계산에는 제한적으로 적합합니다. 보간 문제를 해결하는 데 사용할 수 있으며 제한된 범위에서는 외삽에 사용할 수 있습니다.

예측이 부정확한 주요 원인은 회귀선 외삽의 불확실성이 아니라 모델에서 고려되지 않은 요인으로 인한 지표의 상당한 변동입니다. 예측 능력의 한계는 모델에서 고려되지 않은 매개변수의 안정성 조건과 고려된 모델 요인의 영향 특성입니다. 갑자기 변하는 경우 외부 환경, 컴파일된 회귀 방정식은 의미를 잃게 됩니다.

매개변수의 기대값을 회귀식에 대입하여 얻은 예측값은 점 1입니다. 그러한 예측이 실현될 가능성은 무시할 수 있습니다. 예측의 신뢰구간을 결정하는 것이 좋습니다. 지표의 개별 값에 대해 간격은 회귀선 위치의 오류와 이 선에서 개별 값의 편차를 고려해야 합니다.

통계 모델링에서 회귀 분석은 변수 간의 관계를 평가하는 데 사용되는 연구입니다. 이 수학적 방법에는 종속 변수와 하나 이상의 독립 변수 간의 관계에 초점을 맞춘 여러 변수를 모델링하고 분석하는 다른 많은 방법이 포함되어 있습니다. 보다 구체적으로, 회귀 분석은 독립 변수 중 하나가 변경되고 다른 독립 변수는 고정된 상태로 유지되는 경우 종속 변수의 일반적인 값이 어떻게 변경되는지 이해하는 데 도움이 됩니다.

모든 경우에 목표 추정치는 독립 변수의 함수이며 회귀 함수라고 합니다. 회귀 분석에서는 종속 변수의 변화를 확률 분포를 사용하여 설명할 수 있는 회귀 함수로 특성화하는 것도 중요합니다.

회귀 분석 문제

이러한 통계적 연구 방법은 예측에 널리 사용되며 그 활용이 상당한 이점을 가지고 있지만 때로는 환상이나 잘못된 관계로 이어질 수 있으므로 해당 사항에서는 신중하게 사용하는 것이 좋습니다. 예를 들어 상관 관계가 의미하는 것은 아닙니다. 원인.

모수적인 선형 및 최소 제곱 회귀와 같은 회귀 분석을 위해 수많은 방법이 개발되었습니다. 그 핵심은 회귀 함수가 데이터에서 추정되는 유한한 수의 알려지지 않은 매개변수로 정의된다는 것입니다. 비모수적 회귀를 사용하면 해당 함수가 무한 차원일 수 있는 특정 함수 집합 내에 놓이게 됩니다.

통계 연구 방법인 회귀 분석은 실제로 데이터 생성 프로세스의 형태와 그것이 회귀 접근 방식과 어떻게 관련되는지에 따라 달라집니다. 생성되는 데이터 프로세스의 실제 형태는 일반적으로 알 수 없는 숫자이기 때문에 데이터의 회귀 분석은 프로세스에 대한 가정에 어느 정도 의존하는 경우가 많습니다. 이러한 가정은 사용 가능한 데이터가 충분할 경우 테스트할 수 있는 경우도 있습니다. 회귀 모델은 가정이 어느 정도 위반되는 경우에도 유용하지만 효율성이 최고 수준으로 수행되지는 않을 수 있습니다.

더 좁은 의미에서 회귀는 분류에 사용되는 이산형 반응 변수와 달리 연속형 반응 변수의 추정을 구체적으로 나타낼 수 있습니다. 연속 출력 변수의 경우 관련 문제와 구별하기 위해 메트릭 회귀라고도 합니다.

이야기

회귀의 가장 초기 형태는 잘 알려진 최소 제곱법입니다. 이 책은 1805년 Legendre와 1809년 Gauss에 의해 출판되었습니다. Legendre와 Gauss는 천문 관측을 통해 태양 주위의 천체(주로 혜성이지만 나중에 새로 발견된 소행성)의 궤도를 결정하는 문제에 이 방법을 적용했습니다. 가우스 출판 추가 개발 Gauss-Markov 정리의 버전을 포함하여 1821년 최소 제곱 이론.

회귀(regression)라는 용어는 19세기에 프란시스 골턴(Francis Galton)이 생물학적 현상을 설명하기 위해 만들어낸 용어입니다. 그 아이디어는 조상의 키로부터 후손의 키가 정상 평균을 향해 아래쪽으로 회귀하는 경향이 있다는 것입니다. Galton의 경우 회귀는 이러한 생물학적 의미만 가지고 있었지만 나중에 Udney Yoley와 Karl Pearson에 의해 그의 작업이 계속되어 보다 일반적인 통계적 맥락으로 옮겨졌습니다. Yule과 Pearson의 연구에서는 반응 변수와 설명 변수의 결합 분포가 가우스 분포로 가정됩니다. 이 가정은 1922년과 1925년의 논문에서 Fischer에 의해 거부되었습니다. Fisher는 반응 변수의 조건부 분포는 가우스 분포이지만 결합 분포는 그럴 필요가 없다고 제안했습니다. 이런 점에서 피셔의 제안은 1821년 가우스의 공식화에 더 가깝습니다. 1970년 이전에는 회귀분석 결과를 얻는 데 최대 24시간이 걸리는 경우도 있었습니다.

회귀 분석 방법은 계속해서 활발한 연구 분야입니다. 최근 수십 년 동안 강력한 회귀 분석을 위한 새로운 방법이 개발되었습니다. 상관된 반응을 포함하는 회귀; 다양한 유형의 누락 데이터를 수용하는 회귀 방법; 비모수적 회귀; 베이지안 회귀 방법; 예측변수가 오류와 함께 측정되는 회귀; 관찰보다 더 많은 예측 변수를 사용하는 회귀 및 회귀를 통한 원인 및 결과 추론.

회귀 모델

회귀 분석 모델에는 다음 변수가 포함됩니다.

  • 스칼라 또는 벡터일 수 있는 베타로 지정된 알 수 없는 매개변수입니다.
  • 독립변수, X.
  • 종속변수, Y.

회귀 분석이 사용되는 다양한 과학 분야에서는 종속 변수와 독립 변수 대신 서로 다른 용어를 사용하지만 모든 경우 회귀 모델은 Y를 X 및 β의 함수와 연관시킵니다.

근사치는 일반적으로 E(Y | X) = F(X, β)로 작성됩니다. 회귀 분석을 수행하려면 함수 f의 유형을 결정해야 합니다. 덜 일반적으로는 데이터에 의존하지 않는 Y와 X의 관계에 대한 지식을 기반으로 합니다. 그러한 지식을 사용할 수 없는 경우 유연하고 편리한 형식 F가 선택됩니다.

종속변수 Y

이제 알 수 없는 매개변수의 벡터 β의 길이가 k라고 가정하겠습니다. 회귀 분석을 수행하려면 사용자는 종속 변수 Y에 대한 정보를 제공해야 합니다.

  • (Y, X) 형식의 N개 데이터 포인트가 관찰되는 경우, 여기서 N< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
  • 정확히 N = K가 관찰되고 함수 F가 선형인 경우 방정식 Y = F(X, β)는 근사가 아닌 정확하게 풀 수 있습니다. 이는 X가 선형 독립인 한 고유한 해를 갖는 N-미지수(요소 β)를 사용하여 일련의 N-방정식을 푸는 것과 같습니다. F가 비선형인 경우 해가 없거나 많은 해가 존재할 수 있습니다.
  • 가장 일반적인 상황은 N > 데이터 포인트가 관찰되는 경우입니다. 이 경우, 데이터에 가장 적합한 β에 대한 고유한 값을 추정할 수 있는 충분한 정보가 데이터에 있고, 데이터에 대한 적용이 β에서 과결정된 시스템으로 볼 수 있는 회귀 모델이 있습니다.

후자의 경우 회귀 분석은 다음을 위한 도구를 제공합니다.

  • 예를 들어 Y의 측정된 값과 예측된 값 사이의 거리를 최소화하는 알 수 없는 매개변수 β에 대한 솔루션을 찾습니다.
  • 특정 통계적 가정 하에서 회귀 분석은 초과 정보를 사용하여 알려지지 않은 매개변수 β와 종속 변수 Y의 예측 값에 대한 통계 정보를 제공합니다.

필요한 독립 측정 횟수

세 가지 알려지지 않은 매개변수인 β 0 , β 1 및 β 2 가 있는 회귀 모델을 고려하십시오. 실험자가 독립변수 벡터 X의 동일한 값에 대해 10번의 측정을 한다고 가정합니다. 이 경우 회귀 분석은 고유한 값 집합을 생성하지 않습니다. 당신이 할 수 있는 최선의 방법은 평균과 표준 편차종속 변수 Y. 마찬가지로 두 가지를 측정하면 다른 의미 X, 두 개의 알 수 없는 항목에 대해서는 회귀에 충분한 데이터를 얻을 수 있지만 세 개 이상의 알 수 없는 항목에 대해서는 충분한 데이터를 얻을 수 없습니다.

실험자의 측정이 독립 변수 벡터 X의 세 가지 다른 값에서 수행된 경우 회귀 분석은 β의 세 가지 알려지지 않은 매개 변수에 대한 고유한 추정치 세트를 제공합니다.

일반 선형 회귀의 경우 위의 설명은 행렬 X T X가 가역적이라는 요구 사항과 동일합니다.

통계적 가정

측정 횟수 N이 알려지지 않은 매개변수 k 및 측정 오류 ε i의 수보다 큰 경우, 일반적으로 측정에 포함된 초과 정보가 전파되어 알려지지 않은 매개변수에 관한 통계적 예측에 사용됩니다. 이러한 초과 정보를 회귀 자유도라고 합니다.

기본 가정

회귀 분석에 대한 고전적인 가정은 다음과 같습니다.

  • 샘플링은 추론 예측을 대표합니다.
  • 오류 항은 설명 변수에 따라 달라지는 평균이 0인 확률 변수입니다.
  • 독립변수는 오류 없이 측정됩니다.
  • 독립변수(예측변수)로서 선형독립입니다. 즉, 어떤 예측변수도 다른 변수의 선형결합으로 표현할 수 없습니다.
  • 오류는 상관 관계가 없습니다. 즉, 대각선과 0이 아닌 각 요소의 오류 공분산 행렬이 오류 분산입니다.
  • 오차 분산은 관측치 전체에서 일정합니다(동분산성). 그렇지 않은 경우 가중치 최소 제곱법이나 다른 방법을 사용할 수 있습니다.

이것들 충분한 조건최소 제곱 추정기는 필수 속성을 가지고 있습니다. 특히 이러한 가정은 특히 선형 추정기 클래스에서 고려할 때 모수 추정치가 객관적이고 일관되며 효율적이라는 것을 의미합니다. 증거가 조건을 만족하는 경우는 거의 없다는 점에 유의하는 것이 중요합니다. 즉, 가정이 올바르지 않은 경우에도 방법이 사용됩니다. 가정의 변화는 때때로 모델이 얼마나 유용한지를 측정하는 데 사용될 수 있습니다. 이러한 가정 중 상당수는 고급 방법을 사용하면 완화될 수 있습니다. 통계 분석 보고서에는 일반적으로 샘플 데이터에 대한 테스트 분석과 모델의 유용성에 대한 방법론이 포함됩니다.

또한, 변수는 점 위치에서 측정된 값을 참조하는 경우도 있습니다. 통계적 가정을 위반하는 변수에는 공간 추세와 공간 자기상관이 있을 수 있습니다. 지리적 가중 회귀는 이러한 데이터를 다루는 유일한 방법입니다.

선형회귀의 특징은 종속변수인 Yi가 매개변수의 선형결합이라는 점이다. 예를 들어, 단순 선형 회귀는 하나의 독립 변수 x i 와 두 개의 매개변수 β 0 및 β 1 을 사용하여 n-포인트를 모델링합니다.

다중 선형 회귀에는 여러 개의 독립 변수 또는 해당 함수가 있습니다.

모집단에서 무작위 표본을 추출하면 해당 매개변수를 통해 표본 선형 회귀 모델을 얻을 수 있습니다.

이런 측면에서 가장 널리 사용되는 방법은 최소제곱법이다. 잔차 제곱합을 최소화하는 모수 추정치를 얻는 데 사용됩니다. 이 함수의 이러한 종류의 최소화(선형 회귀 분석의 전형적인 형태)는 정규 방정식 세트와 다음 세트로 이어집니다. 선형 방정식모수 추정치를 얻기 위해 해결된 모수를 사용합니다.

모집단 오류가 일반적으로 전파된다는 추가 가정 하에서 연구자는 이러한 표준 오류 추정치를 사용하여 신뢰 구간을 만들고 해당 매개변수에 대한 가설 테스트를 수행할 수 있습니다.

비선형 회귀 분석

함수가 매개변수에 대해 선형이 아닌 예는 반복 절차를 사용하여 제곱합을 최소화해야 함을 나타냅니다. 이로 인해 선형 및 비선형 최소 제곱법 간의 차이를 정의하는 많은 합병증이 발생합니다. 따라서 비선형 방법을 사용할 때 회귀 분석 결과를 예측할 수 없는 경우가 있습니다.

검정력 및 표본 크기 계산

일반적으로 관측치 수와 모델의 독립 변수 수를 비교하는 일관된 방법은 없습니다. 첫 번째 규칙은 Dobra와 Hardin이 제안했으며 N = t^n과 같습니다. 여기서 N은 표본 크기, n은 독립 변수의 수, t는 모델이 다음과 같은 경우 원하는 정확도를 달성하는 데 필요한 관측치의 수입니다. 독립변수는 단 하나. 예를 들어, 연구자는 1000명의 환자(N)가 포함된 데이터 세트를 사용하여 선형 회귀 모델을 구축합니다. 연구자가 선(m)을 정확하게 정의하기 위해 5개의 관측치가 필요하다고 결정한 경우 모델이 지원할 수 있는 최대 독립 변수 수는 4개입니다.

다른 방법

회귀 모델 매개변수는 일반적으로 최소 제곱법을 사용하여 추정되지만 훨씬 덜 자주 사용되는 다른 방법이 있습니다. 예를 들어 다음과 같은 방법이 있습니다.

  • 베이지안 방법(예: 베이지안 선형 회귀)
  • 백분율 오류를 줄이는 것이 더 적절하다고 간주되는 상황에 사용되는 백분율 회귀입니다.
  • 분위수 회귀로 이어지는 이상값이 있는 경우 더욱 강력한 최소 절대 편차입니다.
  • 비모수적 회귀에는 다음이 필요합니다. 많은 분량관찰과 계산.
  • 주어진 입력 공간에서 의미 있는 거리 측정법을 찾기 위해 학습되는 원격 학습 측정법입니다.

소프트웨어

모든 주요 통계 소프트웨어 패키지는 최소 제곱 회귀 분석을 수행합니다. 단순 선형 회귀 분석과 다중 회귀 분석은 일부 계산기뿐만 아니라 일부 스프레드시트 응용 프로그램에서도 사용할 수 있습니다. 많은 통계 소프트웨어 패키지가 다양한 유형의 비모수적 및 로버스트 회귀를 수행할 수 있지만 이러한 방법은 덜 표준화되어 있습니다. 다른 소프트웨어 패키지는 다른 방법을 구현합니다. 전문 회귀 소프트웨어검사 분석 및 신경 영상화와 같은 분야에 사용하기 위해 개발되었습니다.

회귀의 개념. 변수 간의 의존성 엑스그리고 와이다양한 방식으로 설명될 수 있습니다. 특히, 모든 형태의 연결은 일반 방정식으로 표현될 수 있습니다. 와이종속변수로 처리되거나 기능다른 것 - 독립 변수 x라고 함 논쟁. 인수와 함수 사이의 대응 관계는 표, 공식, 그래프 등으로 지정할 수 있습니다. 하나 이상의 인수 변경에 따라 함수를 변경하는 것을 호출합니다. 회귀. 상관 관계를 설명하는 데 사용되는 모든 수단은 내용을 구성합니다. 회귀 분석.

회귀, 상관 방정식 또는 회귀 방정식을 표현하기 위해 경험적 및 이론적으로 계산된 회귀 계열, 회귀선이라고 하는 그래프, 선형 및 비선형 회귀 계수가 사용됩니다.

회귀 지표는 특성의 평균값 변화를 고려하여 양측 상관 관계를 표현합니다. 와이값을 변경할 때 엑스 징후 엑스, 그리고 반대로 특성의 평균값의 변화를 보여줍니다. 엑스변경된 값에 따라 와이 징후 와이. 예외는 시간에 따른 특성의 변화를 보여주는 시계열 또는 시계열입니다. 그러한 계열의 회귀는 일방적입니다.

상관관계에는 다양한 형태와 유형이 있습니다. 과제는 각각의 특정 사례에서 연결 형태를 식별하고 이를 해당 상관 방정식으로 표현하는 것입니다. 이를 통해 예측할 수 있습니다. 가능한 변경하나의 기호 와이다른 알려진 변경 사항을 기반으로 엑스, 첫 번째 상관 관계와 관련이 있습니다.

12.1 선형 회귀

회귀 방정식.상관된 특성을 기반으로 특정 생물학적 개체에 대해 수행된 관찰 결과 엑스그리고 와이, 시스템을 구성하여 평면의 점으로 표현할 수 있습니다. 직사각형 좌표. 그 결과는 다양한 특성 간의 관계의 형태와 근접성을 판단할 수 있는 일종의 분산형 다이어그램입니다. 종종 이 관계는 직선처럼 보이거나 직선으로 근사화될 수 있습니다.

변수 간의 선형 관계 엑스그리고 와이일반 방정식으로 설명됩니다. a, b, c, d,... – 인수 간의 관계를 결정하는 방정식의 매개변수 엑스 1 , x 2 , x 3 , ..., 엑스 그리고 기능.

실제로 가능한 모든 인수가 고려되는 것은 아니지만 가장 간단한 경우에는 몇 가지 인수만 고려됩니다.

선형 회귀 방정식 (1)에서 는 자유 용어이고 매개변수는 직사각형 좌표축을 기준으로 회귀선의 기울기를 결정합니다. 분석 기하학에서는 이 매개변수를 다음과 같이 부릅니다. 경사, 그리고 생체 인식 – 회귀계수. 이 매개변수의 시각적 표현과 회귀선의 위치 와이에 의해 엑스그리고 엑스에 의해 와이직각 좌표계에서는 그림 1을 제공합니다.

쌀. 1 시스템에서 X에 의한 Y 및 Y에 의한 X의 회귀선

직사각형 좌표

회귀선은 그림 1과 같이 서로 상관된 특징들의 산술평균값에 해당하는 O점(,)에서 교차한다. 와이그리고 엑스. 회귀 그래프를 구성할 때, 독립변수 X의 값은 가로축을 따라 그려지고, 종속변수, 즉 함수 Y의 값은 점 O(, )는 변수 간의 완전한(기능적) 관계에 해당합니다. 와이그리고 엑스, 상관계수 . 사이의 연결이 강할수록 와이그리고 엑스, 회귀선이 AB에 가까울수록, 반대로 이러한 양 사이의 연결이 약할수록 회귀선은 AB에서 멀어집니다. 특성 사이에 연결이 없는 경우 회귀선은 서로 직각을 이루며 .

회귀지표는 양측 상관관계를 표현하므로 회귀식 (1)은 다음과 같이 작성되어야 한다.

첫 번째 공식은 특성이 변할 때 평균값을 결정합니다. 엑스측정 단위당, 두 번째 - 속성의 측정 단위 하나를 변경할 때의 평균 값 와이.

회귀계수.회귀계수는 한 특성의 값이 평균적으로 얼마나 되는지 보여줍니다. 와이상관관계가 있는 다른 측정값이 하나만큼 변경되면 변경됩니다. 와이징후 엑스. 이 표시기는 공식에 의해 결정됩니다

값은 다음과 같습니다. 에스수업 간격의 크기를 곱함 λ , 변형 계열이나 상관표에서 찾은 경우.

평균을 계산하지 않고도 회귀계수를 계산할 수 있습니다. 제곱 편차 에스 와이그리고 에스 엑스공식에 따르면

상관 계수를 알 수 없는 경우 회귀 계수는 다음과 같이 결정됩니다.

회귀와 상관계수의 관계.공식 (11.1) (주제 11)과 (12.5)을 비교하면 분자의 값이 동일하며 이는 이러한 지표 간의 연결을 나타냅니다. 이 관계는 평등으로 표현됩니다.

따라서 상관 계수는 계수의 기하 평균과 같습니다. yx그리고 xy. 공식 (6)은 먼저 알려진 회귀 계수 값을 기반으로 허용합니다. yx그리고 xy회귀 계수 결정 아르 자형 xy, 둘째, 이 상관관계 지표 계산의 정확성을 확인합니다. 아르 자형 xy다양한 특성 사이 엑스그리고 와이.

상관 계수와 마찬가지로 회귀 계수는 선형 관계만을 특징으로 하며 양의 관계에는 플러스 기호가, 음의 관계에는 마이너스 기호가 함께 표시됩니다.

선형 회귀 매개변수 결정.편차 제곱의 합은 변형인 것으로 알려져 있습니다. 엑스 평균에서 가장 작은 값이 나옵니다. 즉, 이 정리는 최소 제곱법의 기초를 형성합니다. 선형 회귀에 관하여 [참조 공식 (1)] 이 정리의 요구 사항은 다음과 같은 특정 방정식 시스템에 의해 충족됩니다. 정상:

매개변수에 대한 이러한 방정식의 결합 솔루션 그리고 다음과 같은 결과가 발생합니다.

;

;

, 어디서 그리고.

변수 간 ​​관계의 양방향 특성을 고려 와이그리고 엑스, 매개변수를 결정하는 공식 다음과 같이 표현되어야 합니다.

그리고 . (7)

매개변수 , 또는 회귀 계수는 다음 공식으로 결정됩니다.

경험적 회귀 계열의 구축.존재하는 경우 큰 숫자관찰, 회귀 분석은 경험적 회귀 계열의 구성으로 시작됩니다. 경험적 회귀 시리즈하나의 다양한 특성 값을 계산하여 형성됩니다. 엑스다른 것의 평균값과 상관 관계가 있음 엑스징후 와이. 즉, 경험적 회귀 계열의 구성은 특성 Y와 X의 해당 값에서 그룹 평균을 찾는 것으로 귀결됩니다.

경험적 회귀 계열은 평면 위의 점으로 나타낼 수 있는 숫자의 이중 계열을 말하며, 이 점들을 직선 부분으로 연결하면 경험적 회귀선을 얻을 수 있습니다. 경험적 회귀 계열, 특히 해당 그래프를 회귀선, 다양한 특성 간의 상관 관계의 형태와 근접성에 대한 명확한 아이디어를 제공합니다.

경험적 회귀 계열의 정렬.경험적 회귀 계열의 그래프는 일반적으로 매끄럽지 않고 파선으로 나타납니다. 이는 상관 특성의 변동성의 일반적인 패턴을 결정하는 주요 이유와 함께 회귀 노드의 무작위 변동을 유발하는 수많은 2차 이유의 영향에 의해 그 크기가 영향을 받는다는 사실로 설명됩니다. 상관 특성의 공액 변동의 주요 경향(경향)을 확인하려면 파선을 매끄럽고 원활하게 흐르는 회귀선으로 대체해야 합니다. 끊어진 선을 매끄러운 선으로 바꾸는 과정을 호출합니다. 경험적 계열의 정렬그리고 회귀선.

그래픽 정렬 방법.이는 계산 작업이 필요하지 않은 가장 간단한 방법입니다. 그 본질은 다음과 같이 요약됩니다. 경험적 회귀 계열은 직각 좌표계의 그래프로 표시됩니다. 그런 다음 회귀의 중간점을 시각적으로 설명하고 눈금자 또는 패턴을 사용하여 실선을 그립니다. 이 방법의 단점은 명백합니다. 이는 경험적 회귀선 정렬 결과에 대한 연구자의 개별 속성의 영향을 배제하지 않는다는 것입니다. 따라서 끊어진 회귀선을 매끄러운 회귀선으로 대체할 때 더 높은 정확도가 필요한 경우 경험적 계열을 정렬하는 다른 방법이 사용됩니다.

이동 평균 방법.이 방법의 본질은 경험적 계열의 두 개 또는 세 개의 인접한 항으로부터 산술 평균을 순차적으로 계산하는 것입니다. 이 방법은 경험적 계열이 많은 수의 항으로 표현되는 경우에 특히 편리하므로 이 정렬 방법에서 불가피한 극단적인 항 중 두 개의 손실이 구조에 눈에 띄게 영향을 미치지 않습니다.

최소제곱법.이 방법은 19세기 초 A.M. Legendre와 그와는 별도로 K. Gauss. 이를 통해 경험적 계열을 가장 정확하게 정렬할 수 있습니다. 이 방법은 위에 표시된 것처럼 편차 제곱의 합이 변형이라는 가정에 기초합니다. 엑스 평균에는 최소값이 있습니다. 따라서 생태학뿐만 아니라 기술에도 사용되는 방법의 이름입니다. 최소 제곱법은 객관적이고 보편적입니다. 회귀 계열에 대한 경험적 방정식을 찾고 해당 매개변수를 결정할 때 다양한 경우에 사용됩니다.

최소 제곱법의 요구 사항은 회귀선의 이론적인 점을 경험적 관찰에 대한 이 점으로부터의 편차 제곱의 합이 되는 방식으로 얻어야 ​​한다는 것입니다. 와이 최소한이었습니다.

수학적 분석의 원리에 따라 이 표현의 최소값을 계산하고 이를 특정 방식으로 변환함으로써 소위 시스템을 얻을 수 있습니다. 정규 방정식여기서 알 수 없는 값은 회귀 방정식의 필수 매개변수이고 알려진 계수는 특성의 경험적 값, 일반적으로 값의 합과 교차곱에 의해 결정됩니다.

다중 선형 회귀.여러 변수 사이의 관계는 일반적으로 다중 회귀 방정식으로 표현됩니다. 선의그리고 비선형. 가장 간단한 형태의 다중 회귀는 두 개의 독립 변수가 있는 방정식으로 표현됩니다( 엑스, ):

어디 – 방정식의 자유항; 그리고 – 방정식의 매개변수. 최소 제곱법을 사용하여 방정식 (10)의 매개변수를 찾으려면 다음 정규 방정식 시스템이 사용됩니다.

다이나믹 시리즈. 행 정렬.시간에 따른 특성의 변화는 소위 시계열또는 다이나믹스 시리즈. 이러한 계열의 특징은 여기서 독립 변수 X가 항상 시간 요소이고 종속 변수 Y가 변화하는 특징이라는 것입니다. 회귀 계열에 따라 변수 X와 Y 사이의 관계는 시간 요소가 특성의 가변성에 의존하지 않기 때문에 일방적입니다. 이러한 기능에도 불구하고 역학 계열은 회귀 계열에 비유될 수 있으며 동일한 방법을 사용하여 처리될 수 있습니다.

회귀 시리즈와 마찬가지로 경험적 역학 시리즈는 주요 요인뿐만 아니라 통계 언어로 특성 변동성의 주요 추세를 모호하게 하는 수많은 2차(무작위) 요인의 영향을 받습니다. 경향.

시계열 분석은 추세의 형태를 파악하는 것부터 시작됩니다. 이를 위해 시계열은 직각 좌표계의 선 그래프로 표시됩니다. 이 경우 시점(년, 월 및 기타 시간 단위)은 가로축을 따라 표시되고, 종속변수 Y의 값은 세로축을 따라 표시됩니다. 선형 의존성변수 X와 Y(선형 추세) 사이에서 최소 제곱법을 사용하여 동역학 계열을 정렬하기 위해 가장 적절한 회귀 방정식은 계열의 산술 평균에서 종속 변수 Y 계열 구성원의 편차 형태입니다. 독립 변수 X:

다음은 선형 회귀 매개변수입니다.

역학 계열의 수치적 특성.역학 계열의 주요 일반화 수치 특성은 다음과 같습니다. 기하평균그리고 그것에 가까운 산술 평균. 이는 특정 기간 동안 종속 변수 값이 변경되는 평균 비율을 나타냅니다.

역학 시리즈 구성원의 변동성에 대한 평가는 다음과 같습니다. 표준 편차. 시계열을 설명하기 위해 회귀 방정식을 선택할 때 선형(또는 선형으로 축소) 및 비선형일 수 있는 추세의 모양이 고려됩니다. 회귀 방정식 선택의 정확성은 일반적으로 종속 변수의 경험적으로 관찰되고 계산된 값의 유사성에 의해 판단됩니다. 이 문제에 대한 보다 정확한 해결책은 분산 방법의 회귀 분석입니다(주제 12, 단락 4).

시계열의 상관관계.예를 들어 특정 기간 동안 농업 생산과 가축 수의 증가 사이의 관계를 알아내기 위해 특정 일반 조건에 따라 서로 관련된 병렬 시계열의 역학을 비교하는 것이 종종 필요합니다. 이러한 경우 변수 X와 Y 사이의 관계의 특성은 다음과 같습니다. 상관 계수 R xy(선형 추세가 있는 경우).

일반적으로 시계열의 추세는 종속 변수 Y 계열의 변동으로 인해 모호해지는 것으로 알려져 있습니다. 이는 두 가지 문제를 야기합니다. 추세를 제외하지 않고 비교 계열 간의 종속성을 측정하고, 추세를 제외하고 동일한 계열의 이웃 구성원 간의 종속성입니다. 첫 번째 경우, 비교된 시계열 간의 연결이 긴밀하다는 지표는 다음과 같습니다. 상관 계수(관계가 선형인 경우) 두 번째 – 자기상관계수. 이러한 지표는 동일한 공식을 사용하여 계산되지만 의미는 다릅니다(주제 11 참조).

자기상관 계수의 값이 종속변수 계열 구성원의 변동성에 영향을 받는다는 것을 쉽게 알 수 있습니다. 계열 구성원이 추세에서 덜 벗어나면 자기상관 계수가 높아지고 그 반대의 경우도 마찬가지입니다.

회귀 분석 방법은 가치 관계를 구축하고 정렬하기 위해 특정 매개변수 시리즈에 속하는 제품의 기술 및 경제적 매개변수를 결정하는 데 사용됩니다. 이 방법은 주요 소비자 속성을 반영하는 하나 이상의 기술적, 경제적 매개변수가 존재하는 것을 특징으로 하는 제품의 수준 및 가격 비율을 분석하고 정당화하는 데 사용됩니다. 회귀 분석을 통해 제품의 기술 및 경제 매개변수에 대한 가격의 의존성을 설명하는 경험적 공식을 찾을 수 있습니다.

P=f(X1X2,...,Xn),

여기서 P는 제품의 단가, 문지름 값입니다. (X1, X2, ... Xn) - 제품의 기술 및 경제 매개변수입니다.

사용되는 규범적 매개변수 방법 중 가장 발전된 회귀 분석 방법은 현대 기술을 기반으로 계산을 수행할 때 효과적입니다. 정보 기술그리고 시스템. 적용에는 다음과 같은 주요 단계가 포함됩니다.

  • 제품의 분류 매개변수 그룹 결정;
  • 제품 가격에 가장 큰 영향을 미치는 매개변수 선택
  • 매개변수가 변경될 때 가격 변경 간의 연결 형태 선택 및 정당화;
  • 정규 방정식 시스템 구축 및 회귀 계수 계산.

가격이 균등화되는 제품의 주요 자격 그룹은 파라메트릭 시리즈로, 그 안에서 제품은 애플리케이션, 작동 조건 및 요구 사항 등에 따라 다양한 디자인으로 그룹화될 수 있습니다. 파라메트릭 시리즈를 구성할 때 자동 분류 방법 이를 통해 제품의 전체 질량에서 동질적인 그룹을 구별할 수 있습니다. 기술 및 경제 매개변수의 선택은 다음과 같은 기본 요구 사항을 기반으로 이루어집니다.

  • 선택된 매개변수에는 표준 및 기술 사양에 기록된 매개변수가 포함됩니다. 기술 매개변수(전력, 부하 용량, 속도 등) 외에도 제품 직렬화 지표, 복잡성 계수, 통합 등이 사용됩니다.
  • 선택된 매개변수 세트는 시리즈에 포함된 제품의 설계, 기술 및 운영 특성을 충분히 완전히 특성화해야 하며 가격과 상당히 밀접한 상관관계를 가져야 합니다.
  • 매개변수는 상호의존적이지 않아야 합니다.

가격에 큰 영향을 미치는 기술 및 경제 매개변수를 선택하기 위해 쌍 상관 계수 행렬이 계산됩니다. 매개변수 간의 상관 계수의 크기를 기반으로 연결의 친밀도를 판단할 수 있습니다. 동시에, 0에 가까운 상관관계는 매개변수가 가격에 미치는 영향이 미미하다는 것을 보여줍니다. 기술적, 경제적 매개변수의 최종 선택은 컴퓨터 기술과 적절한 표준 프로그램을 사용한 단계별 회귀 분석 과정에서 수행됩니다.

가격 책정 실무에서는 다음 기능 세트가 사용됩니다.

선의

P = ao + alXl + ... + antXn,

선형 전력

P = ao + a1X1 + ... + anXn + (an+1Xn) (an+1Xn) +... + (an+nXn2) (an+nXn2)

역로그

P = a0 + a1: X1 + ... + an: Xn에서,

차분한

P = a0 (X1^a1) (X2^a2) .. (Xn^an)

지시적

P = e^(a1+a1X1+...+anXn)

쌍곡선

P = ao + a1:X1 + a2:X2 + ... + ap:Xn,

여기서 P는 가격 균등화입니다. X1 X2,..., Xn - 시리즈 제품의 기술 및 경제적 매개변수의 값입니다. a0, a1 ..., аn - 회귀 방정식의 계산된 계수입니다.

안에 실무가격 책정의 경우 가격과 기술 및 경제 매개변수 간의 연결 형태에 따라 다른 회귀 방정식을 사용할 수 있습니다. 가격과 일련의 기술 및 경제 매개변수 간의 연결 기능 유형은 컴퓨터 처리 중에 미리 설정되거나 자동으로 선택될 수 있습니다. 가격과 매개변수 집합 간의 상관관계의 근접성은 다중 상관 계수의 값으로 평가됩니다. 하나에 가깝다는 것은 긴밀한 연결을 나타냅니다. 회귀 방정식을 사용하여 특정 매개변수 계열의 제품에 대한 균등화된(계산된) 가격 값을 얻습니다. 균등화 결과를 평가하기 위해 계산된 가격 값과 실제 가격 값의 편차에 대한 상대 값이 계산됩니다.

Tsr = Rf - Rr: R x 100

여기서 Рф, Рр - 실제 가격과 계산된 가격.

CR 값은 8~10%를 초과해서는 안 됩니다. 계산된 값이 실제 값과 크게 차이나는 경우 다음 사항을 조사해야 합니다.

  • 파라메트릭 시리즈 형성의 정확성(매개변수가 시리즈의 다른 제품과 크게 다른 제품을 포함할 수 있기 때문). 제외되어야 합니다.
  • 기술 및 경제 매개변수의 올바른 선택. 가격과 약한 상관관계를 갖는 일련의 매개변수가 가능합니다. 이 경우 계속해서 매개변수를 검색하고 선택해야 합니다.

회귀 분석을 수행하고 방정식의 알려지지 않은 매개 변수를 찾고 얻은 결과의 경제성 평가를 위한 절차 및 방법은 수학적 통계의 요구 사항에 따라 수행됩니다.