대체 가능한 임시 변수

경제사전

더미 변수는 회귀 모델에서 정성적 값을 설명하는 데 사용되는 변수입니다.

회귀 모델은 한 변수를 다른 변수로 설명하려고 합니다. 예를 들어, 연령, 교육 및 경험을 기반으로 한 개인의 급여입니다. 이러한 변수는 수량화할 수 있습니다. 사람의 나이, 교육 및 경험은 몇 년으로 정량화될 수 있습니다. 그러나 수량화할 수 없는 변수가 있으면 어떻게 됩니까? 예를 들어 머리 색깔, 거주 국가 또는 성별. 이 문제에 대한 해결책은 더미 변수에 있습니다. 일반적으로 이진 값을 사용하는 변수입니다. 즉, 값이 0 또는 1입니다.

예를 들어, 우리가 말한 변수 성은 질적 변수입니다. 회귀 모델에 포함하려면 더미 변수를 생성해야 합니다. 다음과 같이 변수를 "여자"라고 부를 것입니다.

여성 = 1(개인이 여성인 경우)

여성 = 0(개인이 여성이 아닌 경우, 즉 남성임)

이 경우 "남자"는 참조 범주 또는 기본 그룹으로 간주됩니다.

더미 변수에는 두 가지 유형이 있습니다. 한편으로는 가산 더미 변수가 있고 다른 한편에는 곱셈 더미 변수가 있습니다.

회귀 분석

가산 더미 변수

추가 더미 변수는 고정된 변경 사항을 수집합니다. 이 변경은 방정식의 상수 항에만 영향을 줍니다. 예를 들어, 성별과 교육 연수에 따라 임금을 설명하는 것을 목표로 하는 모델입니다. 우리는 방정식을 남성에 대한 참조로 취하거나(두 번째 방정식) 여성에 대한 참조로 취하는 방정식(첫 번째 방정식)을 넣을 수 있습니다.

방정식의 그래픽 표현은 다음과 같습니다. 남성이 더 높은 급여를 받는 경우 추가 더미 변수를 사용하면 모델이 이전 이미지로 표시됩니다.

귀하의 경우 여성이 남성보다 급여가 더 높고 추가 더미 변수를 사용하면 모델이 이전 이미지와 같이 그래픽으로 표시됩니다.

파란색 선(남성)과 주황색 선(여성) 사이의 양적 차이는 «여성" 또는 "남자들»선택한 모델에 따라. 이 경우, 가산 더미변수의 급여차이는 학력에 의존하지 않는다. 즉, 급여 차이는 전적으로 성별에 따라 다릅니다.

승법 더미 변수

승법 더미 변수는 남성과 여성에 대한 방정식의 기울기 변화를 포착합니다. 이전 예제를 계속 진행하면 다음과 같습니다.

그래픽으로 가능한 표현은 다음과 같습니다.

이 경우 모델은 두 가지를 알려줍니다. 우선 여성의 임금이 남성보다 낮다. 그리고 두 번째로, 추가 교육 1년은 여성보다 남성이 더 나은 급여를 받는다는 것입니다. 파란색 선(남성)의 기울기가 주황색 선(여성)의 기울기보다 크기 때문에 우리는 이것을 압니다.

추가 1년의 교육이 여성에게 더 잘 지급된다면 주황색 선(여성)의 기울기가 더 커질 것입니다. 그리고, 파란색 선(남자)은 아래에 있을 것입니다.

통계변수

태그:  문화 순위 아르헨티나 

재미있는 기사

add