오분류 로짓모형 접근을 이용한 농업환경변동조사 편익 평가
초록
공공사업이나 비시장재의 편익 추정기법으로 주로 사용되는 가상가치평가법(CVM)의 기본 가정은 응답자들이 본인의 선호를 확실하게 알지만 연구자는 선호에 영향을 미치는 일부 변수들만 관측함으로써 모형에 확률적 부분이 존재한다는 것이다. 그러나 평가 대상이 일상 생활에서 자주 접하는 경우가 아니면 비록 설문조사의 조사지에서 상세하게 설명하더라도 응답자들은 본인의 선호를 확실하게 파악하지 못해서 잘못 응답할 수 있다. CVM모형에서 자주 이용되는 로짓모형과 같은 비선형모형에서는 종속변수의 측정오차는 추정 편의를 발생시킨다. 본 논문은 응답오류의 가능성을 모형에서 반영하기 위해서 Hausman et al. (1998)의 오분류 이항종속변수모형을 CVM에 적용하고, 적용된 모형의 응용사례로서 농업환경자원 변동 조사 사업의 편익분석을 고려한다. 분석결과, 응답오류 확률이 통계적으로 유의하며, 응답오류를 고려하지 않는 모형과 응답오류를 고려한 모형 간에 추정계수값 차이가 존재하고, 전자의 경우 계수들이 추정 편의를 갖는 것으로 나타났다. 응답오류를 고려한 CVM을 적용한 결과, 농업환경자원 변동 조사 사업의 가구당 편익은 3,831원으로 추정되었다.
Abstract
This study considered the issue of response error in the Contingent Valuation Method(CVM), which is the primary approach used to assess public projects or nonmarket goods. The basic assumption of the CVM is that survey respondents recruited from the general public know their preferences with certainty. However, even when respondents are provided with detailed project explanations, this may not actually be the case, inducing incorrect responses and the measurement error of the dependent variable. In nonlinear models such as the logit model, which is frequently used in CVM method, this measurement error can cause estimation bias. To investigate this issue, this study used an existing misclassification binomial dependent variable method to adjust the logit model for the CVM (Hausman et al., 1998). This adjusted model was used to evaluate the Agricultural Environmental Change Survey project. In sum, the analysis produced the following results: (1) the response error probability was statistically significant, (2) differences existed between the two employed models (i.e., with and without considering response error), and (3) the estimated coefficients were biased in the model that considered response error. From the adjusted model, the benefit of the project was estimated as 3,831 won per household.
Keywords:
CVM, Agricultural Environmental Change Survey Project, Logit, Misclassification, Response Error키워드:
가상가치평가법, 농업환경변동조사, 로짓모형, 오분류, 응답오류I. 서론
최근 농업은 기후변화, FTA 체결에 따른 수입 농산물과의 경쟁 등 국내외 여건이 급변하고 있다. 이러한 여건 변화의 위기를 기회로 전환하기 위해서는 시장 경쟁력 강화가 가장 중요하므로 농업 분야에서도 정보화, 연구개발, 기술혁신 등을 위한 노력을 하고 있다. 한편 어떤 분야이든지 정보화를 위한 가장 중요한 기초 인프라 중 하나는 데이터베이스 구축이다. 농업환경자원 변동조사 사업은 농촌진흥청이 주기적으로 과수원, 밭, 논, 농업용수 등 일반 및 취약농경지를 대상으로 농경지의 물리 및 화학 구성 성분, 농업용수의 수질, 비료사용실태, 중금속 등 농업 환경의 변화를 분석해서 DB를 구축하는 사업이다.
수익이 없는 공공사업인 농업환경자원 변동조사 사업을 지속적으로 운영관리하기 위해서는 정부의 지속적인 예산 투입이 필요하며 이러한 예산 투입에 정당성을 부여하기 위해서는 동 사업이 창출하는 편익을 수량화하여 추정할 필요가 있다. 현재 우리나라에서는 KISTEP(한국과학기술기획평가원), KDI(한국개발연구원) 등이 일정 규모 이상의 정부재정지원을 받는 공공사업의 편익을 추정하고 있다. 이들 두 기관은 편익 평가에 필요한 시장 자료가 확보되지 않는 경우에는 설문조사에 의해 자료를 수집하고 응답자의 편익을 추정하는 조건부가치평가방법(contingent valuation method, CVM)을 사용한다 (한국개발연구원, 2008; 한국과학기술기획평가원, 2018).
CVM은 엑손의 1991년 석유유출 사고에 대한 법정 소송에서 사고피해액의 증거로 채택되고 미국 해양대기청(NOAA)이 동 방법 사용법을 설명하는 전문가그룹 보고서(Arrow 등, 1993)를 발간한 것을 계기로 많은 관련 서적들이 출판되기 시작하였고 (Bateman과 Willis, 2001; Louviere et al., 2000; Bateman et al., 2002; Kanninen 2007), 환경경제학 이외의 다양한 경제학 분야에서 응용연구들이 폭발적으로 증가하여 왔다 (Carson, 2000, 2011; Ryan and Gerard, 2003).
CVM 중에서 가장 많이 활용되는 유형은 양분선택형 (dichotomous) CVM이다. 이 방법은 설문조사에서 추가로 금액을 지불해야만 사업이 시행된다는 가상적인 상황을 설정하고 응답자에게 사업 시행을 위해서 소득세나 기부금 등의 제시된 금액에 대한 지불의사가 있는지를 응답하도록 문항을 설계한다. 추정 모형으로는 주로 로짓이나 프로빗 등의 비선형모형이 사용된다. 종속변수에 측정오차가 있을 경우, 선형모형에서는 추정량의 불편성에 영향을 미치지 않지만, 비선형모형에서는 불편성에 영향을 미칠 수 있다 (Abrevaya and Hausman 1999; Hausman 2001). CVM의 평가 대상인 공공사업은 많은 경우 일반 시민들의 인지도가 낮아서 설문조사에서 사업 내용을 설명하더라도 응답자가 본인의 선호를 확실하게 파악하지 못하는 가능성이 높다. 따라서 양분선택형 질문에 대한 예/아니오 응답에서 ‘예’가 참 값인데도 ‘아니오’로 잘못 응답하거나 ‘아니오’가 참 값인데 ‘예’로 잘못 응답하는 응답오류가 발생할 수 있는데 로짓 혹은 프로빗 등의 비선형모형에서 이러한 오분류는 추정의 편의를 발생시킨다 (Hausman et al., 1998; Abrevaya and Hausman, 1999; Hausman, 2001).
Hausman et al.(1998)은 이항종속변수가 1인데도 0으로 잘못 분류되는 확률과 0인데 1로 잘못 분류되는 확률, 두 가지 오분류 확률을 모수로 갖도록 확률함수를 수정하고 이에 기반한 최우추정법을 제시함으로써 오분류 하에서의 추정 불일치 문제의 해결방안을 제시하였다. 본 연구는 Hausman et al.(1998)의 오분류 이항종속변수모형을 CVM에 적용하여 응답오류를 고려하도록 양분선택형 CVM 모형을 수정하고 응용사례로서 농업환경자원 변동조사 사업의 가치평가에 적용하려고 한다.
이후에 논문은 다음과 같이 구성된다. 2장에서는 양분선택형 CVM의 수리적 모형 구조를 설명하고 Hausman et al.(1998)의 오분류 이항종속변수모형을 반영하도록 수정한다. 3장에서는 경험적 분석에 이용된 자료와 분석결과가 제시되고 마지막으로 4장은 요약 및 결론을 제시한다.
Ⅱ. 분석방법
양분선택형 CVM는 설문조사를 통해 가치를 평가하고자 하는 사업의 수행을 위해 세금의 특정 금액을 일정 주기로 추가로 지불할 의사가 있는지를 응답자에게 물어본다. 응답자가 평가 대상 사업에 부여하는 본인의 편익을 확실히 알고 있는 경우에는, 만약 그 편익이 제시된 금액보다 크면 지불의사가 있는 것으로 그리고 반대의 경우에는 지불의사가 없는 것으로 응답할 것이다. 조사자는 응답자의 편익을 관측할 수 없지만 편익이 제시된 금액보다 상대적으로 큰지 여부의 정보는 갖게 된다.
먼저 본 연구에서 사용되는 변수를 정의한다. z, y, x를 각각 직접 관측되지 않는 응답자의 WTP(willingness to pay, 지불의사액), 응답자가 제시금액의 지불의사가 있는 경우에 1의 값을 그리고 지불하지 않겠다고 응답하는 경우에 0의 값을 가지면서 관측되는 이항변수, 사회경제적 변수들로 구성되는 결정요인들로 각각 표기한다. 양분선택형 CVM의 상황은 다음처럼 수리적으로 표현된다.
식(1) |
응용연구에서 연구자는 응답자 편익 z를 관측할 수 없지만 대신에 관측되는 이항변수 y의 정보를 이용하여 로짓 혹은 프로빗모형에 의해 <식1>의 응답자 WTP 계수인 β를 추정할 수 있다. 일반적으로 로짓이나 프로빗모형에서는 계수들의 상대값만 식별되는 것과 다르게 양분선택형 CVM에서는 계수들의 수준값이 식별된다.
<식1>을 이용하면 y = 1, 즉 응답자가 지불하겠다고 응답할 확률은 다음과 같다. σ2는 -ϵ의 분산이다.
식(2) |
-ϵ의 확률분포로서 로짓모형을 가정하고 αo = -1/σ, α1 = β/σ의 표기법을 이용하면 <식2>는 <식3>으로 표현된다.
식(3) |
Hausman et al.(1998)의 오분류 이산선택모형을 적용하기 위해서 <식1>의 y를 응답자의 선호체계가 올바르게 반영된 참 반응 (true response) 종속변수로 정의하고 설문조사에서 실제 관측된 반응 (observed response) 종속변수를 w로 표기하자. 그러면 y = 1이지만 w = 0인 응답오류와 y = 0이지만 w = 1인 응답오류 등 두 개 유형의 응답오류가 존재할 수 있다. Hausman et al.(1998)을 따라서 본 연구는 응답오류 확률을 아래와 같이 정의한다.
식(4) |
δ0는 응답자가 제시된 금액을 지불할 의사가 있다고 응답(‘예’)하는 것이 참이지만 지불할 의사가 없다(‘아니오’)고 잘못 응답할 확률이며 δ1은 제시된 금액의 지불의가 없다고 응답(‘아니오’)하는 것이 참인데도 지불의사가 있다(‘예’)로 잘못 응답할 확률이다. 그러면 w = 1, 즉 응답자가 설문조사에서 제시된 금액을 지불하겠다고 응답할 확률은 아래와 같게 된다.1)
식(5) |
<식5>의 계수들 αj와 δj, j = 0, 1이 로짓모형을 이용해서 MLE(maximum likelihood estimation, 최우추정법)에 의해 추정되면 <식1>의 WTP 계수 β의 추정량을 다음과 같이 계산할 수 있다.
식(6) |
<식6>에서 WTP 계수 추정량 은 의 비선형함수이다. 델타 방법(Delta method)((Greene, 2008; Oehlert, 1992)을 이용하면 테일러 전개(Tayler expansion)에 의한 비선형함수의 선형함수 근사를 통해 의 분포로부터 의 분포를 도출할 수 있다. 델타 방법을 적용한 결과는 다음과 같다.
식(7) |
단, , I는 항등행렬, .
평가대상 공공사업의 WTP로 측정되는 가구당 편익은 <식1>을 설명변수의 표본평균 값 에서 계산하여 추정된다.
식(8) |
한편 <식8>에서 를 상수로 취급하면 가구당 편익 추정량의 분포는 <식7>의 분포를 이용하여 다음과 같이 도출된다.
식(9) |
<식9>로부터 <식8>의 평가대상 공공사업의 가구당 편익에 대한 신뢰구간을 다음과 같이 도출할 수 있다.
식(10) |
Ⅲ. 경험적 분석
1. 설문조사 기초통계
설문조사는 전문조사기관에 의뢰해서 8개 광역시와 9개 도에 거주하는 가구를 대상으로 광역시와 도의 가구수에 비례하여 목표 조사표본수 3,000 가구를 배분하고 인터넷에 의한 온라인 조사를 2017년 5월 12일에서 5월 21일까지 실시하였다.
응답자를 연령별로 보면 평균은 42세, 각 연령의 비중은 40대 37%, 50대 14%, 60대 이상은 3%이어서 40대 이상이 50% 이상을 차지한다. 성별로는 여성은 40대가 약 50%, 남성은 약 50%이다.
학력수준의 경우, 전체 응답자 중 87% 이상이 대학 졸업이거나 그 이상 학력을 갖고 있으며, 월간 소득액은 300만대 18%, 400만원대 22%, 500만원 이상은 49%이어서 응답자 중 약 60%의 월 소득이 500만원 이상이고 300만원 이상은 88%이다.
2. 모형 추정결과
CVM을 위한 설문조사 문항에서는 농업환경자원 변동조사 사업 수행을 위해서 월별로 납부하는 소득세가 추가로 인상된다는 상황을 가정하고 제시금액을 1,000원~10,000원 범위에서 각 응답자별로 결정하였다. 농업환경자원 변동조사 사업 편익에 영향을 미치는 설명변수로서 연령(x2), 가구소득(x3), 월소득세(T)을 고려하였다.
응답오류를 고려하지 않은 <식3>의 로짓모형과 응답오류를 고려한 <식5>의 로짓모형을 최우추정법(MLE)으로 추정하였다. 전자는 응답오류를 고려한 <식5>의 로짓모형을 δo = δ1 = 0의 사전적인 제약 하에서 추정한 것에 해당한다. 추정 결과는 <표 3>에 제시되어 있다.
추정결과, 두 개 유형의 응답오류 확률 δo와 δ1 모두 1% 유의수준에서 설명력을 가지는 것으로 나타났으며, 응답오류를 고려하지 않는 경우와 비교할 때 응답오류를 고려하는 경우에서 로짓모형의 계수값들이 크게 차이가 난다. 두 모형 모두 통계적 유의성을 갖는 소득세와 소득의 경우, 응답오류를 고려한 모형에서 계수의 절대값들이 모두 증가하였다. 연령 변수는 응답오류를 고려하지 않은 모형에서는 통계적 유의성을 갖지만 응답오류를 고려한 모형에서는 통계적 유의성이 없는 것으로 나타났다.
두 경우 간의 계수 차이 존재 여부를 좀 더 살펴보기 위해서 응답오류를 고려하는 경우에 대한 <식5>의 계수들이 <표 3>에 나타난 응답오류를 고려하지 않은 경우에 대한 <식3>의 계수 값을 가질 수 있는지 여부의 가설검정을 수행하였다. 검정된 귀무가설은 월소득세(T), 연령(x2), 가구소득(x3)의 계수에 대해 다음과 같이 설정되었다.
(11) |
단, α0=소득세(T) 계수, α1=연령(x2) 계수, α2= 소득(x3) 계수
Wald-통계량을 이용한 <식11>의 결합가설 검정에 추가하여 개별 계수에 대해서 <식11>의 각 값을 가질 수 있는지에 대해 T-통계량에 의한 검정을 수행하였으며 검정결과는 <표 4>에 제시되어 있다. 검정결과, 1% 유의수준에서 귀무가설 <식11>은 기각되었으며 따라서 응답오류를 고려하지 않는 경우와 응답오류를 고려하는 경우 간에 로짓모형 계수값들의 차이가 존재하는 것으로 나타났다. T-검정통계량을 이용한 개별 계수별로 응답오류를 고려하는 모형의 계수가 응답오류를 고려하지 않는 모형의 계수값을 가질 수 있는지 여부의 검정결과를 보면, 연령(x2)을 제외하고 나머지 설명변수의 계수가 5% 유의수준에서 귀무가설이 기각되었다. 이러한 검정결과는 응답오류를 고려하지 않는 경우에 추정결과가 편의(bias)되었음을 의미한다.
<표 3>에서 응답오류를 고려한 <식5>의 추정결과와 <식6>을 이용하여 <식1>의 편익함수 계수들의 추정치를 계산한 결과는 <표 5>에서 볼 수 있다.
<표 7>의 추정결과를 <식1>에 대입해서 설명변수의 표본평균 값에서 계산하면 <식8>의 농업환경자원 변동조사 사업에 대한 가구당 월 편익의 추정값은 3,831원으로 나타났다. 구간 추정은 <식10>로부터 계산될 수 있으며 가구당 월 편익의 90% 신뢰구간은 [3,073원, 4,590원]이며, 95% 신뢰구간은 [2,924원, 4,739원]이다.
Ⅳ. 결 론
국내외에서 시장이 존재하지 않거나 불완전한 공공사업의 편익을 추정하는데 주로 활용되는 CVM은 경험적 분석에 사용되는 자료를 일반시민을 대상으로 하는 설문조사로부터 추출한다. 그러나 일반 시민들이 일상 생활에서 자주 접하지 않는 공공사업의 경우 인지도가 낮아서 설문조사에서 사업 내용을 설명하더라도 응답자가 본인의 선호를 확실하게 파악하지 못하고 잘못 응답할 가능성이 있다. 선형회귀모형과는 다르게 CVM 추정에 사용되는 로짓이나 프로빗과 같은 비선형모형에서는 이러한 응답오류는 이항종속변수의 측정오류를 유발하여서 추정의 편의를 발생시킨다.
본 연구는 Hausman et al. (1998)의 오분류 이산선택모형을 이용해서 응답오류 가능성을 반영하도록 공공사업 편익의 추정과정을 수정하고, 농촌진흥청이 4년을 주기로 농업환경의 변화 수치를 조사하여 데이터베이스를 구축하는 농업환경자원 변동조사 사업의 가치평가에 적용하였다.
분석 결과, 응답오류를 반영한 추정모형에서 두 가지 유형의 응답오류 확률은 모두 통계적으로 설명력을 갖는 것으로 나타났다. 응답오류를 고려하지 않는 모형의 추정결과와 비교했을 때 통계적 유의성을 갖는 설명변수 그리고 계수 추정값 간에 차이가 있었으며, 가설검정을 통해서 응답오류를 고려하지 않는 모형을 추정하면 추정 편의가 존재하는 것을 경험적으로 확인하였다. 응답오류를 반영한 모형의 추정결과, 월 편익의 추정값은 3,831원이며 90% 신뢰구간은 [3,073원, 4,590원]이며, 95% 신뢰구간은 [2,924원, 4,739원]으로 나타났다.
본 연구는 Hausman et al. (1998)의 오분류 이산선택모형을 비시장재 가치평가에 많이 활용되는 양분선택형 CVM 모형에 적용했다는 점에서 의의를 갖는다. 최근 CVM의 응용연구가 활발하여서 다양한 공공사업의 편익 추정에 활용되고 있다. CVM에서 필수적으로 사용되는 설문조사의 경우 조사지 내용이 지나치게 많으면 응답자의 피로도를 증가시킬 수 있기 때문에 조사지 지문에서 평가대상 공공사업을 상세하게 설명하는데 한계가 있다. 따라서 일상 생활에서 친숙하지 않은 생소한 사업들의 경우에는 특히 응답오류 이슈가 매우 중요하다고 판단되며 추후 다양한 관련 분석방법들이 연구될 필요가 있다.
본 연구에서 제시된 방법은 실제 상황에 적용하기 위해서는 아직 한계가 있으며 여러 추후 연구가 필요한 것으로 보인다. 특히 오분류 확률이 고정되었다는 가정은 비현실적인 강한 가정이다. 현실에서는 응답자의 편익과 제시된 소득세 금액이 서로 차이가 작을수록 오분류 확률이 증가하고 양자의 차이가 클수록 오분류 확률이 줄어들 것으로 기대되기 때문에 오분류 확률을 편익과 제시금액 간 차이의 단조함수로 모형화하는 접근을 고려할 필요가 있다. 또한 설문조사에서 평가대상 공공사업에 대한 정보량을 증가시켜서 문항에 대한 이해도를 높이면 응답오류확률이 낮아질 수 있는지, 즉 응답오류확률이 설문조사에 의존하는지 등을 분석하는 것도 흥미로운 연구주제로 보인다.
Acknowledgments
본 논문은 2021년 농촌진흥청의 『농업환경자원변동평가(4년 1주기, 5차사업)』보고서의 데이터를 이용하였음을 밝혀둔다.
References
- 한국개발연구원, 2008, 『예비타당성조사 수행을 위한 일반지침 수정·보완 연구 (제5판)』, 세종: 한국개발연구원.
- 한국과학기술기획평가원, 2018, 『국가연구개발사업 예비타당성조사 수행 세부지침』, 음성: 한국과학기술평가원
- Abrevaya, J. and J. Hausman, 1999, “Semiparametric estimation with mismeasured dependent variables: An application to duration models for unemployment spells,” Annals of Economics and Statistics, 55/56, pp.243-275 [https://doi.org/10.2307/20076198]
- Arrow, K., R. Solow, P. Portney, E. Leamer, R. Radner, and H. Schuman, 193, “Report of the NOAA panel on contingent valuation,” Federal Register, 58(10), pp.4601-4614.
- Bateman, I. J., and K. Willis(eds), 2001, Valuing Environmental Preferences: Theory and Practice of the Contingent Valuation Method in the US, EU, and Developing Countries, UK: Oxford University Press.
- Bateman, I. J., R. Carson, B. Day, W. Hanemann, N. Hanley, T. Hett, M. Jones-Lee, G. Loomes, S. Mourato, E. Özdemiroglu, and D. Pearce, 2002, Economic Valuation with Stated Preference Techniques: A Manual, UK: Edward Elgar. [https://doi.org/10.4337/9781781009727]
- Carson, R. T., 2000, “Contingent valuation: A user’s guide,” Environmental Science and Technology, 34, pp.1413-1418. [https://doi.org/10.1021/es990728j]
- Carson, R. T., 2011, Contingent Valuation: A Comprehensive Bibliography and History, UK: Edward Elgar. [https://doi.org/10.4337/9780857936288]
- Greene, W., 2008, Econometric analysis (6th ed.), US: Prentice Hall.
- Hausman, J., J. Abrevaya, and F. Scott-Morton, 1998, “Misclassification of the dependent variable in a discrete-response setting,“ Journal of Econometrics, 87(2), pp.239-269. [https://doi.org/10.1016/S0304-4076(98)00015-3]
- Hausman, J., 2001, “Mismeasured variables in econometric analysis: problems from the right and problems from the left,” Journal of Economic Perspectives, 15(4), pp.57-67. [https://doi.org/10.1257/jep.15.4.57]
- Kanninen, B. J., 2007, Valuing Environmental Amenities Using Stated Choice Studies: A Common Sense Approach to Theory and Practice, D.E.: Springer. [https://doi.org/10.1007/1-4020-5313-4]
- Louviere, J. J., D. Hensher, and J. Swait, 2000, Stated Choice Methods: Analysis and Applications, UK: Cambridge University Press. [https://doi.org/10.1017/CBO9780511753831]
- Oehlert, G. W., 1992, “A note on the delta method,” The American Statistician, 46(1), pp.27-29. [https://doi.org/10.1080/00031305.1992.10475842]
- Ryan, M., and K. Gerard, 2003, “Using discrete choice experiments to value health care programmes: Current practice and future research reflections,” Applied Health Economics and Policy Analysis, 2(1), pp.55-64.
정기호: University of Wisconsin at Madison에서 경제학 박사학위를 취득하고 현재 경북대학교 경제학과 교수로 재직 중이다. 주요 관심분야는 기후변화 및 에너지 경제모형, 예측, 가치평가, 파급효과분석 등이다(khjeong@knu.ac.kr).