기후변화와 녹색 정책의 이슈 비교 분석: 국내 정권 시기별 텍스트 데이터 분석을 중심으로
초록
지구온난화로 인한 기후변화 문제는 전지구적인 이슈가 되고 있다. 이와 함께 우리나라도 기후변화 대응을 위한 다양한 정책을 수립하였으며, ‘기후변화’, ‘녹색’, ‘그린(Green)’ 등의 용어를 기반으로 추진되어 왔다. 각 정권별 각기 다른 용어를 기반으로 이러한 정책이 추진되었으나, 친환경 정책으로서 비슷한 내용을 담고 있는 경우가 많았다. 이에 본 연구는 ‘기후변화’와 ‘녹색’ 및 ‘그린(Green)’의 키워드를 기반으로 텍스트 자료를 분석하여 국내 정권별 정책과 언론의 이슈를 비교하고자 하였다. 분석을 위한 데이터는 국내 언론 뉴스 기사와 정부 보도자료 데이터를 활용하였으며, 텍스트 마이닝 기법 기반의 단어 빈도분석과 토픽모델링 분석을 진행하였다. 이를 통해 본 연구는 ‘기후변화’와 ‘녹색(Green)’ 관련 주요 이슈를 국내 각 정권 시기별로 분석하였으며, 사회적 이슈와 정책적 이슈를 비교하여 시사점을 제시하였다. 분석 결과, 언론 뉴스 기사와 정부의 보도자료는 국내 정권과 시대적 변화에도 불구하고 기후변화와 녹색 및 그린(Green)의 중요성을 지속적으로 다루고 있는 점을 확인할 수 있었다. 또한, 각 주요 이슈는 정권 시기별로 표현 방식이 비슷하지만 세부적인 내용은 차이를 보이는 것을 확인할 수 있었다.
Abstract
Climate change is becoming a big issue due to global warming. In response to climate change, Korea has established various “climate change” and “green” policies. These policies were promoted by varying names, but in many cases, they contained similar content as other eco-friendly policies. Therefore, this study attempted to analyze the text data and compare domestic government policies and media issues through the keywords “climate change” and “green”. Data were gathered from domestic news articles and government press releases for the analysis. Word frequency analysis and topic modeling analysis were also conducted using text mining techniques. Finally, this study analyzed major issues related to “climate change” and “green” for each period of the domestic government and compared social and policy issues. This study determined that media news articles and government press releases continued to deal with the importance of “climate change” and “green” despite changes in the political regime and the world at large. In addition, major issues were expressed similarly during each period of the political regime, but there were differences in details.
Keywords:
Climate Change, Green Policy, Green New Deal, Text Mining, Topic Modeling키워드:
기후변화, 녹색정책, 그린뉴딜, 텍스트 마이닝, 토픽 모델링I. 서론
지구온난화로 인한 기후변화 영향과 이에 대응하기 위한 활동은 전 세계가 주목하고 있는 중요한 주제이다. 특히, 2015년 유엔기후변화협약(United Nations Framework Convention on Climate Change)의 파리협정체결과 함께 기후변화 문제에 대한 전 지구적인 경각심이 더욱 증가하였으며, 기후변화 대응은 특정 국가만의 문제가 아닌 전 세계가 함께 해결해야 할 공통의 문제로 점차 대두되고 있다. 또한, 파리협정 체결과 신기후체제로의 전환에 따라, 전 세계 모든 UNFCCC의 당사국들은 지역과 경제 개발 수준과 관계없이 함께 기후변화에 대응하기 위한 정책 수립과 활동을 추진하고 있다.
이러한 기후변화 대응의 국가 정책 및 활동은 주로 온실가스 감축과 기후변화 적응 분야로 구성된다. 온실가스 감축은 지구온난화를 막기 위하여 온실가스 배출을 줄이거나 탄소를 흡수하는 분야이고, 기후변화 적응은 기후변화로 인해 발생하는 환경 변화에 적응하기 위한 분야이다. 이에 따라 우리나라도 국가 온실가스 감축과 기후변화 적응을 위한 전반적인 이행방안 추진하고 있으며, 현재 범부처 최상위 국가계획인 ‘녹색성장 5개년 계획’을 기본으로, ‘기후변화대응 기본계획’, ‘에너지 기본계획’과 같은 주요 국가계획을 수립하여, 기후변화 문제를 해결하기 위한 대응과 국제적 의무 이행의 노력을 기울이고 있다.
또한, 이러한 흐름에 발맞추어 2020년 우리나라는 한국형 ‘그린뉴딜(Green New Deal)’ 정책을 발표했는데, 이는 전 세계적인 기후변화 대응에 동참하여 적극적인 국가 정책을 추진하겠다는 의지가 담겨있으며, 탄소 중립(Net-Zero)을 지향하고 경제기반을 저탄소・친환경으로 전환하기 위하여 친환경 에너지 인프라 구축과 친환경 산업을 육성하는 정책의 내용을 담고 있다(관계부처합동, 2020). 우리나라의 이러한 최근 기후변화대응 국가 정책은 과거 ‘녹색성장(Green growth)’ 정책이라는 이름으로 비슷하게 추진되었는데, 녹색성장 정책은 범부처적 조직인 녹색성장위원회의 설립과 ‘저탄소 녹색성장 기본법’이 입법화를 추진하였으며, 국제 기대에 부합하는 경제・환경의 조화와 균형성장을 추진하였다(녹색성장위원회, 2020).
이와 같이, 우리나라의 기후변화 대응을 위한 정책은 ‘기후변화’ 혹은 ‘녹색(Green)’이라는 용어를 많이 사용하였는데, 이러한 용어들은 구체적으로 구분되어 사용되기보다는 친환경 정책의 일환으로 혼용되는 경우가 많았다. 그러나 기후변화 대응 활동은 주로 지구온난화를 극복하고 전지구적 기후 위기에 대응하기 위한 목표를 가지며, 녹색 활동은 주로 환경친화적인 활동을 기반으로 경제 발전을 함께 도모하는 특징의 차이를 보이기도 한다. 따라서 본 연구는 국내에서 ‘기후변화’와 ‘녹색’의 이름으로 추진된 정책이나 사회적 활동이 어떠한 차이를 보이는지 확인하고자 하였으며, 이를 통해 두 용어의 특징을 살펴보고자 하였다.
이에 본 연구는 2008년부터 2020년까지의 국가 정책과 언론에서 다루는 텍스트 내용을 기반으로 ‘기후변화’와 ‘녹색’, ‘그린(Green)’이라는 주요 키워드와 관련된 정책적・사회적 이슈를 살펴보고, 이를 국내 3개 정권 시기별로 비교 분석하는 과정을 진행하였다. 주요 분석방법은 텍스트 마이닝(Text Mining) 방법 기반의 토픽 모델링(Topic modeling) 분석을 활용하였으며, 자료 수집과 분석을 위한 도구는 오픈 소스 프로그램인 R을 활용하였다. 본 연구는 2장에서 선행연구를 검토한 내용을 작성하였고, 3장에서는 연구방법 설계에 대한 내용을 작성하였으며, 4장에서는 분석 결과를 작성하였고, 5장에서 시사점을 도출하였다.
Ⅱ. 선행연구 고찰
1. 유사연구 검토
기존 유사연구 사례를 통해 텍스트 마이닝 기법과 관련된 선행연구는 환경, 과학, 사회, 문화, 정책 등 다양한 분야에서 활용된 점을 확인할 수 있었으며, 그 중 환경 분야에서의 기존 선행연구들은 ‘녹색(Green)’과 관련된 텍스트 마이닝 분석 사례보다 ‘기후변화’에 대한 텍스트 마이닝 분석 연구가 비교적 많은 점을 확인할 수 있었다. 또한, 기존 텍스트 마이닝 분석 기반 ‘기후변화’ 혹은 ‘녹색(Green)’과 관련된 분석 연구는 뉴스 기사, 논문과 연구자료, SNS, 정부 보도자료 등의 활용한 연구가 있었다. 하지만 ‘기후변화’와 ‘녹색’(Green)관련 텍스트 자료를 개별적으로 분석한 경우가 대부분 이었으며, 이들을 함께 비교・분석한 사례는 없었다.
뉴스 기사를 활용하여 ‘기후변화’ 혹은 ‘녹색’ 관련 텍스트 데이터를 분석한 연구 사례는 원진영・김대곤(2014), 현윤진 등(2015), 강영은・신지영・박창석(2016), 강영은・신지영・박창석(2017), 신하나・류재나(2017)의 연구가 있었으며, 대체로 주요 사회적 이슈를 토대로 기후변화 현상을 살펴보는 연구가 진행되었다. 원진영・김대곤(2014)은 ‘기후변화 적응실패’와 ‘수자원 공급위기’ 관련 키워드를 기반으로 뉴스 텍스트 데이터를 분석하였으며, 키워드 맵과 토픽 분석을 통해 주요 사회위험 이슈를 도출하였고, 이를 국가 기후변화 적응대책과 비교하는 분석을 진행하였다. 현윤진 등(2015)은 ‘기후변화’와 ‘식품’과 관련된 국내 뉴스 기사 텍스트를 기반으로 빈도 분석과 연관관계 분석을 실시하여, 두 키워드의 연관성을 살펴보는 연구를 진행하였다. 강영은・신지영・박창석(2016)과 강영은・신지영・박창석(2017)은 ‘기후변화 리스크’ 관련 신문기사를 토대로, 기후변화 관련 리스크 발생 빈도와 피해액을 분석하여 주요 사회적 리스크 항목과 기후변화 리스크 간 연관 관계를 살펴보았다. 또한, 신하나・류재나(2017)는 뉴스 기사와 사회기반시설 공간 데이터를 바탕으로 기후변화 영향 간의 상관관계를 살펴보고, 지역별 기후변화 영향의 정보를 도출하여 비교 분석하였다.
논문 자료와 연구 문헌을 활용하여 ‘기후변화’ 혹은 ‘녹색’ 관련 텍스트 데이터를 분석한 연구 사례를 살펴보면, 배규용 등(2013), Park and Kremer(2017), Jeong, Kang, Choi and Lee(2018), Callaghan, Minx and Forster(2020)의 연구를 확인할 수 있었으며, 대체로 연구적 동향이나 주요 이슈를 살펴보는 연구가 진행되었다. 배규용 등(2013)은 논문 초록 자료를 활용하여 ‘기후변화’와 ‘식품’ 키워드를 기반으로 해외 논문 텍스트 데이터를 분석하였으며, 군집분석을 통해 식품과 관련된 기후변화 연구의 주제를 살펴보았다. Park and Kremer(2017)은 토픽모델링 기반으로 개념적 유사도를 기준으로 범주화(categorization)를 진행하였고, 이를 통해 기존 문헌에서 55개의 환경 지속가능성 지표를 추출하였다. 이를 기반으로 기업의 제조 및 서비스 시스템의 지속가능성 지표로 활용 가능성에 대해 시사하였다. 또한, Jeong, Kang, Choi and Lee(2018)은 국가 R&D 과제(프로젝트)의 키워드 간 소셜네트워크 분석을 통해, 2011~2016년 동안의 한국의 녹색기술(green technology)의 연구 추이를 분석하였다. Callaghan, Minx and Forster(2020)는 기후변화 관련 연구 문헌 40만 건을 수집하여 토픽모델링을 통해 토픽 지도(topic map), 즉 연구 지형학(topography)를 생성하였다. 이를 IPCC 보고서 내의 인용된 문헌들과 비교하여 사회과학 연구 문헌의 인용이 부족함을 파악하였고, 이는 IPCC 보고서가 편향된 것이 아니며 기술적 주제에 초점을 맞춘 솔루션 지향적 사회과학 연구를 필요로 함을 제안하였다.
SNS를 활용하여 ‘기후변화’ 혹은 ‘녹색’ 관련 텍스트 데이터를 분석한 연구 사례를 살펴보면, 정예림・강정은(2019), Dahal, Kumar and Li(2019)의 연구를 확인할 수 있었으며, 대체로 국민 여론 이슈를 살펴보는 연구가 진행되었다. 정예림・강정은(2019)은 약 1년간의 기후변화 관련 국내 트위터와 네이버 블로그 게시글을 바탕으로 토픽 모델링 분석을 진행하여, 계절별 주요 키워드와 주제를 도출하였으며, 이를 통해 국민들의 기후변화 주요 정책수요 방향을 도출하였다. Dahal, Kumar and Li(2019)는 트위터로부터 토픽모델링과 감성분석을 통해서 기후변화에 대한 여론 도출 연구를 진행하였으며, 토픽모델링 및 감성분석을 통한 트윗의 논의 주제 도출과 긍정・부정・중립 여론 파악을 진행하고 이를 국가 간 비교에 활용하였다.
정부 자료를 활용하여 ‘기후변화’ 혹은 ‘녹색’ 관련 텍스트 데이터를 분석한 연구 사례는 진대용 등(2018)의 연구를 확인할 수 있었으며, 진대용 등(2018)은 국내 환경 뉴스, 환경부 보도자료, e-환경뉴스 및 환경백서의 텍스트를 기반으로 빈도 분석, 연관 분석, 토픽 모델링 분석 등을 진행하여 주요 이슈를 비교하였다.
선행연구에서 살펴본 바와 같이 기존의 텍스트 마이닝 방법을 기반으로 ‘기후변화’ 혹은 ‘녹색’ 관련 데이터를 분석한 연구 사례는 주로 뉴스 기사, 논문과 연구자료, SNS 자료를 활용한 경우가 비교적 많은 점을 알 수 있었다. 또한, 국내 정책 관련 연구에서는 정부의 보도자료를 활용한 사례를 확인할 수 있었으나, 사례가 비교적 적은 점을 알 수 있었다.
본 연구는 ‘기후변화’와 ‘녹색’의 정책적 주요 이슈와 사회적 이슈를 비교하기 위하여 진행되었으며, 이에 기존의 연구들과는 다르게 정부의 정책 자료와 뉴스 기사를 함께 활용하여 데이터를 분석할 필요가 있었다. 이는 출처가 다른 두 가지 종류의 텍스트 데이터를 기반으로 정부와 사회의 관점의 차이 및 주요 이슈를 살펴보기 위함이며, 이를 통해 본 연구는 관련 텍스트 데이터를 출처와 정권 시기 및 키워드 별로 구분하여 분석 결과를 비교하고자 하였다. 따라서, 본 연구는 비슷하게 사용되는 키워드를 중심으로 정부와 사회의 이슈를 시간의 흐름에 따라 확인하고자 하였으며, 이는 기존 연구와의 큰 차별성이라고 볼 수 있다.
2. 관련 국내 주요 정책 개요
국내 ‘기후변화’, ‘녹색’과 관련된 정책은 정권별 다양한 명칭으로 조금씩 차이를 보이지만, 녹색성장 기본법 등 정책 기반 마련에 힘입어 정부변화에 관계없이 지속적으로 기후변화대응 정책을 추진하고 있다(한수현, 2020). 그 중 최근 국내 3개 정권의 주요 관련 정책 내용을 살펴보면, 이명박 정권의 ‘녹색성장 국가전략’, 박근혜 정권의 ‘에너지 신산업 활성화 및 핵심기술 개발전략’, 문재인 정권의 ‘그린 뉴딜 정책’, ‘2050 탄소중립 추진전략’ 등이 추진되었음을 확인할 수 있다.
또한, 현재 국내 기후변화 대응을 위한 주요 법정 계획을 살펴보면, 주로 저탄소녹색성장기본법을 중심으로 구성되어 녹색성장 국가전략 하위 13개 주요 계획이 추진 중이며, 기후・에너지 분야 국가 주요 계획은 기후변화 대응・적응 계획, 녹색성장 5개년계획, 에너지 기본계획, 국가 온실가스 감축 로드맵을 중심으로 수립되어 추진 중이다.
이와 같이 국내에서 수립된 ‘기후변화’, ‘녹색’과 관련된 정책을 살펴보면, 정책 명칭에 ‘녹색성장’, ‘뉴딜’ 등의 용어가 함께 사용되었는데, 이러한 정책적 용어 사용은 기존에 사용되는 단어를 우리나라의 상황에 맞게 활용한 사례로 볼 수 있다. ‘녹색성장(Green growth)’은 2005년 유엔아시아태평양경제사회위원회(United Nations Economic and Social Commission for Asia and the Pacific)에서 아시아 태평양 지역의 지속가능한 발전을 위하여 채택한 전략으로, 2005년 서울에서 개최된 UNESCAP의 정책 책임자 사전회의에서 의제로 제기되었으며, 이들에 의하면 ‘경제 성장으로 인하여 증가하는 환경에의 압력을 경감시킴으로써 현 세대의 빈곤을 해소하기 위한 경제 성장이 다음 세대의 성장 능력을 잠식하지 않도록 하는 것’으로 정의되었다(김종연, 2010). 또한, ‘뉴딜(New Deal)’ 용어는 1932년 미국 민주당 전당대회에서 프랭클린 루스벨트가 공약한 연설에 등장했으며(양동휴, 2000), 뉴딜 정책은 경제 대공황기의 미국의 고용확대와 경기활성화 대책을 평가할 때 주목되는 정책이다(박희, 2018). ‘그린 뉴딜(Green New Deal)’ 용어는 영국의 그린 뉴딜그룹에서 처음으로 ‘그린 뉴딜정책’을 제안하였고, 유엔환경계획(UNEP)이 그린 뉴딜 레포트를 발행하면서 논의되었으며(변병설 등, 2020), 2008년 미국 대선에서 녹색 경제 성장의 방향 안에서 버락 오바마가 제기하여 관련 정책으로 채택된 것으로 알려져 있다(정선영, 2020; 박성제・이종근・이영근, 2009).
Ⅲ. 연구방법 설계
1. 텍스트 마이닝 분석 방법
4차 산업혁명 시대의 도래와 IT기술의 비약적 발전으로 빅데이터 기반의 데이터 과학은 현대 사회의 주요 분야로 자리잡고 있다. 특히, 현대 사회에는 다양한 정보가 실시간으로 생성됨에 따라, 빅데이터를 분석하여 새로운 정보나 지식을 도출하는 활동이 많아지고 있다. 이러한 빅데이터는 다양한 형태로 존재하는데, 수치 통계자료와 같이 행과 열로 구조화 가능한 형식의 정형 데이터(Structured data)와 영상, 텍스트 등과 같이 구조화하기 힘든 비정형 데이터(Unstructured data) 등으로 구분될 수 있다. 과거에는 비정형 데이터 자료의 수집 및 분석이 정형 데이터보다 어려웠는데, 이는 많은 수량의 자료를 처리하기 위한 컴퓨터 하드웨어의 성능이 부족했기 때문이다. 그러나 최근에는 컴퓨터 하드웨어와 빅데이터 기술의 비약적 발전으로 비정형 데이터의 분석 방법이 점차 발전하게 되었다.
빅데이터 분석 방법 중에는 데이터의 잠재된 패턴 및 관계 등을 파악하여 정보를 추출하는 마이닝 방식이 있으며, 마이닝 방식은 크게 데이터 마이닝과 텍스트 마이닝으로 나뉘어진다(전소라・정봉현, 2020). 광의적 개념에서는 텍스트 마이닝이 데이터 마이닝 개념에 속하지만, 협의적 개념으로 볼 때는 데이터 마이닝과 텍스트 마이닝은 다루는 데이터가 수치와 텍스트인 점에서 차이가 있다(조태호, 2001). 이 중 텍스트 마이닝 기법은 최근까지 다양한 방면에서 활용되고 있으며, 학계에서도 정책학, 경영학, 언론학, 사회학, 교육학, 어학, 관광학 등 거의 모든 분야에 활용되어 연구가 진행되고 있다. 이는 인간 사회의 정보 대다수가 텍스트 데이터를 활용하고 있으며, 텍스트 분석기법의 정교화와 함께 텍스트 마이닝 기법이 다양한 분야로 활용이 확대되고 있기 때문이다(전소라・정봉현, 2020).
텍스트 마이닝의 개념은 비정형화된 방대한 텍스트 자료로부터 유용한 패턴이나 의미 있는 정보를 추출하는 방법을 의미하며(엄성원, 2020), 텍스트 마이닝의 기능은 텍스트 분류, 텍스트 군집화, 텍스트 요약, 텍스트 분할 및 단어 연관성 추출 등이 있다(조태호, 2001). 텍스트 마이닝 분석 프로세스는 텍스트 데이터를 수집, 분석에 용이한 데이터 형태로 변환하는 전처리, 정보추출과 정보분석 등 4단계로 구분될 수 있으며(전소라・정봉현, 2020), 대표적인 텍스트 데이터의 분석방법은 단어 빈도분석(Term frequency analysis), 단어 연관성 분석(Term associated analysis), 단어 군집화 분석(Wordcluster analysis), 텍스트 네트워크 분석(Text network analysis), 토픽 모델링 분석(Topic modeling analysis) 등이 있다(황은영, 2020).
2. 연구 자료 및 분석 방법 설계
본 연구는 ‘기후변화’와 ‘녹색’, ‘그린(Green)’ 키워드를 통하여 국내 정권별 정책과 언론의 이슈를 비교하고자 하였다. 이를 위하여 2008년부터 2020년까지의 각 정권별 언론 뉴스 기사와 국내 정부 보도자료를 분석 자료로 활용하였다. 분석 대상 정권 시기는 최근 3개 국내 정권시기로, 17대, 18대, 19대 각 대통령 임기를 기준으로 데이터를 수집하였다. 이에 따라 17대 이명박 대통령 임기인 2008년 2월 25일부터 2013년 2월 24일까지의 데이터와 18대 박근혜 대통령 임기인 2013년 2월 25일부터 2017년 3월 10일까지의 데이터와 19대 문재인 대통령 임기인 2017년 5월 10일부터 가장 최근까지의 데이터를 분석대상으로 정하였다. 2020년의 데이터는 수집된 자료의 분석과 본 연구의 진행을 위하여 11월 20일까지로 데이터 수집을 종료하였다.
수집 데이터 중 언론 뉴스 기사는 한국언론진흥재단이 운영하는 빅카인즈에서 제공하는 데이터를 활용하였고, 정부 부처 보도자료는 문화체육관광부가 운영하는 정책브리핑 자료를 활용하였다. 데이터 수집을 위한 검색어는 ‘기후변화’, ‘녹색’, ‘그린(green)’을 사용하였으며, 빅카인즈와 정책브리핑에서 자료의 제목과 본문에서 검색된 게시물을 수집 대상으로 하였다.
빅카인즈에서 제공하는 언론 뉴스 기사는 중앙지, 경제지, 지역종합지, 방송사, 전문지 등을 제공하고 있으며, 제공 기사는 크게 정치, 경제, 사회, 문화, 국제, 지역, 스포츠, IT_과학 분야로 유형이 나뉘어 있는데, 본 연구에서는 검색 결과 전체에서 문화와 스포츠 유형을 제외한 결과를 분석 대상으로 하였다. 또한, 연구 분석을 위한 텍스트는 빅카인즈에서 제공하는 특성추출 키워드 명사 단어를 활용하였다.
또한, 정책브리핑이 제공하는 정부 부처의 보도자료 텍스트 데이터는 웹 스크래핑(Web Scraping) 방식으로 직접 수집하였다. 웹 스크래핑의 가장 널리 쓰이는 방법은 프로그램을 만들어 웹 서버에 쿼리를 보내 데이터를 요청하고, 이를 파싱하여 필요한 정보를 추출하는 작업을 자동으로 하는 것이다(Ryan, 2015, 2017). 본 연구는 R 프로그램을 기반으로 ‘기후변화’, ‘녹색’, ‘그린(green)’의 키워드로 정책브리핑 웹 사이트에서 검색된 각 보도자료 게시물의 본문 텍스트 자료를 수집하였으며, 전처리 과정을 위하여 게시물 날짜와 제목 등의 정보를 함께 수집하였다.
본 연구는 수집된 텍스트 데이터를 바탕으로 단어 빈도분석과 토픽 모델링 분석을 진행하였다. 분석을 위하여 수집된 데이터는 전처리 과정을 통해 단어 빈도-역문서빈도(Term Frequency-Inverse Document Frequency) 가중치를 적용하였으며, 이를 통하여 텍스트 자료의 분석을 진행하였다. TF-IDF 가중치는 아래와 같은 공식을 따르는 단어 빈도와 역문서 빈도의 곱으로 정의된다(백영민, 2017).
본 연구의 토픽 모델링 분석은 잠재적 디리클레 할당 모형(Latent Dirichlet Allocation)을 기반으로 진행하였으며, 이를 통하여 각 정권 시기의 검색어 별 주요 주제를 살펴보았다. 주요 주제를 살펴보고자 하는 LDA 분석 과정에서 중요한 부분 중 하나는 주제의 개수를 확정하는 과정이다. 주제 개수를 결정하기 위한 분석 모델은 복잡도(Perplexity), 경험적 우도(Empirical likelihood), 주변 우도(Marginal likelihood) 등의 방법을 활용할 수 있는데, 본 연구에서는 Marginal likelihood 방법 중 Griffiths and Steyvers(2004)가 제시한 조화 평균(Harmonic mean) 방법을 활용하였다(Ponweiser, 2012). 이는 깁스 샘플링(Gibbs sampling) 알고리즘을 기반으로 Log likelihood와 Harmonic mean 값을 구하는 방법으로, 이를 통해 주제의 개수를 선정하는 방법이다(Griffiths and Steyvers, 2004). 본 연구는 이러한 Harmonic mean 방법을 통하여 주제 개수를 선정하여 분석을 진행하였다.
Ⅳ. 분석 결과
1. 자료수집 결과
본 연구는 2008년부터 2020년까지의 ‘기후변화’, ‘녹색’, ‘그린’, ‘green’으로 검색된 국내 언론 뉴스 기사와 정부의 보도자료를 활용하였다. 또한 ‘그린’과 ‘green’은 하나의 단어로 수집 결과를 병합하기 위하여, 제목을 기준으로 중복된 자료를 제거하여 분석을 진행하였다. 본 연구에서 수집한 국내 정권 시기별 텍스트 데이터는 17대 정권이 2008년부터 2013년까지의 5년간 자료였고, 18대 정권은 데이터는 2013년부터 2017년까지의 4년간 자료였으며, 19대 정권의 데이터는 2017년부터 수집을 완료한 기점인 2020년까지 약 4년간의 자료를 활용하였다.
이를 통해 수집된 언론 뉴스 기사의 연도별 게시물 건수는 <그림 3>와 같이 나타났다. 전반적으로 2009년도에 188%의 가장 높은 전년대비증가율을 보였으며, 이는 17대 정권 초반인 2009년 이후 기후변화, 녹색 및 그린(Green)과 관련된 정책의 중요성이 부각된 영향이라고 볼 수 있다. 이후 2015년까지 연평균 12.0% 수준으로 감소하였으며, 2018년을 기점으로 다시 증가하는 추세를 보였다. 그 중 ‘기후변화’ 관련 기사는 2018년에 전년대비 15.6%의 증가율을 보이며 연평균 36.0% 수준으로 증가하였고, ‘녹색’ 관련 기사는 2019년에서야 34.8%의 전년대비 증가율을 보이며 많아졌으며, ‘그린(Green)’ 관련 기사는 2015년 36.1%, 2019~2020년 동안 36.5%의 전년대비 증가율을 보였다. ‘기후변화’와 ‘그린(Green)’ 관련 기사는 2020년, ‘녹색’ 관련 기사 수는 2009년이 가장 높으며, ‘기후변화’와 ‘녹색’ 및 ‘그린(Green)’ 관련 기사 수가 가장 낮은 시기는 2008년으로 나타났다. 검색된 언론 뉴스 기사의 정권 시기별 데이터를 살펴보면, ‘기후변화’와 ‘그린(Green)’ 관련 기사는 18대에서 감소하였다가 19대에서 많아졌으며, ‘녹색’ 관련 기사는 2018년까지 연평균 5.0% 수준으로 지속적인 감소 추이를 나타내었다.
또한, 수집된 정부 보도자료의 연도별 게시물 건수는 <그림 4>과 같이 나타났다. 그림의 내용과 같이 국내 정부 부처의 보도자료 ‘기후변화, 녹색, 그린(Green)’을 다루는 기사의 수는 2009년에 많아졌다가 2013년 전년대비 31.2%로 가장 큰 폭으로 감소하였고, 2017년을 기점으로 최근까지 20.4%의 연평균 증가율을 보이며 증가하였다. 정부 보도자료에서 ‘기후변화’ 관련 게시물의 증가율은 2009년 171.7%, 2020년 113.5%로 가장 높고, 2017년이 27.3% 수준으로 감소하였으며, ‘녹색’ 관련 보도자료의 증가율은 2009년이 318%로 가장 높고, 2013년에 52.6%의 큰 감소를 나타내었다. 또한 ‘그린(Green)’ 관련 보도자료는 2015년에 29.7%의 증가율을 보였으며, 2009, 2017년에 35.1%, 33.7%로 가장 큰 폭으로 감소하였다. 검색된 정부 보도자료의 정권 시기별 데이터를 살펴보면, ‘기후변화’와 ‘녹색’ 관련 보도자료는 연평균 7.2% 수준으로 지속적으로 감소했으며, ‘그린(Green)’ 관련 보도자료는 18대에서 감소하였다가 19대에서 많아짐을 알 수 있었다.
2. 빈도 분석
본 연구는 ‘기후변화’, ‘녹색’, ‘그린(Green)’ 관련 언론 뉴스 기사와 정부 보도자료의 정권 시기별 주요 등장 단어를 살펴보기 위하여 텍스트 마이닝 방식을 기반으로 본문 텍스트 데이터를 분석하였다. 본문에서 명사를 추출하기 위하여 은전한닢 형태소 분석기를 사용하였으며, 전처리 과정에서 불용어와 유사어 처리를 진행했다. 이러한 과정을 통해 <그림 5> 와 같이 각 정권 시기별 많이 등장한 단어를 살펴보았다.
이를 통해 언론 뉴스 기사의 정권 시기별 주요 등장 단어를 살펴본 결과, ‘환경’, ‘산업’, ‘사업’, ‘지역’, ‘친환경’, ‘저탄소’, ‘기업’, ‘미국’, ‘경제’ 등의 단어가 공통적으로 많이 등장한 것을 알 수 있었다. 다만, 시기별로 차이가 있었던 주요 단어를 살펴보면, 17대 정권 시기에는 ‘환경’, ‘녹색성장’, ‘중소기업’, ‘업체’ 등의 단어가 비교적 많이 등장했고, 18대 정권 시기에는 ‘홈페이지’, ‘주택’, ‘국립’, ‘학교’ 등의 단어가 비교적 많이 등장했으며, 19대 정권 시기에는 ‘코로나’, ‘뉴딜’, ‘미세먼지’, ‘위원장’ 등의 단어가 비교적 많이 등장했다.
또한, 정부 보도자료의 정권 시기별 주요 등장 단어를 살펴본 결과, ‘환경’, ‘사업’, ‘계획’, ‘지원’, ‘협력’, ‘산업’, ‘지역’, ‘정책’, ‘개최’, ‘관리’, ‘제공’ 등의 단어가 공통적으로 많이 등장한 것을 알 수 있었다. 다만, 시기별로 차이가 있었던 주요 단어를 살펴보면, 17대 정권 시기에는 ‘녹색성장’, ‘성장’, ‘저탄소’, ‘건설’ 등의 단어가 많이 등장했고, 18대 정권 시기에는 ‘국토부’, ‘생물’, ‘외교’, ‘기여’ 등의 단어가 많이 등장했으며, 19대 정권 시기에는 ‘혁신’, ‘수소’, ‘스마트’, ‘코로나’ 등의 단어가 많이 등장했다.
이를 검색 키워드와 정권 시기별로 많이 등장한 100개 단어를 다시 구분해보면 <표 2>과 같이 나타났다. 주요 단어 중 기업명, 해당 정권 대통령 이름 등의 단어는 제외하였으며, 시기와 관계없이 공통적으로 등장한 단어는 가장 많이 등장한 순서로 일부만 나열하였고, 각 시기별 개별적으로 등장한 단어는 모두 나열하였다.
위의 내용을 기반으로 알 수 있는 점은, 언론 뉴스 기사는 대체로 키워드와 시기에 관계없이 글로벌 및 사회적 이슈를 많이 다루고 있고, 정부 보도자료는 국가의 사업, 계획, 정책 등 추진활동 중심의 내용을 많이 다루는 것을 알 수 있었다. 다만, 기후변화와 관련하여 17대 정권 시기에는 녹색성장 정책, 저탄소 온실가스 감축 정책 등과 관련된 내용이 비교적 많았고, 18대 정권시기에는 유엔기후변화협약, 외교 및 반기문 사무총장, 재난 등과 관련된 내용이 비교적 많았으며, 19대 정권시기에는 코로나와 미세먼지, 국외 이슈, 혁신과 한국판 뉴딜 등과 관련된 내용이 비교적 많았다. 또한, 녹색 및 그린(Green)과 관련하여 17대 정권 시기에는 저탄소 녹색성장 정책, 국내 업체의 저탄소 활동과 정부의 육성 지원, 녹색 R&D와 상품 등과 관련된 내용이 비교적 많았고, 18대 정권시기에는 녹색 관련 행사 및 지자체 활동, 학교 체험 및 대학교 활동, 품종 개발 및 녹색건축 등과 관련된 내용이 비교적 많았으며, 19대 정권시기에는 한국판 뉴딜정책, 코로나 및 미세먼지 대응, 신재생에너지 활성화 등과 관련된 내용이 비교적 많은 점을 확인하였다.
3. 토픽 모델링 분석
본 연구는 수집된 데이터를 토대로 LDA 기반 토픽 모델링 분석을 진행했으며, 이를 통하여 각 시기별 언론 뉴스 기사와 정부 보도자료의 주요 주제를 살펴보고자 하였다. 분석은 검색 키워드인 ‘기후변화’, ‘녹색’, ‘그린(Green)’으로 각각 수집된 문서에 대하여 각 국내 정권 시기별로 구분하여 진행하였다. 토픽 모델링 분석의 주제 수 선정은 조화 평균(Harmonic mean) 방법을 활용하였으며, 최대 40개 주제 안에서 가장 적절한 주제 수를 선정하여 주요 내용을 살펴보았다. 본 연구는 데이터 종류 별 토픽 도출의 최적화를 위해 기후변화 및 녹색 관련 업무 경험과 토픽모델링 분석경험을 보유하고 있는 연구진으로 검토 인원을 구성하였다. 또한, 뉴스 기사와 정부 보도자료의 넓은 주제를 이해하기 위하여 정책학, 국제개발학, 공학, 경영학 등 다양한 전공 분야의 연구자로 검토 집단을 구성하였다. 주제 분석은 각 문서의 probability가 약 70% 이상인 문서들의 주요 내용을 검토하였으며, 독립성을 위해 각 연구자의 검토는 개별적으로 수행하여 1차 토픽을 도출하였고, 추후 두 차례의 취합 및 논의를 거쳐 최종 토픽을 확정하였다. 토픽 모델링 분석을 바탕으로 살펴본 각 주제 분류의 시각화 결과는 아래 <그림 6>, <그림 7>과 같이 확인할 수 있다.
토픽 모델링 시각화 자료의 각 주제 간 거리가 상대적 벡터(vector) 거리인 점을 감안할 때, 국내 ‘기후변화’와 ‘녹색’ 및 ‘그린(Green)’ 관련 언론 뉴스 기사의 텍스트 자료는 주제가 다양하게 분산되어 있음을 확인할 수 있었고, 정부 보도자료의 텍스트 자료는 특정 주제에 집중되어 나타나는 점을 확인할 수 있었다. 이를 통해 언론 뉴스 기사는 다양한 관점에서 기후변화와 녹색 및 그린(Green)에 대한 내용을 다루고 있는 것을 알 수 있으며, 정부 보도자료는 정부 정책 방향을 기반으로 시기별로 비슷한 내용을 반복적으로 다루고 있는 것을 알 수 있다.
또한, 각 주제 분석 결과 중 본 연구가 살펴보려는 ‘기후변화’ 혹은 ‘녹색’과 무관한 색깔, 신호등, 문화 관련 주제 등이 포함되어 있음을 확인하였으며, 전문가의 교차 검토를 통하여 기후변화 대응 혹은 환경 등의 의미와 관련되지 않은 주제는 분석에서 제외하였다. 이를 통하여 각 시기와 키워드 별 언론 뉴스 기사와 정부 보도자료에서 나타난 주제 수는 <표 3> 과 같이 나타났다.
위 결과를 통해 언론 뉴스기사 텍스트 자료의 주제는 정부 보도자료보다 비교적 적은 것을 알 수 있었다. 또한, 정권시기 별로는 17대 텍스트 자료의 주제 개수가 가장 많았고, 19대, 18대 순으로 많았다. 다만, 각 시기별 데이터 수집 기간이 각 5년, 4년, 4년인 점을 감안하면, 17대와 19대 시기의 자료에 비교적 다양한 주제가 있었음을 추론할 수 있었다.
이렇게 진행한 토픽 모델링 결과를 토대로 본 연구는 각 자료 종류, 검색 키워드, 국내 정권시기 별 도출된 해당 주제의 내용을 6가지 카테고리로 재분류하여 비교 분석을 진행하였다. 6가지 카테고리는 감축・적응, 활동 주체 및 종류, 기후변화 영향, 탄소중립 추진부문, 녹색기술・사업, 기후 기술 등으로 구성하였으며, 카테고리의 구성은 <표 4>와 같다. 본 연구는 재분류 결과의 비교 분석을 위하여, 카테고리 구분을 위한 기준 수는 약 10개 내외로 구성하였고, 이에 녹색기술・사업, 기후기술 구분 기준은 각대분류와 중분류를 바탕으로 기준을 선정하였다.
본 연구는 선정된 카테고리와 각 토픽 모델링 분석 결과를 기반으로 전체 주제 개수 대비 해당 카테고리의 해당 주제 개수로 비율을 계산하였으며, 이를 통해 토픽 모델링 분석 결과를 다각도에서 효율적으로 비교하여 분석하고자 하였다. 각 카테고리 별 재분류된 주제의 비율은 아래 <표 5> 부터 <표 10>까지의 내용과 같이 확인할 수 있었고, 기타 분류는 분석에서 제외하였고, 가로의 합계가 100%이며, 그 외 가장 큰 주제 수와 작은 주제수를 기준으로 음영처리를 하여 분석을 진행하였다.
첫 번째로 감축 및 적응의 재분류 결과에 따르면, 언론 뉴스 기사는 대체로 다분야와 온실가스 감축 분야의 주제가 비교적 많은 것을 확인할 수 있었으며, 정부 보도자료는 대체로 기후변화 적응 분야의 주제가 비교적 많은 것을 확인할 수 있었다.
또한, ‘기후변화’와 관련된 언론 뉴스 기사와 정부 보도자료는 기후변화적응 분야의 주제가 비교적 많았고, ‘녹색’과 ‘그린(Green)’ 관련 언론 뉴스 기사는 다분야와 온실가스 감축의 주제가 비교적 많았으며, ‘녹색’과 ‘그린(Green)’ 관련 정부 보도자료는 기후변화 적응 관련 주제가 비교적 많았다.
정권 시기별로는 ‘기후변화’와 관련된 언론 뉴스 기사가 17대와 19대에는 다분야 주제가 많으나 18대에는 기후변화 적응 관련 주제가 많았던 것을 알 수 있으며, ‘녹색’과 ‘그린(Green)’ 관련 언론 뉴스 기사는 시기가 지날수록 다분야 주제의 비율은 줄어들고 온실가스 감축 분야 주제의 비율은 늘어나고 있음을 알 수 있었다. 또한, 정부 보도자료는 시기가 지날수록 기후변화 적응 분야의 주제 비율이 많아짐을 확인할 수 있었다.
두 번째로 활동 주체 및 종류의 재분류 결과에 따르면, 언론 뉴스 기사와 정부 보도자료 모두 전반적으로 정부 정책・사업의 주제가 비교적 많았다. 정부 관련 내용을 제외하면 언론 뉴스 기사는 전반적으로 지자체 활동・사업, 산업 생태계 순으로 관련 내용이 비교적 많았고, 정부 보도자료는 국외 동향 및 외교활동, 산업 생태계, 기술 R&D・협력 순으로 관련 내용이 비교적 많았다.
정부 관련 내용을 제외하면 언론 뉴스 기사와 정부 보도자료 전체에서 ‘기후변화’에 대한 내용은 연구 활동 및 대학 사업, 산업 생태계 순으로 관련 주제가 비교적 많았다. ‘녹색’에 대한 내용은 지자체 활동・사업, 산업생태계 순으로 관련 주제가 비교적 많았다. ‘그린(Green)’에 대한 내용은 산업 생태계, 지자체 활동・사업, 기술 R&D・협력 순으로 관련 주제가 비교적 많았다.
또한, 정부 관련 내용을 제외하면 ‘기후변화’, ‘녹색’, ‘그린(Green)’과 관련하여 17대 정권 시기에는 산업 생태계 관련 주제가 비교적 많았으며, 18대 정권 시기에는 산업 생태계, 연구 활동 및 대학 사업 순으로 관련주제가 비교적 많았고, 19대 정권 시기에는 지자체 활동・사업, 산업 생태계 순으로 관련 주제가 비교적 많았다. 다만, 19대 정권 시기의 언론 뉴스기사에서는 ‘녹색’, ‘그린(Green)’과 관련하여 지자체 활동・사업 관련 주제가 가장 많이 나타났다.
세 번째로 기후변화 영향 별 재분류 결과에 따르면, 언론 뉴스 기사와 정부 보도자료 모두 전반적으로 교육홍보・국제협력의 주제가 비교적 많았다. 교육홍보・국제협력 관련 내용을 제외하면 언론 뉴스 기사는 기후변화 감시・예측, 적응산업・에너지, 생태계 순으로 관련 내용이 비교적 많았으며, 정부 보도자료는 산림, 농업, 적응산업・에너지, 기후변화 감시・예측순으로 관련 내용이 비교적 많았다.
교육홍보・국제협력 관련 내용을 제외하면 언론 뉴스 기사와 정부 보도자료 전체에서 ‘기후변화’에 대한 내용은 기후변화 감시・예측, 산림 순으로 관련 주제가 비교적 많았고, ‘녹색’에 대한 내용은 기후변화 감시・예측, 적응산업・에너지, 산림 순으로 관련 주제가 비교적 많았으며, ‘그린(Green)’에 대한 내용은 기후변화 감시・예측, 적응산업・에너지 순으로 관련 주제가 비교적 많았다.
또한, 교육홍보・국제협력 관련 내용을 제외하면 ‘기후변화’, ‘녹색’, ‘그린(Green)’과 관련하여 17대 정권 시기에는 기후변화 감시・예측, 적응산업・에너지 순으로 관련 주제가 비교적 많았으며, 18대 정권 시기에는 기후변화 감시・예측, 적응산업・에너지, 산림 순으로 관련 주제가 비교적 많았고, 19대 정권 시기에는 기후변화 감시・예측, 적응산업・에너지, 생태계, 산림 순으로 관련 주제가 비교적 많았다.
네 번째로 탄소중립 추진부문 별 재분류 결과에 따르면, 언론 뉴스 기사는 산업, 탄소흡수원, 에너지 부문 순으로 관련 내용이 비교적 많았으며, 정부 보도자료는 탄소흡수원, 농축수산 부문 순으로 관련 내용이 비교적 많았다.
언론 뉴스 기사와 정부 보도자료 전체에서 ‘기후변화’에 대한 내용은 탄소흡수원, 농축수산, 에너지, 산업 부문 순으로 관련 주제가 비교적 많았고, ‘녹색’에 대한 내용은 탄소흡수원, 산업, 농축수산 부문 순으로 관련 주제가 비교적 많았으며, ‘그린(Green)’에 대한 내용은 산업, 탄소흡수원, 에너지, 농축수산 부문 순으로 관련 주제가 비교적 많았다.
또한, ‘기후변화’, ‘녹색’, ‘그린(Green)’과 관련하여 17대 정권 시기에는 산업, 탄소흡수원, 농축수산 부문 순으로 관련 주제가 비교적 많았으며, 18대 정권 시기에는 탄소흡수원, 산업, 농축수산 부문 순으로 관련 주제가 비교적 많았고, 19대 정권 시기에는 탄소흡수원, 산업, 농축수산 부문 순으로 관련 주제가 비교적 많았다.
다섯 번째로 녹색기술・사업 별 재분류 결과에 따르면, 언론 뉴스 기사는 환경보호・보전, 신재생에너지 보급・확산, 친환경 농수산식품 공급, 그린주택・도시・기반시설 순으로 관련 내용이 비교적 많았으며, 정부 보도자료는 친환경 농수산식품 공급, 환경보호・보전, 그린주택・도시・기반시설 순으로 관련 내용이 비교적 많았다.
언론 뉴스 기사와 정부 보도자료 전체에서 ‘기후변화’에 대한 내용은 환경보호・보전, 친환경 농수산식품 공급, 탄소저감 플랜트・시스템, 첨단 수자원 순으로 관련 주제가 비교적 많았고, ‘녹색’에 대한 내용은 환경보호・보전, 친환경 농수산식품 공급, 그린주택・도시・기반시설 순으로 관련 주제가 비교적 많았으며, ‘그린(Green)’에 대한 내용은 환경보호・보전, 친환경 농수산식품 공급, 그린주택・도시・기반시설, 신재생에너지 보급・확산 순으로 관련 주제가 비교적 많았다.
또한, ‘기후변화’, ‘녹색’, ‘그린(Green)’과 관련하여 17대 정권 시기에는 친환경 농수산식품 공급, 환경보호・보전 순으로 관련 주제가 비교적 많았으며, 18대와 19대 정권 시기에는 환경보호・보전, 친환경 농수산식품 공급, 그린주택・도시・기반시설 순으로 관련 주제가 비교적 많았다.
마지막으로 기후기술 별 재분류 결과에 따르면, 언론 뉴스 기사는 에너지 수요, 산림・육상, 기후 예측・모니터링 순으로 관련 내용이 비교적 많았으며, 정부 보도자료는 산림・육상, 농업・축산, 에너지수요, 해양・수산・연안, 기후 예측・모니터링 순으로 관련 내용이 비교적 많았다.
언론 뉴스 기사와 정부 보도자료 전체에서 ‘기후변화’에 대한 내용은 산림・육상, 해양・수산・연안, 기후 예측・모니터링, 농업・축산, 다분야, 물관리 순으로 관련 주제가 비교적 많았고, ‘녹색’에 대한 내용은 에너지 수요, 산림・육상, 농업・축산, 다분야 순으로 관련 주제가 비교적 많았으며, ‘그린(Green)’에 대한 내용은 에너지 수요, 농업・축산, 산림・육상, 송배전・전력IT, 다분야 순으로 관련 주제가 비교적 많았다.
또한, ‘기후변화’, ‘녹색’, ‘그린(Green)’과 관련하여 17대 정권 시기에는 에너지 수요, 산림・육상, 농업・축산, 해양・수산・연안, 다분야 순으로 관련 주제가 비교적 많았으며, 18대 정권 시기에는 산림・육상, 에너지 수요, 농업・축산, 다분야, 기후 예측・모니터링 순으로 관련 주제가 비교적 많았고, 19대 정권 시기에는 에너지 수요, 산림・육상, 농업・축산, 기후 예측・모니터링, 해양・수산・연안, 다분야 순으로 관련 주제가 비교적 많았다.
Ⅴ. 결론
본 연구는 국내 ‘기후변화’와 ‘녹색(Green)’ 관련 정책적・사회적 이슈를 살펴보기 위하여 국내 최근 3개 정권 시기별 주요 언론 뉴스 기사와 정부 보도자료의 텍스트 자료를 비교・분석하였다. 이를 위하여 ‘기후변화’, ‘녹색’, ‘그린(Green)’ 키워드를 기반으로 약 13년 간의 국내 뉴스 기사와 보도자료 자료를 수집하였으며, 수집된 자료 중 본문 텍스트 데이터를 토대로 전처리 과정을 거쳐 분석에 필요한 데이터를 정리하였다. 이를 바탕으로 본 연구는 텍스트 데이터의 빈도 분석과 토픽 모델링 분석을 진행하였으며, 아래와 같은 시사점을 도출하였다.
첫째, 본 연구가 수집한 기간의 데이터를 바탕으로 볼 때, ‘기후변화’, ‘녹색’, ‘그린(Green)’ 관련 국내 언론 뉴스 기사와 정부 보도자료는 공통적으로 2009년에 많아졌다가 점차 감소하였고, 최근 3~4년 전부터 다시 증가하는 추세를 보이는 점을 확인하였다. 이는 국내 정권과 사회의 시대적 변화에도 불구하고, 기후변화 대응 및 녹색 이슈의 중요성은 사라지지 않고 다시 부각되고 있는 것으로 판단된다.
둘째, 빈도분석 결과를 통해 언론 뉴스 기사와 정부 보도자료에서 많이 사용되는 단어가 각 정권 시기별 주요 추진정책과 사회적 주요 사건 등에 따라 차이가 발생하는 점을 확인할 수 있었다. 그리고 ‘기후변화’, ‘녹색’, ‘그린(Green)’ 키워드에 따라 등장하는 주요 단어도 차이가 있는 점을 확인하였다. 그러나 수집된 전체 기간 내의 데이터에서 정권 시기나 키워드에 관계없이 많이 사용된 단어가 대부분 비슷한 점을 확인할 수 있었고, 이를 통해 기후변화 혹은 녹색 관련 주요 정책 추진 방향과 사회적 이슈가 비슷한 방식의 텍스트로 전달되는 점을 알 수 있었다.
셋째, 본 연구에서 수집된 정부 보도자료 수가 언론 뉴스 기사 수보다 약 10배 정도 적었는데, 토픽 모델링 분석을 위해 선정한 주제 수는 대체로 정부 보도자료가 언론 뉴스 기사보다 많이 나타났다. 이를 통해 정부의 보도자료 문서가 발간되는 수는 정량적으로 언론의 뉴스 기사보다 적으나, 정성적으로 문서에 작성된 내용은 정부 보도자료가 언론 뉴스 기사보다 다양한 주제로 구성되어 전달되는 점을 확인할 수 있었다. 다만, 토픽모델링 시각화 결과 자료를 기반으로 살펴볼 때, 언론 뉴스 기사는 전반적인 사회 이슈를 다양하게 다루지만, 정부 보도자료는 국가 주요 정책방향에 따라 특정 이슈를 집중적으로 다루는 점을 확인할 수 있었다. 이러한 특징은 향후 언론 뉴스 기사는 특정 사회 이슈를 다각도로 분석하거나, 정부 보도자료가 일반적인 사회 내용 토대로 내용을 구성하여, 상호 보완적인 발전이 필요할 것으로 보인다.
넷째, 토픽 모델링 결과를 토대로 각 주제 비율을 재분류한 결과를 볼 때, 언론 뉴스 기사와 정부 보도자료는 비슷하지만 조금씩 다른 결과를 보여주는 것을 확인할 수 있었다. 이를 통해 실제 정부가 중요하게 생각하는 이슈와 사회가 느끼는 중요한 이슈가 일부 시각에서는 차이를 보이는 것으로 짐작할 수 있었으며, 정부의 기조가 사회적으로 받아들여지거나 실제 추진되는 과정 사이에 간극이 있음을 텍스트 분석으로 확인하였다. 이는 향후 정부의 주요 정책 이슈를 사회적 이슈로 설명 및 전달하는 방법과 주요 사회적 관심 사항이 정책에 반영되는 방법의 보완이 필요함을 확인할 수 있었으며, 사회적으로 정부의 기조가 받아들여지는 과정의 모니터링이 필요할 것으로 보여진다.
다섯째, 토픽 모델링 결과의 각 주제 비율을 검색 키워드와 정권 시기별로 볼 때, 일부 내용을 제외하고 대체적으로 키워드나 시기에 상관없이 비슷한 주제 종류에 대해 다루고 있는 점을 확인할 수 있었다. 이를 통해 기후변화와 녹색(Green) 관련 국내 정책의 내용과 사회적 이슈가 일부 정권 시기별 표현 방식과 추진 방식은 조금 다르더라도, 본질적으로 정책 추진 방향과 사회적 관심 분야에는 큰 차이가 없는 점을 짐작할 수 있었다. 이는 국내 기후변화 대응 정책과 녹색(Green) 정책의 주요 추진 방향이 일치하며, 사회적 관점에서도 기후변화와 녹색(Green)의 주요 내용이 일치하는 것으로 보여진다.
본 연구는 기존에 함께 사용되었던 용어인 기후변화와 녹색(Green) 키워드를 통하여 관련 국내 정책과 언론의 주요 이슈를 정권 시기별로 비교・분석하였다. 또한, 기존 연구와는 다르게 토픽 모델링 결과를 토대로 다양한 시각에서 주제의 비율을 파악하였으며, 이를 통해 자료 출처와 키워드 및 시기별로 데이터 결과를 분석한 점에서 연구의 의의가 있다고 할 수 있다. 본 연구를 통해 도출된 분석 결과는 향후 국내 정부가 추진하는 기후변화 대응과 녹색(Green) 관련 정책에 참고자료가 될 수 있을 것이다. 다만, 본 연구는 수집된 텍스트 데이터 이슈 비교・분석을 진행하여 현황 파악에 주 목적을 두었으며, 향후 추가적 연구를 통해 정책제언과 방향성 제시 및 각 데이터 간 관계성 분석 등이 필요할 것으로 보여진다. 또한, 언론 뉴스 기사와 정부 보도자료를 중심으로 분석을 진행하면서 학술 논문이나 SNS 등 다른 텍스트 데이터 종류를 함께 활용하지 못하였다. 이러한 한계점의 보완은 향후 후속 연구를 통하여 본 연구에 이어 지속적으로 진행될 필요가 있을 것이다.
Acknowledgments
본 논문은 녹색기술센터가 수행한 “융‧복합 기후기술 기반의 데이터 플랫폼 구축 및 인벤토리 연구(과제번호: F2130101)” 과제를 토대로 작성되었음.
Notes
References
- 강영은・신지영・박창석, 2016, “텍스트마이닝을 활용한 우리나라 기후변화 리스크 평가 및 적응 대책 논의,” 『한국도시설계학회지』, 17(2), pp.68-84.
- 강영은・신지영・박창석, 2017, “신문기사 분석을 통한 우리나라 기후변화 리스크별 상호 영향 관계 연구,” 『한국환경경제학회 하계학술대회논문집』, 인하대학교, pp.321-332.
- 관계부처 합동, 2015, 『기후 변화 대응을 위한 「에너지 신산업 활성화 및 핵심기술 개발 전략」 이행 계획』, 서울: 관계부처합동.
- 관계부처 합동, 2020, 『「한국판 뉴딜」 종합계획 : 선도국가로 도약하는 대한민국으로 대전환』, 세종 : 문화체육관광부 관계소통실.
- 국가과학기술자문회의, 2020, 『2021년 신기후체제에 대응하는 기후오너십 활성화 전략』, 서울: 국가과학기술자문회의.
- 기획재정부・교육과학기술부・행정안전부・문화체육관광부・농림수산식품부・지식경제부 등, 2009, 『일자리 창출을 위한 「녹색 New Deal 사업」 추진방안』, 과천 : 기획재정부.
- 김종연, 2010, “‘녹색성장’과 지형학적 연구의 기여,” 『대한지리학회지』, 45(1), pp.75-94.
- 녹색성장위원회, 2009, 『(요약본) 녹색성장 국가전략 및 5개년계획』, 서울: 녹색성장위원회.
- 대한민국정부, 2020, 『지속 가능한 녹색사회 실현을 위한 대한민국 2050 탄소중립 전략』, 서울: 대한민국정부.
- 박성제・이종근・이영근, 2009, “기후변화에 따른 그린뉴딜의 세계적인 동향,” 『대한토목학회지』, 57(9), pp.10-19.
- 박희, 2018, “세계 대공황기 미국과 일본의 대응전략: 구성주의적 평가,” 『담론201』, 21(1), pp.153-193.
- 배규용・박주현・김정선・이영섭, 2013, “텍스트 마이닝 기법을 활용한 기후변화관련 식품분야 논문초록 분석,” 『한국데이터정보과학회지』, 24(6), pp.1429-1437.
- 백영민, 2017, 『R를 이용한 텍스트 마이닝』, 파주: 한울 아카데미.
- 변병설・이영성・윤동근・최민성・이희정, 2020, “그린 뉴딜정책,” 『도시정보』, 461, pp.5-16.
- 신하나・류재나, 2017, “텍스트마이닝 기법을 활용한 사회기반시설 기후변화 영향의 공간정보 표출,” 『Korean Journal of Remote Sensing』, 33(5-3), pp.773-786.
- 양동휴, 2000, “뉴딜 경제정책의 공과,” 『경제사학』, 28, pp.167-204.
- 엄성원, 2020, “텍스트 마이닝을 활용한 Youtube 광고에 대한 소비자 인식 분석,” 『경영과 정보연구』, 39(3), pp.181-193.
- 원진영・김대곤, 2014, “텍스트마이닝을 활용한 사회위험 이슈 도출,” 『한국위기관리논집』, 10(7), pp.33-52.
- 이천환・안세진・황한수・이은창・한수현, 2020, “다출처 자료 기반 SDGs 측정방법 개발: Goal 13을 중심으로,” 『통계청 통계개발원 제10회 국가통계방법론 심포지엄』, 대전 통계센터.
- 전소라・정봉현, 2020, “텍스트 마이닝을 활용한 관광기반형 장소마케팅 전략에 관한 연구: 목포시 원도심을 사례로,” 『지역사회연구』, 28(3), pp.31-57.
- 정선영, 2020, “정의당의 그린뉴딜 - 기후 위기 극복과 자본주의를 조화시키려 하기,” 『마르크스21』, 33, pp.11-27.
- 정예림・강정은, 2019, “기후변화 정책 수립 지원을 위한 소셜 빅데이터 분석,” 『환경정책』, 27(4), pp.211-239.
- 조태호, 2001, “텍스트 마이닝의 개념과 응용,” 『지식정보인프라』, 5, pp.76-85.
- 진대용・강성원・최희선・한국진・김도연, 2018, 『기후환경 이슈 분석을 위한 텍스트 마이닝 활용방안 연구』, (기후환경정책연구; 2018-04), 세종: 한국환경정책・평가연구원.
- 한수현, 2020, “기후기술 현황과 전망,” 『한국기후변화학회 제3회 총괄분과 전문가 워크숍』, 온라인.
- 현윤진・김정선・정진욱・윤시몬・이문수, 2015, “기후변화 및 식품 관련 뉴스기사의 텍스트 마이닝,” 『한국데이터정보과학회지』, 26(2), pp.419-427.
- 황은영, 2020, “텍스트 마이닝을 활용한 ‘한국음악치료학회지’의 토픽 모델링 및 트렌드분석(1999~2019),” 『음악치료학회지』, 22(2), pp.29-47.
- Ryan, E., 2017, 『파이썬으로 웹 크롤러 만들기』, (한선용 역), 서울: 한빛미디어(원서출판 2015).
- Callaghan, M. W., J. C. Minx, and P. M. Forster, 2020, “A topography of climate change research,” Nature Climate Change, 10, pp.118-123. [https://doi.org/10.1038/s41558-019-0684-5]
- Dahal, B., S. A. P. Kumar, and Z. Li, 2019, “Topic modeling and sentiment analysis of global climate change tweets,” Social Network Analysis and Mining, 9(1), 24. [https://doi.org/10.1007/s13278-019-0568-8]
- Griffiths, T. and M. Steyvers, 2004, “Finding scientific topics,” Proceedings of the National Academy of Sciences of the United States of America (PNAS), 101(Supplement 1), pp.5228-5235. [https://doi.org/10.1073/pnas.0307752101]
- Jeong, J. Y., I. Kang, K. S. Choi, and B. H. Lee, 2018, “Network analysis on green technology in national research and development projects in Korea,” Sustainability, 10(4), 1043. [https://doi.org/10.3390/su10041043]
- Park, K. and G. E. O. Kremer, 2017, “Text mining-based categorization and user perspective analysis of environmental sustainability indicators for manufacturing and service systems,” Ecological Indicators, 72, pp.803-820. [https://doi.org/10.1016/j.ecolind.2016.08.027]
- Ponweiser, M., 2012, “Latent dirichlet allocation in R,” Diploma Thesis, Vienna University of Economics and Business, Vienna.
- Ryan, M., 2015, Web scraping with Python : Collecting data from the modern web, Sebastopol, CA: O’Reilly Media.
- 국가기후기술정보시스템, 2021, https://www.ctis.re.kr/ko/index.do, , [2021.3.15]
- 국가기후변화적응정보포털, 2021, https://kaccc.kei.re.kr/portal/index.do, , [2021.3.15]
- 녹색성장위원회, 2020, http://www.greengrowth.go.kr, , [2021.3.17]
- 녹색인증, 2021, https://www.greencertif.or.kr/ptl/fMainC/main.do, , [2021.3.17]
Appendix
이천환: 고려대학교 과학기술학협동과정 대학원 박사과정으로 재학 중이며, 현재 녹색기술센터에 연구원으로 재직 중이다. 빅데이터 분석, 정량적 통계 분석 방법론을 사용한 데이터 분석 연구가 주요 관심 분야이며, 녹색기술센터의 국가기후기술정보시스템을 통한 녹색・기후변화 관련 정보화 및 데이터 분석 업무를 수행하고 있다(chlee@gtck.re.kr).
황한수: 광주과학기술원에서 신소재공학 박사학위를 취득하고, 현재 녹색기술센터 Post-Doc.으로 재직 중이다. 녹색/기후기술 R&D 분석 및 통계 연구와 텍스트 마이닝, 네트워크 분석 기반의 지식통합(knowledge synthesis) 연구를 수행하고 있다(hshwang@gtck.re.kr).
안세진: 한국외국어대학교 국제학과 박사과정으로 재학 중이며, 현재 녹색기술센터에 연구원으로 재직 중이다. 녹색 기후기술 확산을 위한 과학기술 정책연구 및 녹색미래사회 구현을 위한 기술 분석 연구가 주요 관심분야이며, 녹색기술센터의 국가 R&D 조사분석 및 기후기술 산업통계 업무를 수행하고 있다(sejin_an@gtck.re.kr).
이은창: 인하대학교 지속가능경영 대학원에서 지속가능경영학 석사학위를 취득하고 현재 임팩트 컨설팅 기업인 (주)트리플라잇에서 데이터 사이언티스트로 재직중이다. 지속가능성 관련 데이터 분석 업무를 수행하고 있다(luca@triplelight.co).