기록하지 않은 사실은 사라지고, 기억은 필요에 따라 다르게 남는다. 코로나-19는 우리에게 어떤 의미로 남을까? 코로나-19에 대한 1년의 기록, 데이터 분석 그리고 데이터 관점의 지속 가능성을 논의한다.

일정: 2021년 3월 6일 14:00 – 17:00

장소: 숙명여대 오픈스퀘어 D (온라인 생방송)

온라인 채널: https://www.youtube.com/channel/UCoezsjw8NsN8BFsEE7fWyUw

행사 소개페이지: https://opendataday.org/kr/

프로그램 소개

발표 1 : 코로나 19 공공데이터API 활용 가이드

2020년 1월 한국 첫 코로나19 확진자가 발생한 이후 국내에서도 방대한 양의 관련 공공데이터가 생성, 활용되고 있다. 매일 공개되는 일별 확진자 수 또한 이 데이터에서 비롯된 것이다. 하지만 공공데이터를 활용해 기존에 제공되고 있는 정보보다 더 의미 있는 분석을 만들 수는 없는지에 대한 문제는 여전히 남는다. 더불어 사람들의 기억은 휘발되기에, 이 시기 한국 상황은 어떠했는지 중립적인 시각에서 기록을 남기는 것도 중요하다. 본 발표는 국내 코로나19 감염, 확산의 시간에 따른 변화와 집단별 차이를 분석하고자 한다. 코로나19 공공데이터 API를 활용한 것이며, 이를 보여줌으로써 코로나19 공공데이터 활용방안도 소개할 것이다. 웹 상에서 어떤 데이터를 어떻게 얻을 수 있는지 알려주고, 가능한 분석과 시각화의 예를 보일 것이다.

발표 2: 숨겨진 정보를 데이터로! 집단 감염 데이터 분석

본 분석은 코로나 바이러스로 인한 업종별 집단 감염 수를 비교하기 위해 시행되었다. 집단 감염 관련 데이터가 활용가능한 형태로 제공되지 않아 질병관리청에서 제공하는 정례브리핑 자료에서 집단 감염 데이터를 분리하였다. 2020년 1월부터 2021년 2월까지의 집단 감염 사건과 발생 장소, 브리핑 일자 등을 수집하여 태블로 형태로 데이터화하고, 직종에 따른 집단 감염 수를 시각화했다. 그 결과 종교시설 및 단체, 요양병원 및 시설, 지인 및 소모임, 의료기관, 직장 순으로 높게 나타났다. 분석 과정에서 정부의 일관되지 못한 데이터 제공과 정보 재사용이 불가한 자료 제공에 대한 아쉬움이 있었으며 업종 분류를 위한 명확한 기준 제시가 곤란했다는 어려움이 있었다. 또한 향후 데이터의 지속적인 업데이트를 위한 효율적인 방법을 강구해야 한다.

발표 3: Link! 백신으로 보는 국가별 코로나 대응 전략

코로나 19는 범세계적인 문제이며, 데이터를 활용하여 현 상황을 극복하려는 노력 또한 특정 국가만의 노력으로 완수할 수 없다. 하지만 지난 1년, 국내에서만 수차례 이어진 대형 악재 속에서 한국 상황을 정리하기에도 버거워 팬데믹 상황을 넓게 보기란 요원했다. 때문에 코로나 19에 대응하는 해외의 사례는 개연성이나 상관성을 찾기 힘들었고, 미디어에서 전달하는 단편적인 정보들로 접할 수 밖에 없었다.

 한국을 넘어 전세계의 코로나 19 확진 현황 및 인구통계학적 데이터를 바탕으로 분석을 시도했다. 다만 분석의 범위가 너무 방대하다고 판단하여 현 상황의 게임체인저가 될 백신을 중심으로 주제를 좁혀보았다. 이를 통해 각국의 백신 확보 전략과 한국의 상황을 비교하고, 나아가 글로벌 환경에서 범세계적 데이터 확보의 중요성을 알아보고자 한다.

발표 4: 코로나 확진자 동선 확인을 위한 데이터 수집과 분석 방법, 우리에게 남겨진 이슈

데이터 경제 시대에서 공공데이터 활용의 중요성은 더욱 부각되고 있다. 특히 코로나19 시대에서 개방된 공공데이터는 일반 시민, 의료 분야 종사자 및 국가 차원에서 의사결정 지원에 많은 기여를 하고 있다. 그렇지만 프라이버시 보호를 위한 개인정보 보호 또한 데이터의 개방 시 필수적으로 점검해야 하는 사항이다. 따라서 코로나19 관련 일부 데이터 중에는 공개 범위, 공개 대상 및 공개 시점 등 또한 제한적이거나 한시적인 경우가 발생하며 그 결과 데이터 분석 및 예측에 이르기까지의 처리 시간이 지연되거나 누락된 데이터로 인한 정보의 완전성이 깨질 수 있다. 그러므로 원시데이터의 생성에서부터 수집, 정제, 가공 및 분석에 이르는 과정이 기계적인 도구로 자동화 될 수 있어야 하며 데이터의 재사용성 및 재활용성을 보장할 수 있어야 한다. 이번 세미나에서는 코로나 19 관련 데이터 중에서 확진자 동선 정보 분석에 필요한 데이터들을 기반으로 데이터 분석 라이프사이클에 따라 처리하면서 발생하는 이슈들을 살펴보고, 나아가서는 이러한 공공데이터가 완전성, 적시성을 갖췄을 때 우리가 생산해 낼 수 있는 서비스들에 대한 예를 보이고자 한다.

Leave a Reply

Your email address will not be published. Required fields are marked *