Posted by & filed under 정보.

코리아데이터허브팀에서 오픈 데이터 핸드북을 번역했습니다.

Open Knowledge Foundation에 의해 만들어진 본 핸드북은 오픈 데이터의 개념과 방법에 대해 자세히 기술하고 있습니다. 원문은 웹사이트에서도 볼 수 있습니다. 한글 버전도 웹사이트에 곧 반영될 예정입니다.

핸드북의 전반에서 사용되는 오픈의 의미를 다음과 같은 맥락으로 이해하고 번역을 했습니다.

‘Open’이란?

‘오픈’이란 단어는 종종 ‘열린’ 이나 ‘공개’ 란 의미로 번역됩니다. 오픈 데이터의 의미도 많이 다르지 않습니다. 그러나 오픈 데이터를 다른 설명없이 ‘열린 데이터’ 또는 ‘공개 데이터’로 번역하기엔 이 단어가 포함하는 의미가 포괄적이기에 사전적인 설명을 추가합니다.

1. 열린
2. 공개의; 이용할 수 있는
3. 가로막은 것이 없는; 울타리 등이 없는
4. 틈이 있는
5. 규제를 받지 않는; 폐쇄되지 않은
6. 개방된; 공개된

오픈이란 ‘열린, 공개된’ 상태도 중요하지만 규제를 받지 않고 이용할 수 있는 조건도 매우 중요한 의미입니다. 우리가 이곳에서 사용하는 오픈 데이터는 누구나 자유롭게 어떤 제한도 없이 사용할 수 있는 데이터를 의미합니다.

Posted by & filed under News.

코리아데이터허브에 업로드된 데이터셋이 3,000건을 넘었습니다. 오늘 기준으로

3,265

건이 되었습니다. 데이터셋이 많고 적음보다 양질의 데이터를 담을 수 있는 공간이 되도록 노력하겠습니다.

코리아데이터허브에 여러분의 참여를 부탁드립니다. 누구에게나 열려있는 공간이 될 수 있도록 만들어가겠습니다 ^^

Posted by & filed under 정보.

오픈 데이터 (open data)는 우리말로 ‘열린 데이터’ 또는 ‘공개 데이터’로 번역되어 사용됩니다. 영어를 단순히 해석해 보면, 데이터 소유자 또는 제공자가 데이터를 사용할 수 있도록 허용하는 것을 의미합니다. 이와 관련하여 몇 가지 정의가 있습니다.

Wikipedia

Open data is the idea that certain data should be freely available to everyone to use and republish as they wish, without restrictions from copyright, patents or other mechanisms of control.

The Open Data Handbook

Open data is data that can be freely used, reused and redistributed by anyone – subject only, at most, to the requirement to attribute and share-alike.

정의가 약간 다를 수 있지만, 오픈 (open)의 의미는 비슷하게 사용하고 있습니다. “오픈”은 제약없이 사용할 수 있는 상태로 볼 수 있습니다. 이런 측면에서 오픈 데이터는 “누구에게나 자유롭게 활용될 수 있는 데이터”이며 “데이터를 활용하는데 있어 저작권이나 제한적인 규칙이 적용되지 않는” 것을 함께 포함합니다.

이와 같은 정의를 국내 상황에 적용하면, 국내에 오픈 데이터는 “거의 없다”라고 할 수 있습니다. 다양한 기관에서 데이터를 공개하고 있지만, 데이터를 활용, 변환, 재사용, 재배포에 상당한 제약이 있습니다. 오픈 데이터의 활성화를 위해 빠른 시간내에 오픈의 의미를 만족시키는 오픈 데이터가 만들어져야 합니다.

오픈 데이터는 공개의 여부가 핵심이며, 이를 기준으로 보면 비공개 vs 공개 데이터로 구분할 수 있습니다. 웹 2.0의 등장 이후 데이터가 많이 공개되고 있지만, 상당 부분의 데이터는 서비스 제공자에 의해 관리되고 있습니다. 이런 데이터는 공개되지 않은 데이터입니다. 아래 그림에서 보듯이, 오픈 데이터는 포괄적인 영역을 지칭하며, 정부나 공공의 영역에 해당되는 데이터일 경우 오픈 정부 데이터 (open government data)라고 합니다. 물론 정부 데이터에서 개방되지 않는 것도 있는데, 개인의 사생활, 국가 안보와 관련된 데이터는 오픈의 범주에 포함되지 않습니다.

Posted by & filed under tutorial.

데이터 허브의 계정을 만들었으면 이제 데이터셋을 올려야겠죠. ^^

데이터 허브에서 데이터는 데이터셋 (dataset)과 리소스 (resources)로 구분합니다.

  • 데이터셋: 특정한 데이터를 포함하는 집합
  • 리소스: 데이터셋에 포함되는 단일 개체로 파일 단위의 데이터

데이터셋은 여러 개의 리소스를 포함합니다. 쉽게 말하면, 데이터셋은 리소스를 담을 수 있는 그릇의 역할입니다.  자, 데이터셋을 추가하는 것부터 시작합니다.

데이터셋은 데이터에 대한 일반적인 정보를 기술할 수 있습니다. 위 그림에 나타난 항목을 먼저 살펴보면,

  • Title: 데이터셋의 이름 (한글도 가능합니다)
  • Url: 데이터허브에서 데이터셋을 식별하기 위한 ID (영문만 가능합니다)
  • License: 데이터셋에 적용된 라이센스 (라이센스에 대한 설명은 다른 포스트에서 자세히 설명하겠습니다)
  • Description: 데이터셋의 설명
  • Group: 데이터셋을 포함하는 분류 또는 범주 (Group 메뉴에서 생성하거나 선택할 수 있습니다)

데이터셋의 설명을 추가했으면 이제 업로드할 데이터에 대한 설명을 추가해야 합니다. 데이터허브에 업로드할 수 있는 데이터는 세 가지 유형입니다.

  • 파일 links: 웹 상에 존재하는 파일의 URL
  • API: 데이터에 접근할 수 있는 API URL
  • 파일: 원본 파일을 직접 업로드

위에 세가지를 모두 리소스 (resource)라고 합니다. 데이터가 웹에 있다면 파일의 링크를 추가할 수 있고, 해당 파일을 직접 업로드할 수 있습니다.

이렇게 추가 (Add)를 하면 화면이 아래 그림과 같이 전환합니다. 해당 리소스에 대한 구체적인 설명을 입력하는 곳입니다. 파일에 대한 메타데이터를 입력할 수 있는 항목들입니다. 맨 아래에 extra field는 사용자가 메타데이터 항목을 정의할 수 있는 기능입니다. 현재 버전은 영문만 지원합니다.

이렇게 입력을 하고 “Save Change”를 누르면 데이터가 등록이 됩니다. ^^


Posted by & filed under tutorial.

Korea Data Hub에 데이터를 업로드하려면 계정을 만들어야 합니다. 사이트 상단에서 “Register”를 클릭하면 다음과 같은 등록화면이 나옵니다. 등록 절차는 비교적 간단합니다. 로그인 (사용자 ID), 이메일 주소, 비밀번호만 입력하면 됩니다. 다만 로그인 (사용자 ID)은 3글자 이상, 영문명, 그리고 ‘-‘ 또는 ‘_”의 조합으로 만들어야 됩니다. 저는 ‘haklae_kim’으로 만들었습니다. 

등록을 완료하면 “My Profile”로 이동하며, 아래와 같이 네 개의 정보 (이름, 가입일자, 이메일, API Key)를 보여줍니다. 검정색으로 처리한 부분이 API Key 인데, 데이터의 업로드, 업데이트를 프로그래밍 언어를 이용해 수행할 경우 반드시 필요한 정보입니다. 참고로 The Korea Data Hub에 다수의 데이터셋을 업로드할 때 API를 사용하는 것이 좋습니다. 이렇게 데이터를 업로드하면 왼쪽에 올린 데이터셋과 편집 활동이 숫자로 표시되고, 아래에는 최근 활동이 표시됩니다.

어렵지 않으니 지금 등록해 보세요!