Posted by & filed under Featured, Projects.

지난번에 페이스북과 블로그에서 사전 공지해 드린 것과 같이, Open Knowledge Korea 멤버들이 지금까지 수행하였던 다수의 프로젝트 중 대표적인 사례인 서울시 프로젝트의 산출물을 공개합니다.

공개 내용은 Linked Data 서비스를 제공하기 위해 사용되었던 오픈 소스들과 Linked Data 시스템 구성도, 데이터 간의 연계를 위해 고민했던 온톨로지 모델링 사례(행정구역 온톨로지) 입니다.

이에 대한 설명 자료는 SlideShare에서 보실 수 있으며, GitHub에 접근하여 오픈 소스를 사용하실 수 있습니다.

관련 문서 및 소스에 대한 궁금하신 것이 있으시면 댓글 또는 페이스북 그룹에 남겨주시길 바라며, 이번 프로젝트 산출물에 대한 공개를 통해 내가 가지고 있었던 데이터를 보다 쉽게 공유하고, 내가 원하는 다른 데이터들과 연결 고리를 만들수 있는 장이 활성화 되기를 바랍니다.

아울러, Open Knowledge 포럼에도 소식을 업데이트 했습니다. 관심 있으신 분들은 포럼에서 의견을 나누셔도 좋겠습니다.

Open Knowldege Korea는 공유와 개방의 모토아래 의지와 열정이 가진 분들 누구에게나 열려있습니다.

 

Posted by & filed under News, Open Knowledge.

Open Knowledge Korea (OK-Korea) 에서는 Linked Open Data (beta) 프로젝트를 공개 한 이후, 지속적으로 해커톤 및 오픈 데이터 활동을 하고 있습니다.

최근, 국내에서는 정부 3.0이라는 새로운 정부운영 패러다임에 맞춰 공공정보의 개방 및 공유가 활발하게 진행되고 있으며,
데이터를 보다 효율적으로 공개하고 활용하기 위한 노력들이 계속되고 있습니다.

이에 Open Knowledge Korea 에서는 여러 도메인에서 활용되고 있는 데이터를 보다 손쉽게 공유하고 연결하기 위한 방법의 하나로,
링크드 데이터 구축을 위한 오픈 소스들공개합니다.

이번에 공개되는 오픈 소스들을 통해 여러분들도 가지고 계신 데이터를 이용하여 링크드 데이터를 직접 구축할 수 있습니다.
또한, 링크드 데이터 구축의 편의성을 위해 ‘사용 가이드’ 및 ‘시스템 개요도’ 등을 함께 공개합니다.

  • 참고 사이트 : 공공 데이터와 링크드 데이터의 만남 첫 번째 사례

그리하여, 향후에는 여러분들의 다양한 데이터들이 모여 ‘Open Knowledge’ 생태계를 만들 수 있을 것이라고 생각합니다.

이번에 공개되는 오픈 소스들은, Linked Open Data (beta) 허브 중에서 Connected Data Hub를 만들기 위해 사용된 오픈 소스들이며, 누구나 함께 참여하실 수 있도록 깃허브(Github)를 통해서 공개합니다. 깃허브 주소는 추후 업데이트 예정입니다.

궁금하신 것이 있으면 댓글 또는 페이스북 그룹에 남겨주세요. ^^

감사합니다.

Posted by & filed under Open Knowledge.

지난 25일 한국정보화진흥원에서 공공정보 활용 우수기업에 ‘KT ucloud’를 1년간 무상으로 지원하는 이벤트를 진행했습니다. 해당 이벤트는 서버, 네트워크 장비 등의 인프라를 지원해주는 이벤트로, 개인, 소규모 단체, 회사에서 만든 서비스를 대상으로 진행되었는데요. OKF Korea가 해당 이벤트에 선정되어 1년동안 무료로 해당 인프라를 활용하여 각종 프로젝트를 진행할 수 있게 되었습니다^^

KT cloud 서비스와 유사한 서비스로는 Amazon, Ms Azure 등이 있으며, KT ucloud를 이용할 경우, 각 개인이나 단체가 서버 인프라를 따로 구축하며 관리할 필요 없이 KT에서 제공하는 서버 인프라를 서버로 사용할 수 있게 됩니다. 따라서 네트워크의 안정성은 KT cloud에서 책임지고, 서버의 구축 및 관리는 웹을 통해 개발자가 직접 할 수 있습니다

다양한 인프라를 이용할 수 있고 소프트웨어 단계에서 쉽게 구성할 수 있기 때문에 서비스에 맞추어 서버를 디자인하고 관리할 수 있습니다

1년동안 서비스를 이용하고 재선정될 수 있도록 열심히 활동해야겠습니다!

https://ucloudbiz.olleh.com/portal/ktcloudportal.epc.productintro.cspublic.html

Posted by & filed under 이벤트, 정보.

최근 오픈 데이터, 공공 데이터에 대한 관심이 늘어나고 있습니다. 미국, 영국에서 시작되어 국제기구로 확대되고 있는 데이터 개방은 국내에서도 본격적화되고 있습니다. 그러나 데이터 개방에 대한 정부의 적극적인 노력에도 불구하고 데이터를 효과적으로 개방하고 활용하는데 많은 어려움이 있습니다.

2013 KSWC는 데이터 개방의 주체인 정부와 자치단체의 경험을 공유하고, 기술적 관점에서 시맨틱 웹과 링크드 데이터의 현실을 논의합니다. 더불어, 커뮤니티를 중심으로 진행되고 있는 오픈 데이터 실제 활용 사례를 소개합니다. 오픈 데이터와 관련한 실용적인 사례와 기술적 해법을 찾을 수 있는 의미있는 시간이 될 것으로 기대합니다.

행사와 관련된 자세한 정보는 행사 홈페이지를 참고하시기 바랍니다.

– 일시: 2013년 11월 30일 토요일 13:00 ~ 18:00
– 장소: 코엑스
– 참가비: 일반 (5만원), 학생 (1만원)
– 주관: OKF Korea
– 후원: 서울특별시, 한국정보화진흥원, 한국데이터사이언스학회
– 행사 홈페이지: http://kswc.org/
– 등록 페이지 바로가기: http://onoffmix.com/event/20228

KSWC

Posted by & filed under Featured, Open Knowledge, 정보.

Open Data Barometer (오픈데이터 지표)에 대한 기사가 소개되면서 조사 방식과 결과에 대한 문의가 있습니다. 결과적으로 보이는 것은 순위이기 때문에, 다소 낮아보일 수도 있고, 반대로 높아보일 수도 있습니다. OKF Korea에서 한국을 담당했기 때문에 ODB의  전반적인 조사 방법과  간단한 생각을 공유합니다.

1. 소개
Open Data Barometer는 World Wide Web Foundation, ODI, Open Data Research Network의 주도로 지난 6월부터 11월까지 국가별 조사를 진행했고, 수집된 자료를 분석해 Open Data Barometer: 2013 Global Report를 발간했습니다. 글로벌 리포트는 개별 국가의 현황을 자세히 소개하지 않고, 전세계 오픈 데이터의 현황과 대륙별 비교를 담았습니다. 한국과 관련된 내용은 포스트 하단에 관련 자료와 기사를 추가했습니다.

odb

참여 국가 리스트

Argentina, Australia, Austria, Bahrain, Bangladesh, Belgium, Benin, Botswana, Brazil, Burkina Faso, Cameroon, Canada, Chile, China, Colombia, Costa Rica, Czech Republic, Denmark, Ecuador, Estonia, Ethiopia, Finland, France, Germany, Ghana, Greece, Hungary, Iceland, India, Indonesia, Ireland, Israel, Italy, Jamaica, Japan, Jordan, Kazakhstan, Kenya, Korea, Republic of, Malawi, Mali, Mauritius, Mexico, Morocco, Namibia, Nepal, Netherlands, New Zealand, Nigeria, Norway, Pakistan, Peru, Philippines, Portugal, Qatar, Russian Federation, Rwanda, Saudi Arabia, Senegal, Singapore, South Africa, Spain, Sweden, Switzerland, Tanzania, United Republic of, Thailand, Tunisia, Turkey, UAE, Uganda, United Kingdom, United States of America, Uruguay, Venezuela, Yemen, Zambia and Zimbabwe

 2. 조사 내용

국가별 오픈 데이터의 전략적 평가를 위해 다음의 세 가지 항목을 평가하고 있습니다. 아래 설명에 있듯이, 오픈 데이터와 관련해서 일반적으로 언급되는 정부의 투명성, 법률적 지원에서부터 환경분야, 소외계층을 위한 전략, 경제적 효과 & 새로운 시장 창출 등 광범위한 요소를 평가합니다.

  • Readiness (준비성):identifies how far a country has in place the political, social and economic foundations for realising the potential benefits of open data. The Barometer covers the readiness of government, entrepreneurs and business, and citizen and civil society.
  • Implementation (실행전략): identifies the extent to which government has published a range of key datasets to support innovation, accountability and more improved social policy. The barometer covers 14 datasets split across three clusters to capture datasets commonly used for: securing government accountability; improving social policy; and enabling innovation and economic activity.
  • Emerging impacts (영향력): identifies the extent to which open data has been seen to lead to positive political, social and environment, and economic change. The Barometer looks for political impacts – including transparency & accountability, and improved government efficiency and effectiveness; economic impacts – through supporting start-up entrepreneurs and existing businesses; and social impacts – including environmental impacts, and contributing to greater inclusion for marginalised groups in society.

세 가지 지수를 평가하기 위해 Context와 Impacts 측면에서 17개의 측정항목을 세분화하고 있습니다. 각 항목은 0-10점으로 구분해서 측정하고, 5점이상은 해당 근거를 구체화하기 위해 최소 3가지 이상의 사례를 열거해야 합니다.

Context 조사 항목

  • To what extent is there a well-resourced open government data initiative in this country?
  • To what extent does the country have a functioning right-to-information law?
  • To what extent is there a robust legal or regulatory framework for protection of personal data in this country?
  • To what extent are civil society and information technology professionals engaging with the government regarding open data?
  • To what extent are city or regional governments running their own open data initiatives?
  • To what extent is government directly supporting a culture of innovation with open data through competitions, grants or other support?
  • To what extent is training available for individuals or businesses wishing to increase their skills or build businesses to use open data?
  • To what extent are the following forms of training available in the country?
  • To what extent are academic institutions in the country opening up their data?
  • To what extent are civil society in the country opening up their own data?
  • To what extent are businesses in the country opening up their own data?

Impacts 조사 항목

  • To what extent has open data had a noticeable impact on increasing government efficiency and effectiveness?
  • To what extent has open data had a noticeable impact on increasing transparency and accountability in the country?
  • To what extent has open data had a noticeable impact on environmental sustainability in the country?
  • To what extent has open data had a noticeable impact on increasing the inclusion of marginalised groups in policy making and accessing government services?
  • To what extent has open data had a noticeable positive impact on the economy?
  • To what extent are entrepreneurs successfully using open data to build new businesses in the country?

2. 조사 대상

Open Data Barometer에서 조사하는 대상은 특정 지자체나 기관이 아닌 국가 수준의 오픈 데이터로 다음 15개 항목을 포함합니다. 15개 항목은 유럽, 미국, 월드뱅크에서 공통적으로 강조하고 있는 분야입니다.

Map Data, Land ownership data, Government service directory, Detailed census data, Detailed government budget, Detailed data on government spend, Company register, Legislation, Public transport timetables, International trade data, Health sector performance, Primary or secondary education performance data, Crime statistics, National environment statistics, National election results

3. 조사 (평가) 항목

개별 데이터셋은 10가지 평가항목을 기준으로 조사했습니다. 데이터가 있는지, 정부에서 제공하는 형식, 기계처리 가능성, 데이터 다운로드, 오픈데이터 라이센스, Linked Data의 제공 등이 포함됩니다. 평가 항목에서 볼 수 있듯이 Open Data Barometer는 데이터 개방 현황을 중점적으로 평가합니다. 개별 평가항목에 대한 응답은 Yes/No로 결정되며, 평가 근거에 대한 설명을 추가합니다. 평가 근거에는 데이터나 서비스에 접근할 수 있는 실제 URL, 라이센스에 대한 설명/URL을 포함하고, peer-review에서 이 내용을 근거로 평가를 완료합니다. 개별 데이터의 품질이나 크기 등 질적 평가를 위한 요소는 포함되지 않았습니다.

  • Does the data exist?
  • It is available online from government in any form?
  • Is the dataset provided in machine-readable formats?
  • Is the machine-readable data available in bulk?
  • Is the dataset available free of charge?
  • Is the data openly licensed?
  • Is the dataset up to date?
  • Is the open publication of this dataset sustainable?
  • Was it easy to find information on this dataset?
  • Are data URIs provided for key elements in the dataset?

4. 조사 및 평가 방법

개별 데이터에 대한 조사는 OKF Korea의 멤버가 참여하여 데이터셋을 탐색하고, 데이터를 갖고 있는 사이트 또는 서비스가 있을 경우, peer-review 방식으로 조사했습니다. 데이터를 조사하는 과정에서 각 분야의 전문가, 정부 기관의 담당자, 데이터를 제공하고 있는 사이트의 담당자에게 의문사항에 대한 의견을 문의했습니다. 한국에 대한 조사결과는 Open Data Barometer의 프로젝트 담당자와 다시 Peer-review를 진행하며 평가 점수 및 근거를 수정하는 과정을 진행했습니다.

5. 순위가 너무 낮은 것 아닌가?

새롭게 법률을 만들고 의욕적으로 정부 데이터 개방에 앞장서고 있는 분들이 이런 의문을 갖지 않을까 합니다. 이번 조사는 준비성, 실행력, 영향력 등 정성적/정량적 평가를 함께 포함하고 있습니다. 우리는 교통, 기상 등 일상 생활과 관련된 핵심 데이터의 개방에 있어 경쟁력이 있었지만, 소외 계층을 위한 준비는 부족함이 있었습니다. 이번 조사를 하면서 우리나라가 특정 분야에서 데이터를 많이 구축했다는 것을 알 수 있었습니다. 적어도 조사 대상인 15개 항목의 데이터셋이 존재했고, 정부나 관련기관 사이트를 통해 제공되고 있었습니다.

그러나, “오픈 라이센스” 기준으로 보면 개방된 데이터셋은 없었습니다.

A piece of data or content is open if anyone is free to use, reuse, and redistribute it –

See more at: http://opendefinition.org/#sthash.lUX1fsWF.dpuf

조사가 진행되는 중간에 “공공데이터 제공·이용 활성화에 관한 법률“이 시행되었지만, 데이터셋을 보유한 원천 시스템의 저작권은 변경되지 않았습니다. 아쉬운 부분이지만 평가 기준에 부합되진 않았습니다. 정부 기관이 운영하는 웹사이트의 저작권을 합리적으로 개선해도 정부 데이터의 개방 효과는 매우 크다고 생각됩니다. 정부가 구축해서 개방한 데이터는 많습니다. 그러나 자유롭게 데이터를 재사용/재배포하는 것을 제한하고 있는 것이 순위에 영향을 줬다고 생각합니다.

5. 순위가 너무 높지 않나?

정부 데이터를 활용하는 관점에서 보면 너무 높아보일 수 있습니다. 12위면 정부 3.0이 필요없는 것이 아닌지 반문할 수 있습니다. 앞서 언급했지만, 본 조사는 데이터의 품질, 완결성 등 실제 활용 가치에 대한 부분을 평가하지 않고 있습니다. 예를 들어, 대중교통과 관련된 데이터는 구축되어 있어 평가되고 있지만, 사용자가 데이터를 얻는 것이 쉽지 않습니다. TAGO (http://tago.go.kr) 사이트와 같이 정부에서 운영하는 서비스에서 데이터셋을 다운로드 받을 수 없습니다. 15개 데이터셋에서 이와 같은 이슈는 거의 비슷하게 존재합니다. 따라서 실제 사용자에게 12위는 매우 높은 수치일 수 있습니다.

6. 시사점 및 논의점

  • 데이터셋과 이를 활용하는 서비스, 사이트가 있다는 것은 양날의 검이 될 수 있습니다. 데이터 개방 관점으로 보면, 신속히 해당 데이터를 공개할 수 있다는 장점이 있습니다. 즉, 빠른 시일안에 공개 지수를 높일 수 있습니다. 그러나 활용이나 비즈니스 관점에서 보면, 해당 데이터가 이미 제공되고 있다는 것은 새로운 가치를 찾기 어려울 수 있다는 점도 포함됩니다. 정부 사이트를 통해, 포털을 통해 우리는 고품질의 데이터 서비스에 노출되어 있습니다. 국가 전체를 전체를 정밀하게 표현할 수 있는 지도, 이런 데이터를 활용한 네비게이션 시스템에서 근처의 저렴한 주유소 정보를 제공하는 국가가 얼마나 많을까요? 
  • 전자정부 세계 1위의 성과를 오픈 데이터와 연결했다면, 현재의 흐름을 리드하는 국가가 되지 않았을까 생각해 봅니다. 개방에 대한 순위를 높인 후 이끌어 갈 패러다임에 대해 고민하고 있을까?
  • Open Data Barometer는 데이터 품질, 종류, 크기 등 품질을 평가하는데 부족함이 있습니다. 오픈 데이터에 대한 다양한 영역을 평가하기 위해 학문적 접근이 필요합니다. Worldbank에서 개발한 Open Data Readiness Assessment Tool과 같이, 세밀하게 평가할 수 있는 이론적 모형에 대한 연구가 필요합니다.
  • 정부에서 추진하는 오픈 데이터 정책과 일자리 창출에 있어 한국적 상황에 대해 면밀한 검토가 필요합니다. 민간의 참여, 개발자에 의한 모델을 강조하고 있지만, 수요자의 목소리가 제대로 반영되고 있는지 검토해 볼 필요가 있습니다. 정부 중심, 포털 중심으로 서비스와 데이터가 제공되는 환경에서 데이터가 공개될수록 개인 개발자의 경쟁력이 낮아질 수 있는 현상도 주의깊게 고민할 필요가 있습니다.

관련 자료

관련 기사 보기

Posted by & filed under Featured, Open Knowledge, 해커톤.

IMG_20130928_15IMG_20130928_12 IMG_20130928_10 IMG_20130928_21

9월 28일, 대구경북 소셜미디어 포럼의 주최로 경북대학교 사회과학관에서 해커톤이 개최되었습니다.
빅데이터와 관련하여 데이터를 다루고자 하시는 분들, 새로운 분야에 발을 내딛고자 하는 대학원생들과 재미 삼아 나오신 분들 등 다양한 분야와 각층의 연령대의 참가자분들께서 오픈데이터에 대한 관심 하나로 삼삼오오 대구에 모여 해커톤의 흥미로운 시작을 알렸습니다.

공공데이터과 링크드데이터에 관한 okfn 김학래 박사님의 간단한 프레젠테이션을 시작으로, 해커톤에 모인 참가자들이 무엇을 다룰 것인지 윤곽을 잡아나갔습니다.
제일 먼저 데이터 질문답변 웹페이지인 voice.okfn.kr을 이용해 관심 있는 데이터 주제를 공유하였습니다. 대구 해커톤답게 대구 경북에 관련된 데이터부터 전국 데이터에 이르기까지 라이브카페, 맛집, 게스트하우스, 범죄율, 동물병원 등 다양한 주제들이 제시되었고 관심사에 따라 5개 팀으로 추려졌습니다.
데이터 확보 – 데이터 가공 – 시각화의 단계를 따라 google fusion table, spread sheet, mapping 등을 이용해 활용까지 계획하고 일사분란하게 작업하기 시작했습니다. 필요한 데이터가 이미 존재하는지, 존재한다면 어떤 형태로 가공되어 있는지 살펴보았습니다. 존재하지 않는다면 직접 데이터를 만들고 가공해야 하는지 주제를 바꿔야 하는지 등을 상의하여 데이터의 상태와 활용 결과에 따라 결정하고 진행했습니다. 가공된 데이터는 지도에 mapping되기도 하고 linked data의 형태로 시각화되기도 했습니다.

항상 수도권에서 열리던 해커톤이 아래쪽까지 내려온 덕에 대구경북 시민들과 학생들도 오픈 데이터를 다뤄볼 수 있었습니다. 좀 더 홍보했다면 더 많은 사람들이 참여할 수 있었을 텐데 하는 아쉬움은 들었지만, 이번 해커톤을 발판으로 앞으로 대구에서도 오픈데이터에 관심을 갖는 사람이 많아지고 이런 해커톤이 자체적으로 열릴 수 있을 것이라는 기대도 하게 되었습니다.
모든 팀이 마지막 결과까지 보았던 것은 아니었지만, 구체적인 계획과 도구들로 시작과 마무리를 분명하게 할 수 있었습니다. 또 데이터 제작이 아닌 수집과정에 집중하여 필요한 데이터를 확보할 때 이런 과정이 필요하다는 것을 생생하게 느낄 수 있었고, 데이터를 활용한 결과까지 볼 수 있었습니다.
관련 업계나 학문의 사람들 외에도 더 폭넓고 다양한 사람들이 동참했으면 좋겠습니다. 각 가정의 주부들, 다양한 전공의 학생들, 공무원들이 오픈데이터를 활용하고 개방하는 일에 관심을 갖고 함께한다면 더 재미있는 결과를 만들어 나갈 수 있지 않을까요?

 

https://plus.google.com/photos/112646682255428773802/albums

Posted by & filed under Open Knowledge, 해커톤.

세번째 해커톤을 마무리했습니다. Open Spending으로 시작해서 Linked Data까지 다양한 주제와 데이터를 직접 사용해보는 시간이었습니다.

세번의 해커톤은 OKF 멤버들의 내공쌓기를 위해 기획되었습니다 (사실 멤버의 기준도 특별히 없는 상황이죠 ^^). 2월에 있었던 오픈데이터데이에서 멤버들이 행사진행과 도우미를 했기 때문에, 직접 경험하고 배우고 싶다는 의견이 많았습니다. 해커톤 홍보를  페이스북 그룹으로 한정했던 것도 행사보다는 멤버들을 위한 시간을 마련하기 위한 의도였습니다.  그래서 어쩌면 행사에 대한 준비와 진행이 미흡할 수 있었습니다.

해커톤을 통해 오픈데이터를 직접 수집하고 정제하고 활용 시나리오까지 만들면서 오픈 데이터의 의미와 중요성을 느낄 수 있는 계기가 되었다고 생각합니다. 무엇보다 함께 할 수 있는 팀웍을 만들 수 있었습니다. OKF Korea는 아주 신생 커뮤니티이고, 배울 것도 준비할 것도 너무 많습니다. 하나하나 차근차근 함께 할 수 있었으면 합니다.

세번째 해커톤은 데이터를 정제해서 Linked Data를 만드는 것을 목표로 했습니다. 학교, 유치원, 병원 등 다양한 기반 데이터를 정제했고, RDF로 변환을 했습니다. 응용 애플리케이션까지 개발하는 것까지 목표를 두었는데 마무리는 하지 못했습니다. Linked Data라는 기술이 낯설고, 실용적인 시나리오를 찾는 것이 어렵다는 것을 다시 느꼈습니다. 부족한 부분은 참여했던 멤버들이 마무리를 해서 7월중에 오픈하려고 합니다. Stay Tuned…

추운 겨울에 시작했는데 벌써 여름입니다. 첫번째 해커톤은 너무 추워서, 세번째 해커톤은 너무 더워서 고생했지만, 그래도 기분은 참 좋았습니다. 두번째 해커톤 단체사진이 어디있는지??? ^^ 모두 수고많았습니다. 해커톤 후기는 다른 포스트로 써야 겠네요..

첫번째 OKFN Korea 해커톤

 

세번째 해커톤: OKFN Korea Linked Data Hackathon

Posted by & filed under 정보, 해커톤.

서울 열린 데이터 광장 스토리텔링 공모전에서 우수상을 받습니다. 2월에 있었던 International Open Data Day의 후기를 소개했습니다. 사진을 보니 다시 한번 기억이 새록새록 합니다. 함께 해 주셨던 모든 분들께 감사드립니다.

주제: International Open Data Day 후기

2월 23일 토요일, 특별한 행사가 열렸습니다.

International Open Data Day. 전세계 70여개 도시에서 오픈 데이터와 관련된 다양한 이벤트가 열렸는데, 한국은 서울시의 후원으로 준비할 수 있었습니다. IT분야에서 캠프나 해커톤은 한국에서도 이제 보편적인 행사입니다. 하지만 오픈 데이터를 주제로 진행되는 해커톤은 많지 않습니다.

오픈 데이터가 낯선 현실에서 열린 데이터 광장은 오픈 데이터를 활용하기 위한 출발점이 되고 있다고 생각합니다. 오픈 데이터 데이는 열린 데이터 광장의 데이터를 활용하고 품질 높은 데이터를 만들어내는데 초점을 두었습니다.

1. 데이터의 수집에서 시각화 

참가자의 전공과 경험이 다르기 때문에 행사를 통해 같은 경험을 공유하는 것은 매우 중요합니다. 오픈 데이터 데이는 참가자가 스스로 데이터셋을 결정하고 필요한 데이터를 정제하여 시각화하는 것을 목표로 했습니다. IT 분야를 전공하지 않은 참가자를 고려해 컴퓨터 프로그래밍을 최소화했고, 구글 퓨전 테이블을 이용해 데이터를 시각화했습니다. 서울시 독거노인의 구별 현황, 한강 주변 유동인구 현황, 4대 질병에 대한 사망율, 국회위원의 재산 내역 등 다양한 데이터가 정제되어 구글맵에 시각화되었습니다.

2. 커뮤니티와 새로운 협업 모델 개발

한국에서 커뮤니티는 관심있는 사람들의 모임이지만 정부기관과 협업하기 어렵습니다. 커뮤니티의 자유로움이 일정한 형식을 요구하는 정부나 공공기관에 적합하지 않지 않습니다. 이런 상황에서 서울시의 적극적인 지원은 새로운 협업 모델로 발전할 수 있는 가능성이 되었다고 생각합니다. 오픈 데이터의 공개를 넘어 활발한 활용과 새로운 비즈니스 모델을 개발하기 위해 시민의 참여는 필수적이며, 커뮤니티는 정부/공공기관과 시민을 연결해주는 역할을 할 수 있습니다. 서울시의 적극적인 지원은 오픈 데이터 생태계를 발전시키는 매우 중요한 역할입니다.

3. 실무 담당자와의 대화

커뮤니티 행사에 정부기관/공공기관은 후원을 하고 있지만, 실무 담당자가 참여하여 적극적으로 고민하고 문제를 해결하는데 도움을 주는 일은 많지 않습니다. 오픈 데이터 데이에서 서울시 열린 데이터 광장의 실무담당자의 참여와 지원은 여러 측면에서 의미있었습니다. 데이터를 수집하고 분석하는 과정에서 참가자와 대화하고, 오픈 데이터 활용에 대한 다양한 의견을 공유하는 모습은 참가자에게 깊은 인상을 남겼습니다.

오픈 데이터는 이제 시작이라고 생각합니다. 더 많은 데이터가 공개되고, 더 많은 사람들이 오픈 데이터를 활용하는 사례가 늘어갈 것이라 생각합니다. 이런 움직임안에 서울시 열린 데이터 광장의 역할이 매우 중요하다고 생각되고, 커뮤니티 활동의 적극적인 지원과 지속적인 참여가 함께 이루어지길 기대합니다.

Posted by & filed under 해커톤.

OKF Linked Data Hackathon을 진행합니다. 오픈 데이터를 이용해서 12시간동안 함께 아이디어를 공유하고, 데이터와 서비스를 만듭니다. 이번 행사는 오픈 데이터와 링크드 데이터의 연계에 초점을 두려고 합니다. 관심있는 분들의 참여 부탁드립니다.

행사 등록 페이지: http://onoffmix.com/event/16394

  • 일시: 2013년 6월 22일 토요일 오전 9시 – 오후 21시
  • 장소: 경희대학교 국제캠퍼스 (수원)
  • 참석 대상: 오픈 데이터와 링크드 데이터에 관심이 있는 모든 분 (30명)
  • 후원: HTML5융합기술포럼, 후본, 위세아이텍

행사 안내

  • 본 행사는 미래창조과학부의 HTML5 관련 커뮤니티 활성화 사업의 일환으로 지원되었습니다
  • 본 해커톤은 참석자가 직접 참여하고, 팀원과 협업하여 결과를 만들기 위한 목적입니다.
  • 참석자 전원은 시나리오 설계, 데이터 구축, 처리, 모델링, 응용 사례 개발 등 구체적인 역할을 맡게 됩니다.
  • 등록이 완료되면 담당할 역할을 구분하고 조정할 수 있습니다.
  • 데이터셋은 한국의 행정구역, 행정 정보, 교육시설 등을 포함하고, 별도 데이터셋을 추가할 수 있습니다.
  • 해커톤에서 수집 & 구축된 데이터는 코리아 데이터허브 (http://thedatahub.kr)에 공개하고, 링크드 데이터는 코리아 링크드 데이터 허브 (http://lod.datahub.kr)을 통해 제공될 예정입니다.
  • 참석자는 컴퓨터를 준비해야 합니다.
  • 오픈 데이터와 링크드 데이터에 대한 많은 지식이 필요하진 않습니다.

Posted by & filed under 정보.

이 글은 OKFN Korea 페이스북 그룹에서 먼저 작성된 글입니다.
오픈 데이터와 관련하여 위에 두 가지 형식에 대해 정리가 필요해 보입니다. 미국의 Open Data Policy에서 Machine Readable Format이 언급되면서 이슈가 되었다고 생각합니다.

 

먼저 “Open Format” 데이터를 활용하기 위한 범용적 솔루션을 지향합니다. 웹 브라우저, 메모장과 같이 일반적인 사용자가 갖고 있는 도구로 활용할 수 있는 데이터 형식을 말합니다. 예를 들어, XLS 형식은 마이크로소프트의 엑셀 (Excel)이라는 소프트웨어가 없으면 사용할 수 없지만, 같은 내용을 csv (comma separated value)형태로 제공하면 텍스트 편집기나 웹 브라우저를 통해 확인할 수 있습니다. 그래서 오픈 데이터의 형식은 보편성을 지향합니다.

반면, (꼭 상반된 개념은 아니지만), Machine Readable Format은 데이터를 처리 (processing)하는 관점에서 조금은 공학적인 얘기를 합니다. PDF, HTML 형식은 사람들이 볼 수 있는 (human readable) 목적으로 적합하지만, 컴퓨터가 처리하는데 적합한 형식은 아닙니다. 개발자라면 데이터를 파싱 (parsing) 한다는 의미를 이해할텐데요. 데이터를 활용 목적에 맞게 처리하는 것인데, 위에 언급한 형식들은 이런 작업에 시간도 많이 걸리고 쉽지 않습니다. 결국 어떤 데이터를 활용하고자 할 때, 컴퓨터가 처리하기 어렵다는 말은 누군가-개발자이던 아니던- 더 많은 시간을 데이터 조작에 써야 된다는 의미가 됩니다.


오픈 데이터에서 Machine Readable Format을 지향하는 것은 컴퓨터가 더 많은 일을 처리할 수 있는 가능성을 확보하는 것이고, 궁극적으로 데이터 사용자의 시간과 노력을 절약할 수 있기 위한 목적입니다. 물론 여기에 더해 데이터를 연계하고 통합하고… 상호운용이 가능하고… 라는 수식어를 보탤 수 있지만 데이터 사용자를 위한 목적만으로 그 의미가 있다고 할 수 있습니다. 기술적 관점에서 이런 것들에 가장 가까운 것이 Linked Data 기술이지만, 이 이슈는 다른 포스트에 써 보겠습니다.

두 가지 형식이 상호 배타적 관계가 아닌 보완적인 관계라는 것이 중요합니다. Machine Readable Format으로 제공되는 XML, RDF, OWL과 같은 형식은 웹 브라우저에서 모두 볼 수 있는 보편적 형식입니다. 이런 형식으로 제공하기 위해 추가적인 작업이 필요한 것이 문제(?)이지만, 이를 통해 얻을 수 있는 이점은 많아질 것이라 생각합니다. 이렇게 쓰고 보니, 결국 기술적인 얘기도 같이 해야 겠네요 ^^ Machine readable data에 대한 링크를 남깁니다.

 

http://en.wikipedia.org/wiki/Machine-readable_data

“Machine-readable data is data (or metadata) which is in a format that can be understood by a computer.

There are two types; human-readable data that is marked up so that it can also be read by machines (examples; microformats, RDFa) or data file formats intended principally for machines (RDF, XML, JSON).

For purposes of implementation of the GPRA Modernization Act (GPRAMA), the Office of Management and Budget (OMB) defines “machine readable” as follows: “Format in a standard computer language (not English text) that can be read automatically by a web browser or computer system. (e.g.; xml).

Traditional word processing documents, hypertext markup language (HTML) and portable document format (PDF) files are easily read by humans but typically are difficult for machines to interpret. Other formats such as extensible markup language (XML), (JSON), or spreadsheets with header columns that can be exported as comma separated values (CSV) are machine readable formats. It is possible to make traditional word processing documents and other formats machine readable but the documents must include enhanced structural elements.”[1]

Publishing public data in an open, standard, machine-readable format is a best practice (good operating practice).”

 

*추가자료

David Weinberger가 Human Readable vs. Machine Readable에 대해서 짤막하게 설명한 영상입니다.

http://vimeo.com/48196816