Posted by & filed under Open Knowledge, 이벤트, 해커톤.

이 글은 OKFN Korea 페이스북 그룹에서 먼저 작성된 글입니다.

OKFN Linked Data 해커톤의 일정이 2013년 6월 22일로 변경되었습니다. 대학생들의 기말고사가 끝난 후 모여서 열정적으로 만들어 보려고 합니다. 최근 공공기관에서 Linked Data에 대한 논의가 활발히 진행되고 있습니다. 과제화되어 공고가 나오는 것으로 알고 있습니다.

OKFN Linked Data 해커톤은 국가 데이터 기반 체계를 만드는 시도를 합니다. 공공 데이터가 개방되고 데이터 사이에 유기적인 연결관계를 맺기 위한 필수적인 데이터를 링크드 데이터로 개발하고 활용할 수 있는 오픈소스를 만드는 것이 목표입니다.

* 기본 데이터: 전국 행정구역, 전국 도로명, 전국 도로명주소, 전국 지번주소, 전국 우편주소, 국가 행정표준코드 등 (스키마와 인스턴스 모두 Linked Data 변환 완료)
* 활용 데이터: 전국 어린이집, 유치원, 초등학교, 중학교, 고등학교, 대학교 데이터 (기본 데이터와 연계하여 링크드 데이터로 구축)
* 연계 데이터: 기본 데이터 + 활용 데이터를 연계하여 스토리를 만들 수 있는 데이터 (공공데이터포털, 서울시 열린데이터광장에서 검토)

구축이 필요한 데이터와 행사에 대한 의견은 언제나 환영합니다. ^^

Posted by & filed under Projects.

5월 2일, 서울시 Linked Data 서비스 (http://lod.seoul.go.kr/)를 소개하는 세미나가 있었습니다. 소중한 시간을 내어 참석해 주신 모든 분께 다시 한번 감사드립니다.

서울시 Linked Data 서비스는 오픈 데이터의 재사용을 높이기 위해 데이터를 정제하고 탐색할 수 있는 기능을 제공합니다. 이런 목적을 위해 Linked Data 기술을 실용적으로 적용했습니다. 기술 중심이 아닌 문제를 정의하고, 필요한 만큼 기술을 적용하려고 노력했습니다. 세미나에서 나왔던 질문처럼 “사용자에게 어떤 혜택을 줄 수 있는지“에 대한 고민은 더 심도있게 고민할 필요가 있습니다.

이번 프로젝트는 Linked Data 기술이 막연하게 어렵고, 많은 비용이 소요되고, 제대로 동작하지 않는다라는 오해를 조금 줄여줄 수 있을 것이라 생각합니다. Linked Data를 구축해서 활용하는 단계에 오픈소스를 적용했고, 이런 기술을 몰라도 데이터를 활용할 수 있도록 인터페이스를 제공하고 있습니다. 더불어, 구축한 데이터 모델에 대한 명세서도 함께 제공합니다.

세미나에서 소개하지 못했지만, 시범과제에서 만든 데이터는 구글과 같은 검색엔진에서도 찾을 수 있습니다.

* 어렵게 느꼈던 시맨틱 웹, Linked Data를 이해하는데 도움이 되었길 바랍니다.
* 프로젝트를 하며 만든 문서와 소스코드도 정리되는대로 공개하겠습니다.

세미나에서 발표했던 슬라이드를 첨부했습니다.궁금한 점이 있으면 okfn.korea@gmail.com으로 문의해 주세요 ^^

 

서울시 링크드 데이터 서비스 발표 내용을 구글 드라이브에 정리한 자료입니다. 슬라이드와 함께 보시면 좀 더 이해가 쉬울 것입니다.^^

서울시 링크드 데이터 서비스 세미나 발표 내용

 

Posted by & filed under Featured, Projects.

서울시 Linked Data Beta 서비스 (http://lod.seoul.go.kr/) 또는 열린 데이터 광장 (http://data.seoul.go.kr/)의 왼쪽 배너 (Linked Data Beta 서비스)를 클릭해 주세요.

  • 크롬, 파이어폭스에 최적화해서 익스플로러에서 일부 데이터를 제한했습니다.
  • 전체 데이터 및 온톨로지 명세서는 http://lod.datahub.kr/에서 확인할 수 있습니다.
  • 지난 겨울동안 진행했던 커뮤니티 프로젝트가 드디어 공식 오픈을 했습니다 ^^. Open Knowledge Foundation Korea (http://okfn.kr/) 멤버들이 주말을 반납하며 열심히 만든 작품(?)입니다. 베타인 만큼 부족함이 많습니다.

    최근 오픈 데이터에 대한 얘기가 많습니다. 미국, 영국을 시작으로 세계 각국 정부에서 공공 데이터를 공개하는 움직임이 있고, 국내도 정부가 바뀌면서 많은 관심을 보이고 있는 분야입니다. 물론 이 틈에 링크드 데이터에 대한 얘기가 많습니다. 분명 필요한 기술인데 어떻게 적용할 것인지에 대한 고민이 필요합니다. 사실 이것이 커뮤니티 프로젝트를 진행하게 된 배경입니다.

    국내에서 링크드 데이터에 대한 연구와 프로젝트는 많았는데, 기술을 모르는 사람이 이해할 수 있는 사례는 많지 않았던 것 같습니다. 온톨로지 어휘를 만들고 링크드 데이터를 구축하는 사례는 있지만, 사용자 입장에서 보면 그 가치를 이해하는 것이 쉽지 않습니다. 그래서 오픈 데이터에 링크드 데이터 기술이 필요하지만 자칫 기술 중심의 프로젝트로 흘러 아무도 사용하지 않는 시스템이 될 수 있습니다. 이번 작업에서 멤버들은 사용자 관점과 오픈 데이터 관점에서 링크드 데이터 기술을 적용해 보려했습니다.

  • 사용자에게 직관적인 서비스: 링크드 데이터를 몰라도 서비스 자체로 이해할 수 있는 결과
  • 오픈 데이터와 링크드 데이터의 결합: 데이터 정제 및 연계를 통한 데이터 상호운용성 확보
  • “오픈 데이터에서 링크드 데이터로 진화”에서 보듯이, 이번 프로젝트는 오픈 데이터를 활용하기 위한 한가지 방법으로 링크드 데이터 기술을 선택했습니다. 데이터의 품질을 개선하고 연계하는 기술로 고려를 했고, 구축된 데이터를 다양한 포맷으로 공유할 수 있게 했습니다.

    링크드 데이터에 대한 얘기도 많고, 관련한 프로젝트도 많았기에 프로젝트를 lightweight한 방법으로 진행할 수 있었습니다. 이번에 구현한 서비스는 모든 인프라를 오픈소스로 구현했습니다. 링크드데이터의 저장은 MySQL에 했고, 링크드 데이터 브라우징은 Pubby를 사용했고, 다른 시각화 도구도 오픈소스에 SPARQL Endpoint를 적용했습니다.

    링크드 데이터를 얘기하면 성능, 속도, 비용에 대한 얘기가 많습니다. 과연 그렇게 비용이 많이 드는 기술인지, 속도가 느린지, 구축이 어려운지 다시 질문해 봅니다. 기존 기술에 비교하여 어려운 점은 있으나, 이제 링크드 데이터 구축은 아주 어려운 것은 아니라고 조심스럽게 생각해 봅니다. 더 보태고 싶은 것이 많습니다. http://lod.datahub.kr에서 더 실용적인 사례를 추가할 예정입니다.

    시범과제 설명회를 5월 2일에 진행하려고 합니다. 행사 장소를 찾는데로 바로 공지하겠습니다. 궁금하신 것이 있으면 댓글 남겨주세요. ^^

    커뮤니티 프로젝트. 이름도 낯선 일을 가능하게 해 준 서울시에 감사드립니다. 커뮤니티에 이런 시스템을 만들 수 있는 기회가 많지 않기에 더 의미있고 값진 경험이었습니다. ^^

    Posted by & filed under Featured, 해커톤.

    꼭 12시간동안의 해커톤.

    4월 20일 오전 9시부터 오후 9시까지 경희대 캠퍼스에서 OKFN 해커톤을 진행했습니다. 따뜻한 봄날씨에 벚꽃이 흩날리는 교정을 기대했던 것과 다르게 아침부터 주룩주룩 비는 내리고, 강의실은 생각보다 추웠습니다. 그래도 참가자의 열정으로 12시간을 재미있고 의미있게 보낼 수 있었습니다.

    이번 해커톤은 지방자치단체의 예산 데이터를 OpenSpending (http://openspending.org)Where Does My Money Go (http://wheredoesmymoneygo.org)에 적용하여 시각화시키는 것이 목표였습니다. 해커톤의 결과는 아래 사이트에서 볼 수 있습니다.

    완성을 하지 못했지만 결과를 만들어 내는 과정은 쉽지 않았습니다. 예산 데이터를 분석하고, 데이터 형식에 맞게 변환하는 일부터 시스템을 설치하고 최적화하는 것까지 많은 일이 있었습니다. 먼저 지방자치단체의 예산과 관련된 데이터는 재정고에서 확보했습니다.  아래 링크에 있는 자료는 2012년 예산인데 상당한 분량의 데이터입니다. 시간 제약으로 구축범위를 지방자치단체의 세출 총계예산으로 한정했습니다.

    해커톤에서 사용한 링크는 구글 드라이브에 공유했습니다.

    원본 문서가 PDF 형식이라서 데이터를 추출하는데 어려움이 있었습니다. 재정고 웹사이트에서 데이터를 수집하거나 PDF 파일을 파싱해서 데이터를 확보할 수 있는데, 데이터를 csv 또는 xls 과 같은 형식으로 제공한다면 조금 쉽게 데이터 작업이 이루어지지 않았을까 생각을 해 봅니다. 이렇게 만들어진 데이터를 온라인으로 업로드해서 시각화할 수 있는 준비를 했습니다. 이 단계에서 몇 가지 시스템이 필요합니다. 시스템을 설치하고 최적화하는데 시간이 필요했기 때문에 모든 작업이 순차적으로 이루어지진 않았습니다 (다음 해커톤이 있기 전에 마무리할 일입니다) .

    1. 데이터 업로드: 변환된 데이터는 코리아 데이터허브에 업로드합니다. 현재 CKAN 2.0 버전으로 베타 테스트를 진행하고 있습니다.
    2. OpenSpending에 데이터 업로드: 코리아 데이터허브에 업로드된 데이터의 URL을 이용해서 OpenSpending Korea에 데이터를 임포트시킵니다. 향후 데이터는 OpenSpending에도 함께 업로드할 계획입니다.
    3. Where Does My Money Go? 사이트에 반영하기: 업로드된 데이터를 시각화해 줍니다.

    실제 작업은 3가지로 구분되는데, 생각보다 할 일이 많았습니다. 도메인에 대한 지식도 부족하고, 시스템도 처음보며 분석했던 것이라서 부족함이 있습니다. 다음 해커톤에서 부족한 부분은 충분히 메울 수 있을 것이라 생각합니다.

    이번 해커톤은 후본에서 많은 지원을 했습니다. 점심시간에 일회용 컵을 재활용해서 화분 만들기를 하면서 롤링 페이퍼처럼 서로에게 글을 남기는 이벤트도 새로운 추억이었습니다. 다시 한번 감사합니다.

    전체 사진 보기: https://plus.google.com/photos/104540210534285509716/albums/5869333150350283329?authkey=CJXQ3Mv2-vfVMg

    파트 A (데이터 분석 & 변환): 이민아, 박민정, 김장원, 김우일 (좌->우)

    파트 B (시스템 개발): 심상진, 황우성, 박다민, 장기숭, 손준성, 김선호 (좌->우)

    화분 만들기 (무슨 꽃 일까요?)

    즐거웠습니다 !! 모두 수고하셨습니다 ^^

    Posted by & filed under 정보.

    Data Anywhere Project(http://dhornbein.github.io/DataAnywhere)?

    #OccupyDataNYC Hackathon에서 출발한 프로젝트입니다. 앞서 시작한 #Occupy Sandy프로젝트의 일환이기도 하지요.  현재의 데이터들은 일부 회사에 종속되어, 모든 데이터가 하나의 셋으로 존재하고 있습니다. 그로인해 필요한 부분의 데이터를 찾아 내기란 매우 어렵죠. Data Anywhere Project는 이러한 문제를 해결하고자,  다음과 같은 과정으로 문제를 해결하고자 합니다.

    data anywhere project

    data anywhere project

    이 프로젝트의 궁극적인 목적을 이렇게 밝히고 있습니다.

    “The longer term vision of this project is to use the data in sort of a Freakonomics type of analysis, comparing what looks like disparate data, chronologically at first, but could be compared along any index.” 

    어울리지 않는 데이터를 비교해 분석하는 괴짜 경제학처럼, 데이터를 사용하게 하겠다! 어찌보면, 황당 무계할 수 있는 이 이야기는 데이터를 공개하여, 유저의 마음대로 데이터를 사용할 수 있게 하고자 하는 오픈데이터의 이념을 잘 녹아낸 작은 프로젝트가 아닌가 싶습니다.  프로젝트의 내용도 좋고, 해커톤을 통해 구체적인 프로젝트를 만들 수 있도록 동기부여하는 것도 좋아보입니다. OKFN Korea에도 오픈데이터데이에 참석하신 분들과 함께 무언가를 만들어내고, 의사소통할 수 있는 소통채널이 필요해 보입니다:)

    Posted by & filed under 정보.

    이 글은 OKFN Korea 페이스북 그룹에서 먼저 작성된 글입니다. 

    유럽은 오픈데이터를 조금 더 가시적으로 활용할 수 있는 전략을 발표했습니다 (해당기사 :http://techcrunch.com/2013/04/10/eu-open-data-directive/).

    Open Data Strategy for Europe 에서 이미 상당한 규모의 투자 (40 billion Euro = 59조원 정도?)가 이루어졌는데, 실행적인 측면이 더욱 강조되었습니다.

    어제 발표된 전략의 핵심은 오픈 데이터를 “zero or very low cost” 즉, 무료 또는 아주 낮은 비용으로 활용할 수 있게 함으로써 스타트업을 포함한 비즈니스 가치를 창출할 수 있게 한다는 것입니다. 오픈 데이터를 투명성의 도구로 강조하는 것을 넘는 적극적 방안입니다.

    이런 것을 뒷받침하기 위해 국립 도서관, 박물관, 기록원에 있는 데이터를 공개하겠다는 계획을 발표했습니다. 우리나라도 오픈데이터가 활발히 사용되려면 데이터 자체가 섹시해야 합니다. 마지못해 공개되는 것이 아니라 포털에 준하는 품질과 새로움을 갖는 데이터가 공개되어야 더 많은 사람들이 그 가치를 알고 참여할 것이라 생각합니다.

    “Once fully implemented into national law, the revision of the 2003 Public Sector Information Directive would make all generally accessible (that is, non-personal) public sector information available for re-use. Developers, programmers, businesses and citizens will be able to get and re-use public sector data at zero or very low cost in most cases. They will also have access to more exciting and inspirational content, for example including materials in national museums, libraries and archives.”

    * 참고기사: http://techcrunch.com/2013/04/10/eu-open-data-directive/

    * EU Commission Open Data 페이지: http://ec.europa.eu/information_society/policy/psi/index_en.htm

    Posted by & filed under Open Knowledge, 이벤트.

    OKFN Korea organised International Open Data Day in Korea (Feb 23, Seoul). There were over 50 participants ranging from students to professors with various domains. We focused on developing more qualified data from raw data. Datasets collected the Seoul Open Data Portal (http://data.seoul.go.kr), including culture, population, healthcare, politics, etc.  The results were visualised by Google Fusion tables. The results can be found: Google Drive (Open-Data-Day-in-Korea). We will share more information here and Facebook page of OKFN Korea.

    Participants of International Open Data Day in Korea,

     

    Enhanced by Zemanta