대한민국 정치의 모든것, pork.kr
http://pokr.kr/
한 1년 전 쯤이었나, 영문으로 된 한국 정치자료 크롤링 사이트를 발견하고, 참 괜찮다고 생각했었습니다. 그러나 한국어로 표기하지 않았고 답답한 면이 없잖아 있었으며 몇몇 빈 연결점이 있어서 아쉽다는 생각을 했죠. 그런데 최근 열심히 개발하고 계시더군요. 도구가 마구 늘어나는 걸 보니 두근두근 거립니다.
한국 기관에서 뽑아내는 자료는 엄청나게 많습니다. PDF와 HWP, XLS 또는 HTML나 자바 스크립트 등의 숫자로 된 표 일람과 카테고리로 잘게 쪼개진 자료들이 그러하죠. 최근에는 빅데이터라는 이름 하에 (사실 그 전에도 그 데이터들은 계속 있어왔음에도) 공공기관의 양적 자료들이 공개가 되고 있는 시점이죠. 하지만 질적 자료들은 봇을 막아놓는다던지, 내부 검색이 최악이라던지, (간단히 TXT 형태로 뿌려버린다고 하면 구글 검색에서 더 잘 걸릴 수도 있겠죠, 그런게 어떻게 고려가 되고 있는지는 모르겠지만 정부부처의 고품질의 자료들의 다운로드 횟수를 보면 확실히 검색 접근이 힘든 상태라는 생각은 듭니다.) 차례나 사이트맵으로는 도무지 어디에 그런 자료들이 배치되어 있는지 알 수가 없다든지(간단히 형사배상액의 년도별 통계를 찾으려고 하니 법원 사이트에서 헤매고 있는 자신을 발견한다던지)하는 경우가 많습니다. 가장 통계의 시각화가 시급한 곳이라면 중앙선거관리위원회일텐데 자료를 정리해본 적이 있다면 알겠지만 정렬이나 배열을 다양한 방식으로 할 수 없어, 한땀 한땀 떼내어 전체를 구성해야 하는 경우가 많습니다.
기업 R&D 정책이 부상한 이후, (그 이전에도 그랬겠지만) 기업 연구소들도 상당히 늘어났죠. 그러나 가재는 게 편 같은 느낌으로 SERI나 LG경제연구원, KB경영연구소 등의 자료를 곧이 곧대로 들을 수는 없는 거고, 그렇다고 행정부의 자료를 보자니 그거는 그것대로 국가정책에 맞춰 편향되는 느낌도 나고 그렇습니다. 그렇다고 정말로 다수를 위한 자료를 찾는다면 선대인경제연구소 같은 곳을 확실하게 신뢰할 수 있느냐, 하면 그도 어렵고. 이 상황에서 다음으로 가장 강력한 것은 입법부의 국회의원실인데 언론 기사들을 보면 질이 좀 좋다 생각하고 자세히 살펴보면 ㅁㅁ국회위원실에서 제공한 정보, 란 식으로 살짝 언급이 된단 말이죠. 입법부가 법만 만드는 것도 아니고 행정부와 사법부를 견제하는 역할이라 했을 때 소위원회의 회의록이나 입법취지를 설명하는 글, 또는 개인적으로 추구하는 이상적인 법안을 꾸준히 밀고 있는 의원이 뭘 하는지를 읽으면 그럭저럭 고품질의 정보를 따라 잡을 수 있다 생각이 되죠. 그것도 위의 다른 두 점을 이어서 삼각검증을 해야겠습니다만.
여튼, 국가에서 정보를 시각화하고 배치하는걸 안하니 오픈소스로라도 이걸 고쳐보겠다, 라고 하는게 상당히 감동적이고 BETA지만 변화하는 속도가 장난이 아니라 적어봅니다. 그 사이트와 비교해서 좋은 점이나, 그 외 등등 장점은 이 홈페이지 첫 장에 잘 설명되어 있으므로 생략. (경악스러운 것은 여기서 제공하는 모든 자료들은 [원래부터] 국가에서 제공하고 있었다는 것이지만. 파이그래프나 선그래프 등의 시각화는 아니지만.)
밑은 맛보기로 뽑아본 것들이에요.
http://pokr.kr/bill/1911080 - 4ㆍ16 세월호 참사 진상규명 및 피해자 지원 등에 관한 특별법안
http://pokr.kr/person/19621122 - 안철수
http://pokr.kr/meeting/19324521115/dialog - 19대 324회 5차 미래창조과학방송통신위원회
http://pokr.kr/meeting/1932752217/dialog - 19대 327회 5차 세월호침몰사고의진상규명을위한 국정조사특별위원회 (14.7.29)
정말 대단히 많은 자료를 볼수있는 곳이네요.
가끔영화_ 이 모든걸 읽을 사람은 없겠죠.