본문 바로가기

평론과 서평/책 읽기

[조선일보 서평] 빅데이터 인문학의 출현



검색창에 여름휴가(summer vacation)이라고 쳐 넣는다. 잠시 후 그래프 하나가 화면에 나타난다. 그래프에 따르면, 19세기 초엔 여름휴가라는 말이 많이 쓰이지 않았다. 그러다가 1880년 무렵부터 급상승하기 시작한다. 산업화 덕분에 생긴 삶의 변화를 반영하는 것으로 보인다. 여름휴가라는 말의 사용은 1915년부터 1941년까지 25년 동안 절정에 이르고, 그 이후 현재까지 역력한 하강세를 보인다. 산업의 변화에 따라 사람들이 동시에 몰려서 여름휴가를 떠나는 일이 줄었기 때문일 것이다.

휴가(vacation)는 어떨까? 이 말 역시 19세기부터 조금씩 사용이 늘어나다가 여름휴가와 똑같이 1941년에 이르러 절정을 맞이한다. 그러나 휴가라는 말은 여름휴가와 달리 1960년대 중반 이래로 다시 힘을 회복한 후 기울기가 꽤 가파른 상승세를 보여준다. 현대인들은 여름휴가가 아니라 휴가를 더 선호하는 듯하다.

이는 『빅데이터 인문학』의 저자들을 흉내 내 본 것이다. 전 세계 도서관에 있는 책을 모조리 디지털화해서 검색 소스로 제공하겠다고 구글이 선포한 것이 2002년이다. 그사이 구글은 3000만 권 이상의 서적을 디지털화했다. 하버드대 출신의 젊은 두 과학자 에레즈 에이든과 장바티스트 미셸은 구글의 디지털 서적 데이터를 이용해서 인간 삶을 읽어내는 ‘데이터 인문학’을 제안한다. 저자들에 따르면, “책은 오랜 기간에 걸쳐 우리 문명이 어떻게 변화했는지를 담은 초상화를 제공한다.” 검색로봇 엔그램(Ngram)의 도움을 받아 두 사람은 그중 800만 권에 이르는 책들을 순식간에 읽어 들인 후 단어들의 장기 역사를 그래프로 보여준다. 이로써 이 그래프는 “인류가 남긴 문화적 기록에 대한 전대미문의 요약”이 된다.

인문학은 사실 호모사피엔스가 남긴 온갖 데이터 흔적들을 쫓아가면서 그 의미를 해독하는 일을 한다. 그런데 인류가 남긴 거의 모든 기록이 담긴 거대한 데이터를 자유로이 읽어가면서 인간 삶의 온갖 흔적을 추적한다면 어떤 일이 벌어질까? 저자들은 “빅데이터는 우리 자신의 삶을 들여다보는 친숙한 창일 수 있다. 수량화된 우리 자신을 들여다보는 창”이라고 말한다. 이 책은 빅데이터를 통해서 우리가 알고 싶어 하는 인간 삶의 드라마를 힘찬 그래프와 함께 보여준다. 책들이 모여 거대한 안개를 이루었는데, 바라볼 때마다 흩어졌다 모이면서 새로운 모습을 보여주는 것이 때로는 신기하고 때로는 신선하고 때로는 신비롭다. 부제처럼 빅데이터 인문학은 이제 진격의 서막을 열었을 뿐이다. 이 새로운 학문이 곤경에 빠진 인문학의 훌륭한 탈출구가 되어줄 것인지 자못 궁금하다.