2019년 1월 31일의 글
이 책의 저자인 세스 스티븐스 다비도위츠는 구글 검색을 이용한 빅데이터를 통해 기존 사회과학 연구와 그 외의 다양한 분야 연구에 새로운 시각을 제시한다. 사람들이 구글에 검색한 내용을 빅데이터로 만들어 정치, 경마, 언론, 대학, 지리, 심리, 동성애, 심지어는 포르노 사이트인 폰허브에서 수집한 데이터로 포르노에까지 응용한다.
구글 트렌드라는 상당한 데이터 자료와 이를 이용한 빅데이터는 사회과학 연구방법론에 상당한 혁신을 가져다준다. 비록 소논문 몇 편 써본게 다지만, 사회과학 연구에서 가장 큰 한계는 방법론이라고 느껴졌다. 표본 수집부터 표본집단의 크기, 대표성 등 많은 것을 따져야하고 아무리 잘 쓴 논문이라고 해도 항상 일반화에 한계를 가진다. 많은 사람들이 조사에서 거짓말을 한다. 대다수가 트럼프를 찍지 않을 거라고 응답했지만 트럼프가 당선되었다. 섹스 횟수와 콘돔 사용량은 실제보다 부풀려서 응답된다.
연구자의 편견도 제외할 수 없다. 작년 고려대 교수가 진행한 심리학 콜로퀴엄에 참석한 적이 있었는데 연구 주제와 결과 모두 흥미로웠다. 하지만 연구자가 가진 남녀에 대한 편견이 표본 수집에 섞여 있어 아쉬움이 있었다. (특정 행동을 '여성은 자주 하지 않기 때문에' 남성만 실험 대상자가 된다는 것이 도저히 나로서는 이해가 가지 않았다. 모든 대상을 수집하고 실험결과의 차이가 났을 때 한계를 제시했다면 그나마 유의미했을 것이다.)
하지만 빅데이터는 다르다. 수많은 대상이 자신의 욕망이 검색어에 그대로 드러난다.(물론 누가 검색했는지 같은 개인정보는 수집되지 않는다.) 수억에 달하는 사람들의 솔직함을 얻는다는 것은 사회과학 연구에서 엄청난 의미를 갖는다. 빅데이터는 단순히 방대한 자료 수집을 넘어 솔직한, 새로운 유형의 데이터를 제공한다. 빅데이터는 기존 연구와 직관에 확연히 반하는 결과를 제시하기도 한다. (특히 심리학에서 직관으로는 어렴풋이 알지만 수집의 한계가 있어 연구되지 못하는 것들을 연구할 수 있다는 사실에 감격했다.)
또 빅데이터는 인과관계를 말해줄 수 있다. 기존 사회과학 방법론은 상관관계는 쉽게 제시할 수는 있지만 인과관계를 제시하기에는 어려움이 있다. 빅데이터를 통한다면 A|B 통제 집단과 실험 집단을 분류하여 인과관계 또한 빠르게 추론할 수 있다. 전체뿐만이 아니라 지역, 성별, 나이 등 소집단으로 분류하여 데이터를 내고 비교할 수 있으며, 심지어 나와 비슷한 데이터를 가진 도플갱어를 찾아 내 미래도 예측할 수도 있다.
물론 빅데이터로 할 수 없는 것과 하지 말아야 할 것들도 존재하지만 빅데이터의 응용력과 가치는 그냥 지나칠 수 있는 것이 아니다. 이 책은 이 가치드를 직접 연구를 통해 그 가치를 잘 설명해주고 있다.
이 책은 동성애, 포르노 등 민감한 주제에 대해서도 가감없이 다룬다. 인간의 욕망에 대해 말하는 편견 없이 '사실이 그렇다'는 듯이 연구 결과를 보여주는데 이 특유의 전개방식도 상당히 매력있다. (이유에 대해 깊이 말하지는 않는다. 빅데이터가 보여주는 그 사실에 집중한다. 불편하지 않다.)
하지만 무엇보다 이 책의 가장 큰 장점은 재밌다는 것이다. 한동안 읽은 책들 중 가장 재미있게 읽었고, 마무리까지 유쾌했다. 빅데이터가 말하길 독자 중 90퍼센트 이상이 경제학자의 저작을 끝까지 읽지 않기 때문에 그만 쓰고 친구랑 맥주나 마시러 가야겠다는 결말은 정말 유쾌한 마무리이다.
빅데이터에 이제 겨우 관심을 가지기 시작한 나에게는 고마운 책이다. 심리학과인 나로서는 사회과학 연구 방법론에 회의감이 없지 않아 있었는데 새로운 방향이 생긴 기분이다. 조금 더 진지하게 생각할 필요가 생긴 것 같다.
19.01.30 글
'Media > Book' 카테고리의 다른 글
[책] 시선으로부터(정세랑) (0) | 2020.06.30 |
---|---|
[책] 양철과 강철의 숲(미야시타 나츠) - 조율과 잔잔한 생각들 (0) | 2020.04.29 |
[책] 아몬드(손원평) - 감정을 배운다는 것 (0) | 2020.04.27 |