BLOG main image
분류 전체보기 (365)
미국 사정 (22)
세계의 창 (25)
잡동사니 (26)
과일나무 (285)
배나무 (6)
Visitors up to today!
Today hit, Yesterday hit
daisy rss
tistory 티스토리 가입하기!
2019. 7. 22. 12:59

Nate Silver. 2012. The Signal and The Noise. Penguin Books. 454 pages. 

저자는 선거예측 사이트인 FiveThirtyEight.com의 운영자로, 2012년 오바마가 선출된 대통령 선거에서 미국 50개 주의 선거결과를 모두 정확하게 예측해 냄으로서 하루 아침에 유명해진 사람이다. 이 책은 그가 어떻게 예측의 달인으로 성장하게 되었는지, 그의 예측의 기술은 무엇인지 설명한다. 그의 예측 기술의 핵심은 베이즈 공리, 즉 조건부 확률 이론에 입각한 통계적 예측이다. 기존에 알고 있는 정보에 입각하여 확률적 예측을 한 후, 새로운 유용한 정보가 나타날때마다 예측 확률을 업데이트하는 방식이다.  

저자는 청소년 시절 야구를 매우 좋아 하였으며 야구 결과를 예측하는 데 관심을 가졌다. 이러한 관심을 체계적으로 발전시켜 야구 결과 예측모델을 개발하여 프로야구단에 판매하기까지 하였다. 미국 프로야구는 극도로 정량화된 세계이다. 선수 개개인의 타율, 출루율, 방어율, 투수의 삼진, 사구 비율 등과 같은 기초적인 지표에서부터 개개 선수가 어떤 위치에서 어떠한 행위를 하였는지에 대해 상세한 지표가 개발되어 수십년간 자료가 축적되어 있다. 이러한 자료는 선수 개개인의 평가와 선발에 사용되며, 팀의 승패를 예측하는데 이용된다. 스포츠 선수 트레이드 시장이나 스포츠 게임의 승패를 두고 내기를 하는 시장 또한 규모가 크다. 이 책에서는 야구의 선수의 업적과 게임의 승패를 예측하는데 관한 설명이 다양한 사례를 사용하여 자세히 제시된다.  

예측에서 중요한 것은 어떤 것이 유용한 정보이고 어느 것이 랜덤한 요소인지를 구분해내는 일이다. 그는 이를 신호와 소음이라고 지칭한다. 지금까지 발생한 사건들로부터 유용한 패턴을 추출하는 작업은 단번에 완성되는 작업이 아니라 점차로 정확도를 높여가는 과정이다.  지금까지의 가용 정보를 기반으로 가능성이 높은 패턴, 혹은 가설을 만들고, 전개되는 사건이 이 패턴에 얼마나 맞아 떨어지는지에 따라 점차적으로 조정을 해가는 작업. 이는 다름아닌 과학적 연구방법이다. 발생한 일 중 많은 부분은 랜덤한 요인에 의해 발생하는데, 사람들은 이렇게 랜덤하게 발생한 것을 패턴으로 혼동하기 쉽다. 무엇이 랜덤한 요인이고 무엇이 유의미한 패턴에 의해 발생하는지 사전에 구분하는 것은 불가능하다. 

저자의 두번째 직업은 포커 도박사였다. 포커 게임은 게임이 진행되면서 상대의 패의 범위를 읽어내고, 자신이 가진 패의 승률을 면밀하게 계산하여 콜을 할것인지, 상대의 콜을 받을 것인지, 아니면 죽을 것인지를 판단해 낸다. 저자는 한 때 상당한 돈을 따기도 했으나, 프로 도박사의 세계에서 자신의 역량의 한계를 깨닫고 손을 떼었다. 이 책에서 포커 게임의 원리와 전문 도박사들이 어떻게 승율을 따지는지에 대해 매우 체계적으로 설명하고 있다.  

사실 저자를 유명하게 한 것은 선거 결과를 정확히 예측한 것이다. 그는 뉴욕타임즈에 그의 예측 결과를 보고하는 칼럼을 쓰게 되었는데, 그것의 정확도가 어느 다른 선거 예측전문가 보다 높게 나타나 단번에 눈에 띠었다. 그는 선거를 앞두고 벌어지는 모든 여론 조사를 반영하고, 지난 수십년간 벌어진 모든 선거 결과와 여론조사의 기록을 면밀히 분석하여, 체계적으로 선거 결과를 예측하는 모델을 만들었다. 선거 시점으로 다가갈수록 유용한 정보의 비중이 높아지는 반면 랜덤한 요인의 작용은 줄어들기 때문에, 예측의 정확도는 얼마나 선거에서 멀어져 있냐에 따라 달라진다. 이 책에서는 선거 예측 모델은 본격적으로 다루지 않는다.  아마도 저자는 선거 결과 예측에 관해 별도의 책을 쓰려고 계획하고 있거나, 혹은 현재 잘 나가가고 있는 사업의 비밀을 지나치게 구체적으로 밝히고 싶지 않은 것 같다. 

이책에서 상세하게 설명하는 또다른 예측 사례는 기상예측, 지진 예측, 기후변화, 이다. 저자는 이 주제에 관해 쓰기 위해 많은 사람을 인터뷰하고 관련 자료를 풍부히 검토한 것으로 보인다. 주식 시장의 예측 또한 제법 상세하게 설명하고 있다. 높은 승률을 기록했다고 하는 펀드들이 얼마나 시장 평균에서 벗어나는지, 모든 가용한 정보가 가격에 반영되어 있다고 하는 완전시장가설이 얼마나 타당한지, 주가의 변동에서 유용한 패턴과 랜덤한 요소를 어떻게 구별할 것인지에 대하여 저자 나름의 설명이 제시된다. 이외 테러 발생 예측에 대한 설명도 별도의 장에서 전개한다. 

야구 승률 예측에서 시작하여 포커 도박사를 거쳐 선거 결과 예측으로 성공한 저자가 자신이 생각하고 실천하는 예측의 기술에 대해 솔직히 설명한 이 글은 제법 흥미롭다. 확률 이론서나 통계 교과서처럼 수식을 제시하지는 않지만, 설명이 체계적이며 관련 이론에 대해 풍부한 지식을 보유하고 실전에 적용하는 것을 구체적으로 사례를 설명하는 서술에서 읽을 수있다. 그가 예측에 대해 설명하는 것을 읽다보면 예측이란 매우 현실적이고 냉정한 이성을 필요로 하는데, 예측의 정확도가 어느 정도 기본적인 수준에 도달한뒤 조금 더 나아가려고 하면 엄청나게 많은 노력을 투입해야 약간의 향상을 이룰 수있는 지난한 작업임을 깨닫게 된다.  저자는 그렇게 엄청나게 노력하여 성과를 거둔 사람임을 확인한다. 

'과일나무 > 사과나무' 카테고리의 다른 글

인과관계  (0) 2019.09.01
무엇을 먹을 것인가  (0) 2019.08.06
스트레스는 어떻게 사람을 망가뜨리나  (0) 2019.07.13
우연이 지배하는 삶  (0) 2019.07.11
불평등은 사람을 어떻게 변화시키는가  (0) 2019.06.26