BLOG main image
분류 전체보기 (369)
미국 사정 (22)
세계의 창 (25)
잡동사니 (26)
과일나무 (285)
배나무 (10)
Visitors up to today!
Today hit, Yesterday hit
daisy rss
tistory 티스토리 가입하기!
'예측'에 해당되는 글 5건
2023. 9. 27. 17:50

Spyros Makridakis, Robin Hogarth, and Anil Gaba. 2009. Dance with Chance: Making Luck Work for You. Oneworld Publications. 333 pages.

저자는 경영학자와 심리학자이며, 이 책은 인생의 중요한 네가지 영역, 즉 건강, 부, 성공, 행복과 관련하여 불확실성을 줄이려는 기존 시도들을 검토하고, 어떻게 예측의 정확성을 높일지에 대해 체계적으로 설명한다.

인간은 실제보다 세상을 더 잘 통제할 수 있다는 환상 속에서 살아간다 (illusion of control). 인간은 주위에서 일어나는 사건들에서 규칙적인 패턴을 찾아내려는 본능을 가지고 있는데,  이는 우연히 발생하는 사건들에게서까지 의미있는 패턴을 추정하는 오류를 낳는다. 인간이 예측하지 못하고 통제하지 못하는 우연의 세계에서 사는 것은 두렵기때문에 사람들은 본능적으로 이를 피하려 한다. 세상의 많은 일은 우연히 일어나는데, 사람들은 이러한 현실을 받아들이지 못한다.

의료, 투자, 기업 경영 분야에서 우연이 크게 작용한다. 객관적 자료를 이용해 검증한 결과, 이러한 분야에서 전문가의 의견이나 개입은 실제로 위험을 줄이는데 도움을 주지 못하는 것으로 나타났다. 의료 분야를 예로 들면, 정기적으로 신체 검사를 하면 병의 위험에 대비할 수 있다고 주장하는데, 실제 검사에 들이는 노력과 비용 대비 실질적인 효과는 별로 없다. 검사를 통해 심각한 질병의 조짐을 미리 발견할 가능성은 매우 작으며, 설사 심각한 질병의 조짐을 미리 발견한다고 하더라도, 이것이 궁극적으로 사망에 이르게 하는 결정적 원인이 아닌 경우가 대부분이다. 투자 분야를 예로 들면, 주식시장의 움직임은 단기 및 중기로 볼 때 랜덤 워크에 가깝다. 헤지 펀드와 같이 펀드 매니져가 적극적으로 종목을 선택하여 투자하는 펀드의 수익율은 랜덤하게 종목을 선택한 가상의 경우의 수익율과 비교해 결코 높지 않다. 주식 투자에서 확실한 것은 장기적으로 투자하면 결국 수익을 얻는다는 사실뿐이다. 기업 경영 분야를 예로 들면, 장기적으로 계속 성공하는 기업은 거의 없다. 새로운 혁신이 계속 나오면서 과거에 성공하던 기업은 새로 부상하는 기업에 의해 대체된다.

미래를 예측하려는 시도는, 그분야에서 과거에 일어난 일로부터 패턴을 추출하여, 이 패턴을 미래에 확장해 적용하는 방식으로 이루어진다(extrapolate). 전문가들은 과거에 일어난 일에 대해서는 왜 그렇게 됬는지 자세히 설명하지만, 미래에 일어날 일을 예측하는데는 무력하다. 미래에 일어날 일에 영향을 미칠 다양한 요인들을, 과거에 일어난 사건으로부터 유추하는데에는 한계가 있기 때문이다.

불확실성은 크게 두가지 특성으로 구분할 수 있다. 첫째는, 사건이 비교적 자주 발생하며, 위험의 규모가 상대적으로 작고, 변화의 범위를 어느 정도 파악할 수 있는 경우이다. 집에서 직장까지 걸리는 통근시간, 특정 시간대에 어느 지역의 전기 사용량 등이 대표적인 예이다. 이러한 사건의 불확실성, 즉 예측치의 분포의 변이 variation 는 정규분포를 보이기 때문에, 불확실성을 어느 정도 예측하고 대비할 수 있다. 둘째는, 드물게 발생하지만 피해의 규모가 매우 큰 사건이다. 이러한 사건은 언제 어디에서 일어날지 미리 예측할 수 없으므로 대비하기 어렵다. 대규모 지진, 금융 버블의 붕괴, 등이 대표적인 예이다. 이러한 사건도 집합적으로 보면 어느 정도 예측할 수 있다. 대규모 지진이 일어나고, 금융 버블이 발생하는 것은 과거의 경험에 의해 앞으로도 발생하리라 예측할 수 있는데, 문제는 구체적으로 언제 어디에서 일어날지 알지 못한다는 점이다. 현실에서 대부분의 사건은 이 두가지 성격의 불확실성이 어느 정도 뒤섞여 있다.

예측의 불확실성을 줄이기 위하여 몇가지 방법을 제시한다. 첫째는, 독립적으로 판단하고 예측한 예측치들의 평균을 취하는 방법이다. 전문가의 의견, 수리적인 예측 모델, 직관적인 예측, 등 다양한 출처로부터 의견을 모아 평균을 취하면 개별 출처에 의존할 때보다 예측의 정확도가 높아진다. 중요한 것이 걸린 결정의 경우, 한 사람의 전문가의 견해에 따르기보다, 여러 전문가의 이차 의견을 구해야 한다. 둘째는, 과거의 유사한 사건들로부터 패턴을 추출하여 미래에 확장해 적용하는 방법을 사용할 경우, 과거의 사건들로부터 가급적 단순한 패턴을 추출하여야 한다. 많은 변수의 복잡한 모델을 구축할 경우, 과거의 사건은 잘 설명할 수 있겠지만, 이러한 모델을 미래에 확장해 적용하면 크게 빗나가게 된다. 이는 머신 러닝에서 "overfitting"의 오류라고 지칭한다. 몇개의 주요 변수만 포함한 단순 모델을 구축할 경우, 이것이 과거를 만족스럽게 설명하지는 못하겠지만, 이 모델을 미래에 확장해 적용했을 때 크게 빗나갈 위험 또한 줄어든다. 이렇게 객관적인 자료로 부터 몇개의 변수를 사용하여 구축한 단순 모델을 적용하여 예측하는 것이, 사람의 직관을 이용해 예측한 것보다 더 정확하다. 사람들은 인간의 직관이 객관적인 모델보다 더 정확하게 대상을 파악한다고 느끼지만, 이러한 막연한 느낌은 사람들이 가진 통제의 환상 illusion of control 에 불과하다. 인간의 주관적 평가와 직관은 상황에 쉽게 좌우되기때문에 객관적인 지표를 사용할 때보다 불확실성을 줄이기 어렵다.

예측의 불확실성을 줄이는 세번째 방법은, 관련 사건이 속하는 포괄적 범주의 평균을 추출한 다음, 이것에다 개별 사건의 추가적인 위험 요소를 고려하여 수치를 조정하는 것이다. 사람들은 위험의 확율을 과소평가하는 성향을 가지고 있으므로, 관련 사건이 포함된 포괄적 범주의 변이에 두배를 곱하여 개별 사건에 적용할 것을 권고한다. 이 방법은 예측 전문가들이 쓰는 방법으로, 관련 범주의 기본 수치 base statistics 를 바탕으로 하여 ,개별 상황이나 추가적 정보에 맞게 약간씩 수정을 가하는 것이다.

아무리 불확실성을 줄이려 해도 세상과 인간의 삶은 기본적으로 불확실성이 많이 내포되어 있음을 인정해야 한다. 드물게 발생하지만 위험이 큰 사안은 예측하기는 어렵지만 대비할 수는 있다. 큰 지진은 드물게 발생하지만 지진 발생 가능성이 높은 지역에서는 내진 설계 등으로 피해를 줄일 수 있다. 대기업이 기존의 관행에 안주하면 파괴적 혁신을 들고 등장하는 새로운 기업에 의해 망한다는 것을 깨닫고, 끊임없이 혁신을 추구하면 이러한 위험을 어느 정도는 예방할 수 있다. 계속 노력하고 위험에 대비하는 사람에게 운이 따라온다는 것은 엄연한 진리이다. 드물게 발생하지만 큰 규모의 위험에 대해 미리 대비하는 사람만이 이러한 위험에 휩쓸려도 망하지 않는다.  

이 책의 처음에 우연의 힘을 막는 뾰족한 방법은 없다고 선언한다.  이책에서 제공하는 지식이 불확실성을 완전히 제거하지는 않는다고 경고한다. 그럼에도 체계적으로 불확실성을 줄여나가는 방법은 있다. 이 책은 특별히 새로운 지식을 제공하지는 않지만, 기존에 막연하게 알고 있던 것을 체계적인 분석으로 검증하고, 현실의 한계를 인정하면서 지혜롭게 의사결정하는 방법을 제시한다. 논의에 반복이 많은 것이 흠이다. 

2023. 6. 24. 23:05

Nassim Nicholas Taleb. 2010(2007). The Black Swan: The Impact of the Highly Improbable. 2nd ed. Penguin books. 397 pages.

저자는 증권딜러를 거쳐 통계학자로 변신한 사람이며, 이 책은 미리 예상할 수 없는 매우 드물게 일어나는 위험에 관해 논의한다.

검은 백조란 매우 드물게 일어나지만 엄청난 충격을 안겨주는 사건을 지칭하는 용어이다. 세상사는 예상할 수 있는 위험보다는 예상하지 못하며 매우 드물게 일어나는 위험에 의해 좌우된다. 근래로 올수록 이러한 경향이 과거보다 더 심하다. 사람들은 이러한 위험이 발생한 뒤에 사후적으로, 그러한 사건이 일어날 다양한 이유가 있었다고 설명하지만 (narrative fallacy), 사전적으로 이러한 일이 발생하리라고 예상하는 것은 불가능하다. 인간은 본능적으로 세상을 설명하고 이해하려 하는 강력한 욕구를 가지고 태어나기 때문에, 설명하지 못하는 것을 남겨두려고 하지 않는다. 그러나 어떤 사건은 아무런 사전적 이유 없이 랜덤하게 발생하거나, 원인이 있다 해도 이를 확인하기 어렵다. 왜냐하면 이전에 일어났지만 우리가 그 중요성을 인지하지 못하는 그러한 사건을 원인으로 하여 검은 백조가 발생할 수 있기 때문이다(problem of silent evidence). 검은 백조는 이전에 발생한 사건을 원인으로 하여 설명하고 예측하는 것이 불가능한 매우 특이한 사건이다.

실재의 현상은 이론에 따라 움직이지 않는다. 그러나 학문적 접근은 모두 이론에 따른 가정을 바탕에 깔고 현실을 설명하려고 하는데, 이렇게 접근하면 랜덤하게 발생하는 사건을 도저히 납득할 수 없다. 이론적 접근을 버리고 데이타에 충실하여, 현실로부터 잠정적으로 패턴을 추정하는 귀납적 방식을 택해야 한다. 검은 백조 현상은 이론적으로 설명하는 것은 불가능하다.

칠면조는 주인으로부터 1000일동안 먹이를 받아먹으면, 앞으로도 계속하여 먹이를 받을 것이라고 예상한다. 1000개의 사건에 대한 가용한 정보를 바탕으로 하여  1001번째 날을 예측하는 것이다. 그러나 1001번째 날이 크리스마스라 주인은 칠면조를 잡아먹는다. 칠면조의 입장에서 볼 때 1001번째의 죽음은 검은 백조이다. 검은백조가 나타나리라고 예측할 수 있는 합리적인 방법은 없다.

통계학, 경제학 등 인간사를 연구하는 학문은 근본적으로 세상사는 정규분포를 따른다고 가정하나, 사회의 현상 중 정규분포를 따르지 않는 것이 많다. 사람들은 원인과 결과 간에 비례적 선형적 관계를 가정하나, 비선형적인 관계를 보이는 것이 많다. 물질적 속성의 것, 예컨대 키, 체중, 수명, 등은 선형적 관계이나, 비물질적인 속성의 것, 예컨대 소득, 매출, 정보, 손해, 기술, 등 많은 사회현상은 정규분포나 선형적 관계를 따르지 않는다. 지수적 법칙 power law 은 이러한 비선형적 관계의 한 예이다. 지수적으로 증가하는 함수의 경우, 초기 값에 조그만 차이로도 시간이 지나면 결과가 크게 벌어진다. 정규분포에 따른다면 평균에서 벗어나면 급속하게 가능성이 줄기 때문에 예외적인 현상의 비중이 매우 작지만, 지수적 법칙으로 증가하는 함수의 경우 평균에서 벗어난 예외적 현상의 비중이 매우 크기 때문에 전체의 평균이 이 예외적 현상에 의해 좌우되게 된다.

검은 백조는 이러한 비선형적 사건의 일종이다. 비선형적인 극단적인 사건이 전체를 좌우하는 상황을 기본으로 하고 (Extremistan), 정규분포를 따르는 상황을 예외적인 것으로 상정하는 세계관을 가져야 한다. 그러나 학문적 접근은 정규분포의 상황을 기본으로 하고(Mediocristan), 비선형적 분포의 상황을 예외적인 것을 취급하는 데, 이는 현실을 제대로 반영하지 못하는 처사이다. 그렇기 때문에 학문적 접근은 현실과 유리되어 있다. 경제예측이나 재무분야의 포트폴리오 관리 이론은 모두 사기이다. 그들의 예측을 현실과 비교해 보면 전혀 맞지 않음에도, 사람들은 이들의 전문적인 설명에 혹해서 그릇된 세계관을 가지게 되고 위험에 무방비하게 노출된 생활을 한다. 

검은 백조을 예측할 수는 없지만, 어느 정도는 대비할 수 있다. 예상치 못한 위험에 튼튼하게 대비하여 (robust)  미리 미리 조심하면서 살아야 한다. 자연은 이러한 예상치 못한 위험에 대해 대비하게끔 진화하였다. 일견 비효율적으로 보이는 중복을 두는 것 (redundancy) 이 그것이다. 자연의 유기체들은 비상상황에서 하나가 망가지더라도 나머지 하나로 버텨나가게끔 설계되어 있다. 예상치 못한 드문 위험에 대비하지 못한 생물은, 드물지만 엄청난 충격을 주는 위험에 노출되어 멸종되어 버렸다. 최대의 효율을 추구한다고 여유를 두지 않고 최적화하는 것 (optimization) 은 자신을 예기치 못한 드문 위험에 취약하게 노출시키는 어리석은 행위이다. 취약함을 줄이는 방식으로(anti-fragile)으로 살아야 한다. 

빚을 지는 것은 취약한(fragile) 생활방식이다. 예기치 못한 위험에 자신을 노출시키는 행위이다. 개인이건 국가이건 최대한 자신의 소득 이내에서 살아야 한다. 빚을 동원하여 사업을 하면(leveraged), 예상치 못한 드문 위험이 닥쳤을때, 그동안 벌어놓았던 모든 이익 이상의 것을 까먹기 때문에, 망할 수밖에 없다. 미국의 금융계나 대기업의 보상 방식은, 이익에 대해서는 비례 이상으로 많이 보상을 하면서, 손해에 대해서는 책임을 지지 않는 구조로 되어 있다.  따라서 금융계는 무모한 정도로 많은 위험을 안고 사업을 하는 도덕적 해이 (moral hazard)상태에 빠져 있다. 2007년의 금융위기가 닥쳤을 때, 이러한 무모한 영업이 초래한 위험을 당사자들이 지지 않고 세금으로 손해를 메웠다. 위험을 발생시킨 당사자가 위험에 대해 책임을 지지 않는 현재의 보상 구조가 지속되는 한, 과도한 위험을 안은 취약한 사업 방식은 미래에 예기치 않은 드물게 발생하는 위험에 노출되어  또다른 시스템 위기를 초래할 것이다. 위험을 발생시킨 당사자가 위험에 따른 손해를 짊어지는 보상 구조(skin in the game) 로 바꾸어야만 위기를 막을 수 있다.

저자는 금융 현장에서 잔뼈가 굵은 사람 답게 학술적 접근의 비현실성을 신랄하게 비판한다. 그는 검은 백조, 랜덤한, 비선형적인, 등 매우 매력적인 주제를 다루어서 스타가 되었다. 사람들은 모두 세상이 랜덤한 사건에 의해 크게 좌우된다는 것을 살면서 모두 경험하지만, 이를 체계적으로 언급하는 사람은 드물다. 세상사가 랜덤하게 발생한다고 하는 것은 "왜 그런일이 발생하는지 모르겠다" 는 말을 하는 것이므로, 아무도 자신이 모른다고 드러내서 말하려고 하지 않는다. 이 책의 저자도 검은 백조는 전혀 예측할 수 없다고, 전혀 설명할 수 없다고, 예측이나 설명을 하려고 해서는 안된다고 말한다.

솔직히 이책은 그렇게 잘 쓴 책은 아니다. 주제와 무관한 잡다한 사설을 곳곳에서 쉼없이 냉소적으로 퍼부어 대기 때문에, 정말 무슨 말을 하려고 하는지 정신 똑똑히 차리고 가려서 읽어야 해서 필요 없이 에너지가 많이 소모되었다. 비슷한 이야기를 계속 장황하게 반복하는 것도 흠이다. 주제와 무관한 개인적인 에피소드와 진지하고 복잡한 사안을 수시로 섞어가며 서술하는 것 역시, 그의 스타일이라고 하지만, 주의를 분산시기 때문에 비효율적인 서술이다. 그럼에도 통계학이나 경제학에서 기존에 하던 말과는 다른 신선한 주장을 제시하는 것은 사실이다. 물론 어디까지 그의 주장이 옳은지를 살펴야 하는 피곤함이 따르기는 하지만. 그의 주장은 부분적으로만 맞다.

2020. 3. 28. 12:51

Gerd Gigerenzer. 2014. Risk Savvy: how to make good decisions. Penguin Books. 261 pages.

저자는 심리학자이며 독일의 막스플랭크의 연구소장이다. 인간은 리스크를 안고 살아야 하는데 불확실한 상황에서 어떻게 현실적으로 지혜로운 판단을 할 것인가라는 주제를 연구해 왔다. 이 책은 그의 연구 결과를 일반인이 이해하기 쉽게 정리한 것이다.

불확실한 상황에서 완벽히 확실한 해결책을 찾는 것은 일을 그르친다. 그보다는 상식과 직관적인 이해에 바탕을 둔 대략의 어림짐작(rule of thumb)을 하는 것이 가장 합리적 결정이다. 불확실성이 클수록, 문제가 복잡하여 선택지가 많을 수록, 그에 대한 데이터가 많지 않을수록 대략의 어림짐작 방법이 최적화 방법보다 좋다. 반면 비교적 확실한 상황이며, 선택지의 수가 작고, 그에 대해 축적된 데이터가 많을 수록 복잡한 모델을 세워서 최적의 선택을 내리는 방법이 효과를 발휘한다.

리스크에는 두 종류가 있다. 선택지들과 각각의 선택지가 발생할 확률이 알려진 리스크(known risk)가 하나로 이는 주사위를 던지는 것이나 카지노의 슬롯머신이 대표적 예이다. 가능한 선택지를 모르며, 각각의 선택지가 발생할 확률을 알지 못하는 리스크(unknown risk)가 다른 하나이다. 현실에서 발생하는 구체적 사건은 대체로 후자에 속한다. 주가가 추락할 확률, 지진이 날 확률, 사고가 날 확률, 사업이 망할 확률, 전염병이 창궐할 확률 등이다. 탈레브의 책에서 'trukey risk' 라는 용어를 빌려온다. 주인이 그가 키우는 칠면조에게 먹이를 주는 날이 늘수록 칠면조가 인식하기에 다음 날에도 그가 살아있을 가능성이 높지만, 실제 다음날에 그가 잡아 먹히는 사건이 일어날 것을 인식하지 못한다. 즉 단 한번 밖에 일어나지 않는 사건의 리스크를 합리적으로 정확히 예측하는 것은 불가능하다. 그런데 사람들은 단 한번 일어날 사건의 확률을 알려진 확률로 오인하여 판단을 그르친다. 물론 개별 사건의 확률은 알지 못하나 개별 사건이 속한 집단의 확율은 파악하는 경우는 많다.

문제가 발생할 경우를 용인하면서, 일단 문제가 발생하면 문제의 원인을 탐구하고, 그것으로 부터 배워 문제가 발생할 위험을 줄이도록 상황을 개선하는 것이, 다음번에 문제를 덜 발생시키는 최선의 방법이다. 반면 문제가 발생할 때 문제의 원인을 찾아 개선하려는 노력보다 문제 발생자의 책임을 추궁하는데 치중한다면, 다음번에 문제의 발생 위험을 줄일 수없다. 여러 상황 조건이 맞아 떨어져 문제가 발생하는 것이므로, 문제 발생자의 행위는 여러 요인 중에 하나에 불과하다.  많은 경우 배경조건이 문제를 발생시킨 진정한 원인이며, 문제 발생자의 행위는 문제의 사건과 거짓 관계 spurious relationship를 맺고 있으므로, 문제 발생자를 문책하는 것이 다음번에 문제 발생의 위험을 낮추지 못한다. 

전자의 사례로 비행기의 사고를 줄이는 노력을, 후자의 사례로 의료 사고를 든다. 비행기 사고의 경우 철저하게 원인을 검토하고 결과를 공유하며 문제를 발생시키는 조건을 개선한 결과 사고의 위험이 놀랄만큼 줄어들었다. 반면 의료 사고는 감추는데 급급하여 사고를 발생시키는 조건을 개선하지 않기 때문에 동일한 의료 사고가 반복되고 있다. 이는 방어적 과잉 치료 관행을 부추기며, 가장 최선의 치료 방법이 아니라 의사에게 책임을 추궁을 피할 수 있도록 하는 차선의, 혹은 환자에게 해롭기까지 한 치료 방법이 선택된다.

인간은 진화의 과정에서 위험 요인을 두려워하고 피하도록 조건지워졌다. 이는 현대과학문명에서 실제 매우 작은 위험 상황에 대해 비합리적으로 두려움을 느끼고 피하는 비효율적 의사결정을 낳았다. 그 결과 비행기 사고나 테러에 대해 사람들은 크게 경악하여 비합리적으로 행동한다. 미디어는 이러한 사람들의 과도한 경계 성향을 부채질함으로서 돈을 번다.

일부 사람들은 자신이 불확실한 리스크를 통제할 수있다는 과도한 자신감을 가지고 있다. 주식 투자가 그것으로, 특정 주식의 오르내림은 예측이 불가능한 리스크이다. 가장 합리적 투자는 n 분의 1 씩 나누어서 위험을 분산하는 것이다. 주식시장은 불확실하고, 선택지가 많고, 과거 데이터가 충분치 않은 대표적 사례이므로 가급적 단순한 접근법이 가장 효과적이다.

복잡한 상황에서는 그러한 상황에 경험이 많은 전문가의 직관(gut feeling)에 의지하는 것이 가장 효과적인 의사결정법이다. 전문가의 직관은 수치화될 수 없는 다양한 요인을 무의식 속에서 복합적으로 반영한 판단이기 때문이다. 

장래의 배우자를 고를 때나 구매를 할 때, 모든 선택지를 다 탐구해본다음 최고의 것을 선택하는 방식, 즉 최적화 방법(maximize)은 비효율적이다. 그보다는 머리속에서 대략의 수준을 정해두고 그에 근접한 사례가 나타나면 더이상의 검색을 중단하고 선택을 내리는 것, 즉 웬만큼 좋은 것을 선택하는 것(good enough)이 가장 합리적인 의사결정 방식이다.

저자는 의료계 위험에 전문가로 이 주제에 많은 논의를 할애한다. 의료 테스트 결과가 양성으로 나왔을 때 실제 그 질병에 걸렸을 확율은 생각보다 크지 않다. 예컨대 유방암 검사가 양성으로 나왔을 때 실제 유방암에 걸렸을 확율은 10분의 1에 불과하다. 베이즈의 조건부 확율을 이해하는 의료인은 많지 않다.

의사는 자기 방어(self-defence), 의료 통계수치를 이해하지 못하는 것(innumeracy), 환자의 이익보다는 의사 본인의 이익을 추구하는 것(conflicts of interest), 이 세가지 원인 때문에 과잉진료를 하며, 환자에게 테스트 결과를 제대로 전달하지 못한다. 

정기 검진보다는 실제 증상이 있을 때 진료를 받는 것이 합리적이다. 유방암 검사와 전립선암 검사를 예를 들자면, 테스트를 하면 양성으로 나오는 경우가 많은데, 실제 양성 반응의 사례에서 활성 암인 경우는 매우 적다. 많은 사람은 비활성 암을 가지고 살다가 죽는다. 그러나 테스트를 하여 양성으로 나타나면 수술 등 적극적인 치료에 들어가는 데, 이는 필요치 않은 과잉 치료에 속하며 해롭기까지 하다. 증상이 없는데 테스트 결과 양성이어서 항암치료나 수술을 받은 사람이나, 혹은 테스트를 받지 않고 비활성 암을 가지고 살다 죽은 사람이나 죽는 연령은 거의 비슷하다. 테스트를 하여 양성이 나온 환자를 수술하여 5년동안의 생존율이 높다는 사실을 들어 정기적 테스트의 필요성을 강조하는 것은 사실의 일부만을 호도하는 것이다. 의료계는 테스트 및 후속의 적극적 치료를 통해 돈을 벌기 때문에 정기적 검진을 강조하는데, 이는 conflicts of interest에 속한다.

정기적 테스트를 하여 조기에 발견하는 것이 암을 예방하는 방법이 아니다. 증상이 없다면, 암을 조기에 발견하거나 혹은 조기에 발견하지 않거나간에 암으로 죽는 연령은 거의 흡사하기 때문이다. 암은 해로운 행위 요인 때문에 발생할 가능성이 높아진다. 흡연, 음주, 비만, 운동안함, 패스트 푸드와 설탕물 탄산음료, 육류지방과 소금의 과도한 섭취, 등의 요인을 개선하는 것이 암을 예방하는 진정한 방법이지 정기적 검사는 암에 대비하는 것이 아니다.

불확실한 세상에서 위험에 지혜롭게 대처하기 위해서는 어렸을 때 부터 위험에 대한 교육을 받아야 한다. 건강 위험, 금융 위험, 디지털 위험에 대해 어렸을 때 정확한 지식을 교육받고 바른 습관을 들이도록 해야 한다. 또한 교육을 통해 통계적 사고 방식을 습득하고, 복잡한 문제에 대해 대략의 어림짐작을 하는 방법을 훈련하고, 작은 위험에 대해 비합리적으로 패닉하지 않도록 심리적 훈련을 하는 것이 지혜롭게 위험에 대응하는 길이다. 

이 책은 저자의 전문적인 연구 결과를 일반인을 위해 풀어서 쓴 것이므로 전달하려고 하는 내용이 많고 깊이가 있다. 확율을 계산하는 부분에서는 서술을 따라가기 어려운 곳도 있다. 지적인 면에서나 실용적인 면에서나 좋은 책이다.

2019. 7. 22. 12:59

Nate Silver. 2012. The Signal and The Noise. Penguin Books. 454 pages. 

저자는 선거예측 사이트인 FiveThirtyEight.com의 운영자로, 2012년 오바마가 선출된 대통령 선거에서 미국 50개 주의 선거결과를 모두 정확하게 예측해 냄으로서 하루 아침에 유명해진 사람이다. 이 책은 그가 어떻게 예측의 달인으로 성장하게 되었는지, 그의 예측의 기술은 무엇인지 설명한다. 그의 예측 기술의 핵심은 베이즈 공리, 즉 조건부 확률 이론에 입각한 통계적 예측이다. 기존에 알고 있는 정보에 입각하여 확률적 예측을 한 후, 새로운 유용한 정보가 나타날때마다 예측 확률을 업데이트하는 방식이다.  

저자는 청소년 시절 야구를 매우 좋아 하였으며 야구 결과를 예측하는 데 관심을 가졌다. 이러한 관심을 체계적으로 발전시켜 야구 결과 예측모델을 개발하여 프로야구단에 판매하기까지 하였다. 미국 프로야구는 극도로 정량화된 세계이다. 선수 개개인의 타율, 출루율, 방어율, 투수의 삼진, 사구 비율 등과 같은 기초적인 지표에서부터 개개 선수가 어떤 위치에서 어떠한 행위를 하였는지에 대해 상세한 지표가 개발되어 수십년간 자료가 축적되어 있다. 이러한 자료는 선수 개개인의 평가와 선발에 사용되며, 팀의 승패를 예측하는데 이용된다. 스포츠 선수 트레이드 시장이나 스포츠 게임의 승패를 두고 내기를 하는 시장 또한 규모가 크다. 이 책에서는 야구의 선수의 업적과 게임의 승패를 예측하는데 관한 설명이 다양한 사례를 사용하여 자세히 제시된다.  

예측에서 중요한 것은 어떤 것이 유용한 정보이고 어느 것이 랜덤한 요소인지를 구분해내는 일이다. 그는 이를 신호와 소음이라고 지칭한다. 지금까지 발생한 사건들로부터 유용한 패턴을 추출하는 작업은 단번에 완성되는 작업이 아니라 점차로 정확도를 높여가는 과정이다.  지금까지의 가용 정보를 기반으로 가능성이 높은 패턴, 혹은 가설을 만들고, 전개되는 사건이 이 패턴에 얼마나 맞아 떨어지는지에 따라 점차적으로 조정을 해가는 작업. 이는 다름아닌 과학적 연구방법이다. 발생한 일 중 많은 부분은 랜덤한 요인에 의해 발생하는데, 사람들은 이렇게 랜덤하게 발생한 것을 패턴으로 혼동하기 쉽다. 무엇이 랜덤한 요인이고 무엇이 유의미한 패턴에 의해 발생하는지 사전에 구분하는 것은 불가능하다. 

저자의 두번째 직업은 포커 도박사였다. 포커 게임은 게임이 진행되면서 상대의 패의 범위를 읽어내고, 자신이 가진 패의 승률을 면밀하게 계산하여 콜을 할것인지, 상대의 콜을 받을 것인지, 아니면 죽을 것인지를 판단해 낸다. 저자는 한 때 상당한 돈을 따기도 했으나, 프로 도박사의 세계에서 자신의 역량의 한계를 깨닫고 손을 떼었다. 이 책에서 포커 게임의 원리와 전문 도박사들이 어떻게 승율을 따지는지에 대해 매우 체계적으로 설명하고 있다.  

사실 저자를 유명하게 한 것은 선거 결과를 정확히 예측한 것이다. 그는 뉴욕타임즈에 그의 예측 결과를 보고하는 칼럼을 쓰게 되었는데, 그것의 정확도가 어느 다른 선거 예측전문가 보다 높게 나타나 단번에 눈에 띠었다. 그는 선거를 앞두고 벌어지는 모든 여론 조사를 반영하고, 지난 수십년간 벌어진 모든 선거 결과와 여론조사의 기록을 면밀히 분석하여, 체계적으로 선거 결과를 예측하는 모델을 만들었다. 선거 시점으로 다가갈수록 유용한 정보의 비중이 높아지는 반면 랜덤한 요인의 작용은 줄어들기 때문에, 예측의 정확도는 얼마나 선거에서 멀어져 있냐에 따라 달라진다. 이 책에서는 선거 예측 모델은 본격적으로 다루지 않는다.  아마도 저자는 선거 결과 예측에 관해 별도의 책을 쓰려고 계획하고 있거나, 혹은 현재 잘 나가가고 있는 사업의 비밀을 지나치게 구체적으로 밝히고 싶지 않은 것 같다. 

이책에서 상세하게 설명하는 또다른 예측 사례는 기상예측, 지진 예측, 기후변화, 이다. 저자는 이 주제에 관해 쓰기 위해 많은 사람을 인터뷰하고 관련 자료를 풍부히 검토한 것으로 보인다. 주식 시장의 예측 또한 제법 상세하게 설명하고 있다. 높은 승률을 기록했다고 하는 펀드들이 얼마나 시장 평균에서 벗어나는지, 모든 가용한 정보가 가격에 반영되어 있다고 하는 완전시장가설이 얼마나 타당한지, 주가의 변동에서 유용한 패턴과 랜덤한 요소를 어떻게 구별할 것인지에 대하여 저자 나름의 설명이 제시된다. 이외 테러 발생 예측에 대한 설명도 별도의 장에서 전개한다. 

야구 승률 예측에서 시작하여 포커 도박사를 거쳐 선거 결과 예측으로 성공한 저자가 자신이 생각하고 실천하는 예측의 기술에 대해 솔직히 설명한 이 글은 제법 흥미롭다. 확률 이론서나 통계 교과서처럼 수식을 제시하지는 않지만, 설명이 체계적이며 관련 이론에 대해 풍부한 지식을 보유하고 실전에 적용하는 것을 구체적으로 사례를 설명하는 서술에서 읽을 수있다. 그가 예측에 대해 설명하는 것을 읽다보면 예측이란 매우 현실적이고 냉정한 이성을 필요로 하는데, 예측의 정확도가 어느 정도 기본적인 수준에 도달한뒤 조금 더 나아가려고 하면 엄청나게 많은 노력을 투입해야 약간의 향상을 이룰 수있는 지난한 작업임을 깨닫게 된다.  저자는 그렇게 엄청나게 노력하여 성과를 거둔 사람임을 확인한다. 

'과일나무 > 사과나무' 카테고리의 다른 글

인과관계  (0) 2019.09.01
무엇을 먹을 것인가  (0) 2019.08.06
스트레스는 어떻게 사람을 망가뜨리나  (0) 2019.07.13
우연이 지배하는 삶  (0) 2019.07.11
불평등은 사람을 어떻게 변화시키는가  (0) 2019.06.26
2019. 6. 16. 22:17

Philip E. Tetlock and Dan Gardner. 2015. Superforcasting: the art and science of prediction. Crown Publishers. 285 pages. 

심리학자인 저자가 수 년동안 진행한 연구 성과를 요약한 책이다. 그가 주도한 연구 프로젝트는 일 군의 일반 사람들에게 가까운 미래에 특정 사건이 발생할 가능성을 구체적 확률치로 예측하도록 하여, 이 가능성 예측 게임에서 우수한 성적을 거둔 사람들이 어떻게 그렇게 할 수있었는가를 분석한다. 미래 예측 게임에서 우수한 성적을 거둔 사람들이 사용한 방법에는 공통점이 있다. 

그들은 다양한 출처의 자료들을 체계적으로 조사하며, 자신이 예측이 실패하였을 때 그 원인을 면밀히 검토하여 자신의 분석 방법을 점진적으로 개량하며, 직관에 의지하기보다는 객관적 사실에 의지하여 긍정적 요인과 부정적 요인을 면밀히 비교한다.  사람들은 다양한 요인에 대해 복잡하게 계산적으로 검토하는 것을 싫어한다. 반면 예측의 달인은 끈질기게 관련 자료를 수집하고 검토하고 비교 분석하고, 자신의 판단을 재검토하여 개선해 나간다. 이는 소위 전문가라 하는 사람들이 사실에 입각하여 자신의 견해를 수정하려하지 않는 독단적 태도와 대조된다. 소위 전문가라 하는 사람들은 자신의 예측과 어긋나는 사실이 나타나도 자신의 견해를 애매한 표현으로 정당화하는 경향이 있다. 

사람들은 문제에 대해 체계적으로 접근하려 하지 않으며, 다양한 관련 자료를 모으는 노력을 거부하며, 자신의 판단을 재검토하고 오류로부터 배우는 것을 싫어한다. 요컨대 사람들은 생각하는 것을 싫어한다. 저자는 바로 이러한 사람들의 성향이 엉터리 예측을 반복하는 이유라고 진단한다. 이러한 사람들의 성향에 대한 그의 지적은 노벨 경제학상을 받은 다니엘 칸네만의 주장과 맥을 같이 한다.  저자는 예측의 정확도를 높이는 것이 훈련을 통해 점진적으로 향상될 수있는 기술이라고 주장한다.   

학문적인 연구의 성과를 배경으로 쓴 책 답게 논의가 체계적이며 메시지가 분명하다. 그가 언급한 것 중에 기억에 남는 것을 지적하자면, 우연을 인정하는 태도에 관한 언급이다. 세상의 일들은 다양한 가능성 중에서 하나가 발생한 것이다. 따라서 어떤 일이 왜 그렇게 전개되었는가를 합리적으로 설명할 수 없는 경우가 많다. 왜냐하면 여러 가능한 시나리오 중 하나가 발생한 것은 우연의 산물이기 때문이다. 우연이 거듭되면서 여러 일이 여러 일을 낳은 것이므로, 미래란 기본적으로 불확실하다. 예측을 할 수있는 사안을 예측해야 하며, 예측을 할 수없는 사안을 예측하려고 하는 것은 허사이다.  분명한 것은 현재에서 먼 미래일수록 예측은 허사라는 사실이다. 예컨대 5년 내의 예측은 어느 정도 타당성이 있으나, 10년 후의 예측은 전혀 가능하지 않다.  이 책에는 근래에 발생한 정치 경제 사례를 풍부하게 들면서 이야기를 전개하므로 세상 돌아가는 것을 이해하는 데 도움을 준다. 

prev"" #1 next