728x90
반응형
https://www.yes24.com/Product/Goods/124930154
수학의 힘 - 예스24
“결국 수학적인 것이 살아남는다”급변하는 세상, 수학은 언제나 올바른 도구다내가 보유한 주식이 오를지 내릴지 예측할 수 있을까? 오늘 프리미어리그에서 토트넘이 득점할 확률은 얼마일
www.yes24.com
[요약]
1부 구조 [숫자 너머의 변화를 읽어라]
- 수학은 세계가 작동하는 방식을 이해하는 데 훌륭한 도구다. 자연현상은 대체로 단순한 규칙을 따르기 때문이다. 수학은 이를 체계적으로 담아내는 언어의 역활을 한다.
- 수학이 어떻게 구조를 파악하고 설명하는지를 실컷 다루고 나면, 깔끔하고 질서정연한 세계에서 벗어나는 것이 모순적이라고 생각할 수 있다.
2부 무작위성 [불확실한 확률 싸움에서 이기는 법]
- 본능적으로 인간은 무작위성이란 개념 때문에 쉽게 함정에 바진다. 예상되는 행동과 실제 가능성을 보여주는 극단적 사례들을 통해 무작위성을 이해하면 그런 사안들을 더 잘 이해할 수 있다.
3부 정보 [복잡한 현대사회에서 더 빛나는 수학의 힘]
- 오늘날의 세상을 수학적으로 이해하는 핵심적이고 최종적인 분야를 다룬다. 정보와 불확실성이라는 개념은 일상적 의사소통과 미디어 소비의 많은 부분을 구성하는 기본 요소이며, 엔트로피라는 양을 이용해 수학적으로 정량화 할 수 있다. 정보가 어떻게 잘못된 정보로 변질되는지, 주식시장과 팬데믹의 진행 과정을 어떻게 설명하는지, 심지어 자원 하나를 두고 어떻게 경쟁이 벌어지는지 알아본다.
[12가지 수학 도구]
- 데이터를 그래프로 표시하는 것이 수학적 사고방식을 배워나갈 훌륭한 방법
- 숫자를 더 잘 이해하는 요령 중 가장 간단한 방법은 그래프로 표시하는 것이다.
- 무슨 내용에 관한 그래프지? 어떻게 해서 얻어냈지? 언론과 온라인에서 그래프와 데이터들을 찾아 조금 더 비판적으로 살펴보라. 그러면 그래프를 수동적으로 언뜻 보고 지나치지 않고 적극적으로 이용할 수 있다.
- 데이터를 그래프로 표현하는 이유는 데이터가 만들어지는 과정으로 통찰하기 위해서다. 숫자를 설명할 수학모델을 찾으면 미래의 수치를 예측해서 적절한 계획을 세울 수 있다.
- 수의 세계 (경체 통계치, 여론조사) 이해 요령
- 어떤 수든 어느 정도 부정확하다고 생각해야 하며, 수에 관해 말하거나 생각할 때 의미 없는 정확성에 집착하지 말아야 한다.
- 큰 수에 관한 직관을 길러야 한다. 만약 인용된 값이 너무 크거나 작으면 어딘가에 차수 오류가 있을 수도 있으미 거듭 확인해야 한다.
- 정부가 발표하는 큰 규모의 액수를 이해하는 한 가지 유용한 방법은 그 수를 '1인 기준'으로 생각해보는 것이다.
- 페르미 추정은 복잡한 문제에서 첫 번째 근삿값을 빠르게 알아내야 할 때 끝내주게 잘 통한다.
- 지수적 증가 개념
- 데이터를 그래프로 표현할 때 선형적 스케일과 로그스케일 방식을 선택할 수 있는 웹사이트를 직접 찾아보라. 설정을 이리저리 바꾸다 보면 특히 장기적인 금융 관련 시계열에서 이런 표현 방법 간의 변환 효과가 보인다. 표현 방법에 따라 이야기는 어떻게 바뀔까? 여러분은 어떤 방식을 선호하는가?
- 시스템의 규칙 자체는 단순하지만 움직임은 복잡한 경우
- 윌리엄 커맥과 앤더스 맥켄드릭은 1927년에 미분방정식을 이용해 전염병을 모델링한 선구적인 연구결과를 발표했다. 이 논문에서 오늘날 너무 유명해진 R0 가 처음 도입됐다. R0를 "거의 모든 인구에게 빈번하게 발생하는 전염병 발병의 규모를 설명하는 데 적합한 것으로 보이는 하나의 인과적 요소"라고 했다. 이 논문에서 SIR 모델이 등장한다. 감염대상군 S(susceptible), 감염군 I(infectious), 회복군 R(recovered) 을 나타낸다. 면역력이 장기간 지속되고 자연적인 전염병이 유행하는 동안 사람들은 첫 번째 상태 (감염대상 상태, 곧 아직 감염되지 않은 상태)를 거쳐 두 번째 상태 (감염 상태, 곧 다른 사람을 감염시킬 수도 있는 상태)를 거켜 최종 상태 (회복 상태, 곧 전염병에 면역력이 생긴 상태)로 자연스럽게 옮겨간다.
- 핵심은 어떻게 전염병을 이산적인 과정 (시간 구간마다 정수의 사람들로 이뤄진 과정) 으로 보던 관점에서 벗어나, 연속적인 과정 (임의의 수의 사람들로 이뤄진 과정) 으로 고찰했는지를 이해하는 일이다.
- 수 많은 현상에서 연속적인 공간과 시간을 불연속적인 덩어리로 분할해 시스템이 따르는 규칙을 나타낼 수 있다. 자연 현상이 단순한 규칙으로 규정된다는 개념을 더 깊이 탐구하고 싶다면 일상생활에서 물체들이 움직이는 방식을 살펴보라.
- 무작위성의 핵심 개념 (무작위성과 예측 가능성)
- 중심극한정리가 일반적으로 적용되기는 하지만 그렇지 않는 상황도 있다. 평균을 구할 항목들이 독립적이지 않거나 값이 클 가능성이 너무 높으면 순진한 분석은 통하지 않는다.
- 무작위성을 파악하고 상이한 무작위적 현상들을 비교하여 데이터 특징을 설명하는 개념 중에서 기댓값과 분산 개념을 토대로 데이터의 중앙값과 그 주위에서 일어나는 변동의 크기를 살펴봤다. 또한 큰 수의 법칙과 중심극한정리는 장기적 평균과 관련된 이론이다.
- 신뢰구간 같은 통계 개념
- 확률과 통계로 기준을 세워 결정하는 방법이 있다. 바로 귀무가설이라는 중요한 개념이다. 귀무가설은 세계에 관한 기본적인 믿음의 일종이다. 귀무가설이 참이라고 가정했을 때 극단적인 결과가 실제로 나올 확률을 P값 p-value 라고 한다. 일반적으로 p 값이 5퍼센트 미만이면 귀무가설을 기각하는 데 충분한 기준으로 간주한다.
- 귀무가설, p값, 통계적 유믜미성, 신뢰구간 모두 이 세상에서 정보에 입각한 결정을 내리는 데 필요한 방법이다. 회귀라는 기법을 통해 데이터 점들 사이를 지나는 직선을 그려 몇 가지 통계적 질문을 시각적으로 생각해볼수 있다.
- 확률을 올바르게 이해하고 중요한 문제에 대한 통찰을 얻는 방법
- 여러가지 중요한 문제를 종속사건들의 차원에서 조건부확률이라는 기법을 적용해 이해할 수 있다. 틀린 예측이라고 해도 예측의 방향성에 따라 서로 다른 결과가 나타난다는 생각을 정량화한 손실의 개념을 이용해, 베이즈정리가 적용되는 상황에서 추론하고 결정하는 법을 살펴봤다.
- 확률의 또 다른 관점
- 확률을 도박꾼 승산의 관점에서 생각하며 사건의 발생 가능성을 새롭게 통찰 했다. 튜링이 블레츨리파크에서 한 연구와 의료 검사에서 거짓양성을 둘러싼 문제를 새롭게 이해했다. 게다가 승산을 확률로 변환하는 기법과 지수적 증가의 개념을 결합하면 직선 그래프로 나타낼 수 있고, 이를 바탕으로 변종 바이러스의 확산 양상을 예측할 수 있다.
- 수학자 클로드 섀넌
- 정말 독립적으로 사고하는 사람들, 충분히 높은 비율로 적절한 전문 지식과 올바른 통찰을 제시하는 사람들을 찾는다면, 기금까지 다늘 사람들에게서 접하지 못했던 다양한 의견과 관점을 접할 가능성이 높다. 이런 관점들을 자세히 살펴보면 어떤 판단을 해야 하는 상황에서누구의 견해를 적용하는 것이 좋을지 스스로 결정할 수 있다. 수학적 언어를 알면 나와 의견이 같은 사람들의 이야기만 듣게 되는 필터 버블의 위험성을 간파할 수 있다. 대중의 지혜라는 원리에 따르면, 여러 개의 합리적 추측을 평균하면 미지의 양을 올바르게 추정할 수 있다.
- 섀넌의 엔트로피와 그 단위인 비트는 정보의 화폐이자 오늘날 우리가 살아가는 방식이라고 해도 과언이 아니다. 섀넌 덕분에 데이터압축, 소음이 있는 상황에서의 통신 같은 문제의 근본적 한계를 이해하며 다양한 정보원 사이의 중첩과 중복을 정량화할 수 있다. 본래 섀넌이 구리 전화선 통신을 위해 도입한 개념들은 그 뒤로도 더 발전해 현대의 질병 집단검사, 필터 버블, 도박 전략 등 다양한 상황에 대한 깊은 통찰을 더한다.
- 연결 네트워크에서 소문과 바이러스 퍼지는지 설명
- 전반적으로 단순한 독립사건을 넘어서 무작위성을 이해하는 것은 매우 중요하다. 그다음으로 현재 위치에 관한 정보에 따른 변화들을 살펴봤다. 이런 현상들로는 랜덤워크와 브라운 운동이 있다. 또한 네트워크에서의 랜덤워크에 관한 모델도 포함된다. 이 마르코프 연쇄들 덕분에 주가의 움직임, 일일 전염병 수치, 대기행렬은 물론이고 비유적으로든 실제로든 네트워크에서 일어나는 바이럴 현상도 잘 이해할 수 있다.
- 이런 개념들을 더 깊게 살펴보고 싶다면 다음번에 우체국이나 이케아에 갈 때 대기행렬을 관찰해보라. 또한 주식차트를 살피며 어느 주식이 브라운운동 모델에 따라 변동하는지 알아보라.
- 무작위성과 소음에 관한 사안
- 서로 출처가 다른 데이터끼리 섣불리 비교하기 어려운 문제들이 있다. 심지어 한 나라의 일일 코로나바이러스 확진자 수 같은 단일한 데이터에도, 새로운 정의나 기준을 채택하는 바람에 단기적인 요일 효과나 일시적 변화가 나타날 수 있다. 비교와 측정은 자칫 그릇된 결과로 이어질 수 있기 때문에 신중하게 접근해야 한다.
- 게임이론
- 우리는 어느 한 선택이 다른 선택보다 근본적으로 더 나으며 그 선택을 해야 불이익이 없다고 상정한다. 하지만 폰 노이만에 따르면 너무 확정적이지 않게 계속 열린 상태로 선택하는 것이 최상의 전략이다.
- 상대방이 어떻게 행동하든 이득에 영향을 주지 않도록 만드는 혼합전략을 찾아야 한다. 이는 내시균형의 한 예다. 내시균형에 이른 상황에서 모든 참가자는 전략을 바꿀만한 동기가 없다.
- 비슷한 개념을 바탕으로 일상 문제들을 해결하는 데 도움을 주고, 인생에서 균형 잡힌 접근법이 소중하다는 점을 알려주는 단순한 모델을 생각해보자. 실제로 참가자가 한명이기 때문에 원한다면 다른 참가자 (자연 또는 세계의 상태)가 이미 자신의 전략을 고정했다고 생각할 수 있다.
- 게임이론이 핵전쟁과 고전적인 죄수의 딜레마 등 다양한 상황에서 경쟁적 상호작용을 어떻게 설명해내는지 설명했다. 정보와 이득, 특히 제로섬 게임의 상황을 생각해봄으로써 혼합전약의 개념을 체계적으로 살폈다. 미니 맥스 전략에서 봤듯이 상대방이 전략 자체에 관한 정보를 가졌다는 사실 자체를 무효화시킬 수도 있다. 또한 혼합전략에서 알 수 있듯이 현실 문제들에 대해 균형잡힌 대응을 하는 것이 중요하다.
- 복잡한 상황을 다룰 때 겸손 (오류를 피할 방법 몇 가지 제안)
- 가정을 살펴라.
- 여러분이 세운 가정과 그 가정을 바탕으로 한 예측이 맞는지 항상 의심해야 한다. 여러분의 주장에서 가장 약한 부분은 무엇인가? 가장 강력한 반론은 무엇인가? 이 두 질문에 답할 수 없다면 여러분은 자기 주장의 엄밀성에 대해 스스로를 속이는 것이다.
- 우리 모두 어떤 문제에 대해 판단할 때 개인적 상황(가족이 처한 위험수준, 고용 상태에 따라 달라지는 경제적 취약성, 서로 다른 정신적-신체적 건강상태)에 영향을 받는다. 적어도 자신의 상황을 이해함으로써, 자신이 전체 인구에서 얼마만큼 대표성이 있는지, 전체 공통체의 다양한 요구에 대해 어떻게 균형을 잡을지 스스로 질문해야 한다.
- 세상은 혼란스러운 곳이다.
- 예측 모델들에는 늘 불확실성이 따르며, 몇가지 요인들만으로 전체 상황을 파악하려는 분석은 너무나 단순한 발상이라는 점을 꼭 유념해야 한다.
- 과거를 너무 중시하지 마라.
- 과거의 경험을 고려하는 것은 타당하지만, 과적합하지 않도록 신중해야 하며 이번에는 상황이 다르지 않은지 고려해야 한다.
- 데이터를 입맛대로 고르면 안 된다.
- 일반적으로 서로 다른 IFR 추산치들은 메타분석 meta-analysis 이라는 기법을 통해 종합되며, 이때 여러 논문의 연구결과를 함께 살펴 하나의 추산치를 발표한다. 이것은 조잡한 평균내기 (예를 들어 표본의 크기로 나누기)가 아니라, 개별 논문을 별도로 평가한 다음 전체 계산 과정에서 가중치를 다르게 부여한느 더욱 정교한 과정을 거친 결과다. 이 메타분석도 완벽하지는 않다. 평가와 가중치 부여 과정이 조금은 주관적이기 때문이다.
- 모델은 한계가 있다.
- 모호하고 진부하게 들리겠지만 어떤 모델이든 한계가 있다. 이 한계를 고려한는 태도가 중요하다.
- 집단사고의 함정을 주의하라.
- 새로운 이론을 제시하는 사람들은 기존의 논의를 신중한 태도로 존중해야 한다. 마찬가지로 다른 분야에 있다가 새로운 분야에 진출하는 과학자들은 해당 분야에 오래 몸담은 사람들의 지혜를 경청해야 한다. 새로운 개념이 발표됐을 때 아무리 터무니 없어 보여도 일단 들어보고 검증할 기회를 주는 것이 과학계의 건전한 발전에 중요하다.
- 모든 것이 바라는 대로 되지는 않는다.
- 멋있어 보이는 이론를 아무리 많이 고안해도 현실세계에 장기간 노출되면 살아남지 못할 수 있기 때문에, 멋진 이론이라고 해서 진리를 결정하는 충분한 근거가 되진 못한다.
- 이 이론으로 무엇을 예측할 수 있는가? 제대로 된 과학 이론이라면 미래에 얻게 될 데이터로 검증할 수 있는 답을 내놓는다. 어떻 이론이 데이터와 합치하지 않는다면 그 이론은 참이 아니다.
- 실수를 인정하라.
- 자신의 실수에 대응하는 방식은 중요하다. 두 번 연속으로 분석이 틀리거나 애초에 자신이 틀렸다는 사실을 어물쩍 부정하는 것은 매우 쓸데 없는 대응이다. 순순히 잘못을 인정하고 왜 그런 일이 생겼는지 깊이 성찰해 앞으로 나아가야한다.
- 균형잡힌 시각을 가져라
- 어떤 데이터를 사람들에게 알릴 때는 그 데이터의 뉘앙스와 불확실성을 강조하는 것이 중요하다. 추가 데이터가 나올 때까지는 중용의 원리를 따르면 편향되게 방응하지 않을 수 있다. 추정할 때도 중도주의와 중용이 필요하다.
- 수학은 올바른 도구다.
- 함수가 어떻게 증가하는지, 무작위성과 불확실성이 어떤 역활을 하는지, 정보이론이 필터 버블과 상관관계에 있는 정보에 관해 무엇을 알려주는지. 어떤 질문이든 수학적 기법들이야말로 감정과 개인적 편향에서 벗어난 방식으로 통찰을 준다. 구조, 무작위성, 정보의 핵심 도구들은 여러분의 사고과정에 위력적인 도구를 제공한다.
- 가정을 살펴라.
728x90
반응형