스티븐 스티글러, 통계학을 떠받치는 일곱 기둥 이야기, 2017. 서평은 아니고 메모.
1. 책 소개에 “이 책은 통계에 관심이 있는 사람이나 전문적으로 통계를 다루는 사람 모두에게 매력적인 도서로…” 라고 쓰여 있다. 아니다. 기초 통계학을 모르면 읽을 수 없다. 모르는 사람이 읽으면 불친절한 저자를 욕하며 책을 덮게 될 거다. 제목만 보면 일곱 기둥을 설명한 뒤 그걸로 통계학이라는 집을 지어 줄 것 같은데 그렇지 않다. 말하자면 이런 느낌이다. “너 통계학이란 집에 살지? 니네 집 기둥 7개가 요렇게 만들어졌고 조렇게 집을 지탱하고 있음 ㅋ” 일단 그 집에 살아야 한다는 얘기. 문면만 파악하려 해도 조건기대(분포)의 성질과 최소자승추정법, 베이즈 추론의 기본을 알아야 한다.
2. 배경지식을 알면 대단히 재미있다. 현재 배우는 깔끔한 이론이 형성된 과정과 그 과정을 주도한 거인들을 만날 수 있다. 개념을 알기 위해 반드시 개념의 형성사에 달통할 필요는 없다. 하지만 형성사를 통해 이해가 깊어지는 것도 사실이다. 동 저자가 쓴 『통계학의 역사』가 두꺼워서 부담스럽다면 이 책만 읽어도 많은 것을 얻을 수 있을 듯.
가령 회귀분석의 경우를 보자. 회귀regress가 골턴Galton의 “평균으로의 회귀”에서 비롯되었다는 사실은 알고 있었다. 내가 본 교과서 대부분은 저 사실을 언급했다. 간단히만 언급했다는 게 문제다. 그래서 어쨌다는 것인가? 이 책은 골턴의 선구적 연구를 인상적으로 소개하고 있다. 내 수준이 그렇고 그렇다는 걸 감안하면 더 알수록 더 재미있지 않을까.
2-1. 골턴도 골턴이지만 2-3장 “정보 측정”, “가능도”가 가장 인상적이었다. 계량경제학 베이스로 통계학을 공부해선지 2-3장은 주제부터 익숙하지 않다. (1, 4-7장은 그나마 낫다) 당장 최우추정법 배울 때 피셔 정보행렬Fisher Information Matrix이 나오자 모 교수님은 말씀하셨다. “이름이 왜 ‘정보행렬’인지 묻지 마라. 비생산적이다.” 이게 궁금한 경제학도는 이 책을 보면 된다. 엄연히 의미가 있다.
3. 번역을 지적하지 않을 수 없다. 직역을 넘어 번역기 수준 문장은 그렇다 치자. 역자가 전산통계 전공이라 해서 기대했는데 솔직히 책을 100% 이해했는지 의문이다. 뒤로 갈수록 의혹이 짙어진다.
가령 제5장 “회귀”에 Stein’s Paradox가 나온다. 원저자 설명이 대단히 압축적이긴 하지만 통계 전공자라면 이해할 수 있는 수준이다(나도 아니까). 그런데 역서로는 도무지 내용을 이해할 수가 없다. 당장 수식 하첨자 틀리는 건 차치하더라도, 내용을 이해했다면 나올 수 없는 번역이다. 아는 내용도 더 헷갈리게 하는 마법같은 번역. 어찌어찌 읽다가 여기서 결국 원서를 펼치고 말았다. 경제사상사 명저 <죽은 경제학자의 살아있는 아이디어>의 섬세한 번역이 떠오르며 아쉬움이 더했다. 사실 책 소개 첫 문장부터 알아봤어야 한다. “통계학에 과학으로서의 독특함을 부여하는 것은 무엇일까?” 김훈 문장력 바라는 게 아닌데…ㅠㅠ
* 자세히 짚는다. 스티글러 교수는 Stein’s Paradox를 다룰 때 어김없이 나오는 “naive estimator” (혹은 “obvious estimator”)를 말로 풀어 설명한다. “At the time, it was taken as too obvious to require proof that one should estimate each μi by the corresponding Xi.” (여기서 Xi ~ N(μi, 1). i= 1, .. k, 각 Xi는 독립.) 이 문장이 이렇게 번역되었다. “당시에는 해당 X에 따라 각 mu를 추정해야 하는 것을 너무 당연히 여겨 증명이 필요 없었다.”
나라면 이렇게 번역한다. “당시에는 μi의 추정량으로 그에 대응하는 Xi 값을 사용해야 한다는 생각이 증명이 불필요할 정도로 당연하게 여겨졌다.” 더 나은 문장을 찾을 수야 있겠으나, 핵심은 μi hat = Xi 라는 등식을 독자에게 전달하는 것이다. 내용을 안다면 이렇게 옮겨야 한다. 그래야 이 뒷 문단을 이해할 수 있다. 따라서 역자가 “the corresponding Xi“를, 나아가 앞뒤 내용 전체를 이해하고 번역했다고 생각하기 어렵다. 이런 문제가 한둘이 아니다.