본문 바로가기
수학자 이야기

근대 통계학의 창시자, 영국 수학자 칼 피어슨(1857~1936)

by buchoe81 2025. 11. 8.

1. 생애와 학문적 배경

  칼 피어슨은 1857년 3월 27일 영국 런던에서 태어났다. 그의 가문은 학문적·사회적으로 매우 영향력 있는 중산층 가정으로, 교육적 환경이 잘 갖춰져 있었다. 그는 어린 시절부터 수학적 재능을 보였으며, 케임브리지 대학교의 킹스 칼리지(King’s College)에서 수학을 전공했다. 당시 그의 수학 실력은 탁월했으며, 졸업 후 수학자로서의 길뿐만 아니라 철학과 역사, 문학에도 깊은 관심을 보였다.

  학부를 마친 뒤, 그는 독일로 유학을 떠나 괴팅겐과 하이델베르크에서 공부하며 칸트 철학, 독일 관념론, 그리고 수학적 자연철학에 심취했다. 이러한 경험은 이후 그의 학문적 태도에 큰 영향을 주었다. 그는 순수 수학의 논리적 정밀함을 사랑했지만, 동시에 수학을 인간과 자연 현상을 이해하는 언어로 확장하려는 철학적 열정을 품고 있었다.

  1880년대 초반 그는 법학과 철학에도 도전했고, 심지어 문학 작품을 집필하기도 했다. 그러나 결국 그는 자연과학으로 돌아와, 과학적 연구의 핵심 도구로서 수학과 통계를 결합하려는 작업에 몰두했다. 그의 학문적 궤적은 매우 다채로웠지만, 일관된 목표는 하나였다.

“자연은 수량적으로 설명되어야 하며, 수학은 그 언어다.”


2. 갈턴과의 만남: 통계학의 문을 열다

  피어슨의 통계학 인생에서 결정적인 계기는 **프랜시스 갈턴(Francis Galton)**과의 만남이었다. 갈턴은 다윈의 사촌으로, 유전과 인간 능력의 통계적 분석에 관심을 두었던 인물이다. 그는 ‘상관관계(correlation)’와 ‘회귀(regression)’의 개념을 처음으로 제안했으나, 수학적으로 정교하게 다듬지는 못했다. 피어슨은 갈턴의 아이디어에 수학적 엄밀함을 부여하며 통계학을 독립된 과학으로 끌어올린 인물이라 할 수 있다.

  갈턴은 피어슨에게 “생물학적 변이의 수학적 법칙을 밝혀라”라는 문제를 던졌고, 피어슨은 이를 해결하기 위해 확률분포의 수학적 구조, 데이터의 통계적 비교, 우연의 법칙을 연구하기 시작했다. 그 결과 피어슨은 1890년대 후반에 통계학의 기초 체계를 거의 혼자서 세웠습니다. 이는 이후 **‘수리통계학(mathematical statistics)’**이라는 학문으로 발전하게 된다.


3. 피어슨의 주요 업적

(1) 피어슨 상관계수 (Pearson Correlation Coefficient)

  오늘날 통계학에서 가장 널리 사용되는 개념 중 하나가 바로 **피어슨 상관계수(r)**이다. 이는 두 변수 사이의 선형적 관계의 강도를 수치로 표현한 것으로, -1에서 +1 사이의 값을 가진다. 피어슨은 이 공식을 통해 “두 변수의 관계를 직관이 아닌 수학으로 측정할 수 있다”는 사실을 명확히 했다.

  이 개념은 심리학, 경제학, 교육학, 사회과학 등 거의 모든 학문 분야에서 사용되며, ‘데이터 간의 관계를 객관적으로 파악하는 기본 도구’로 자리 잡았다.


(2) 카이제곱 검정 (Chi-Square Test)

  1890년대 후반 피어슨은 데이터의 관측값과 기대값의 차이를 검정하는 방법을 제안했다. 이것이 바로 **카이제곱 검정(χ² test)**이다. 이 방법은 관측된 빈도와 기대된 빈도 간의 차이를 측정하여, 두 집단 간의 통계적 차이가 우연에 의한 것인지 아닌지를 판정할 수 있게 한다.

이는 생물학의 유전비율 검정, 사회학의 여론조사 분석, 품질관리 등 수많은 분야에서 핵심적 도구로 사용되고 있다. 이 검정법은 후에 피셔(R. A. Fisher)에 의해 더 정교화되며 현대 통계학의 표준이 되었다.


(3) 피어슨 분포 체계 (Pearson Distribution System)

  피어슨은 자연현상에서 나타나는 데이터가 단순히 정규분포(Normal distribution)로 설명되지 않는다는 점을 깨달았다. 그는 다양한 형태의 비대칭적 분포를 설명하기 위해 **피어슨 분포군(Pearson family of distributions)**을 제시했다.

  그는 미분방정식을 사용하여 여러 확률분포를 체계적으로 분류했으며, 이는 오늘날에도 비정규 데이터 분석에 응용되고 있다. 피어슨의 분포 체계는 실제 현상—예를 들어 생물학적 측정치, 사회적 변수, 경제 데이터—를 보다 현실적으로 표현하는 강력한 틀을 제공했다.


(4) 회귀분석 이론의 수학적 정립

  갈턴이 ‘회귀(regression)’라는 개념을 제안했을 때, 그것은 단순한 경험적 관찰이었다. 그러나 피어슨은 이를 선형 방정식의 형태로 표현하여, 예측과 추정의 수학적 도구로 발전시켰다. 오늘날의 회귀분석(regression analysis)은 피어슨이 마련한 수학적 기초 위에 세워졌다고 해도 과언이 아니다.

  그는 또한 **공분산(covariance)**의 개념을 체계화하며, 다변량 통계학(multivariate statistics)의 출발점을 마련했다.


(5) 통계적 사고의 철학화

  피어슨은 단순히 기술적 도구를 만든 사람에 그치지 않았다. 그는 **“통계는 과학의 언어다”**라는 신념을 갖고, 모든 과학적 탐구가 확률적 사고 위에서 이루어져야 한다고 주장했다. 그의 대표 저서 《The Grammar of Science》(1892)는 과학철학의 고전으로 꼽힌다.

  그는 이 책에서 다음과 같이 말했다.

“우리가 관찰하는 세계는 본질적으로 불확실하다. 과학의 목적은 ‘진리’를 찾는 것이 아니라, 불확실성을 수량화하여 예측 가능성을 높이는 것이다.”

 

  이러한 관점은 현대 과학철학자 칼 포퍼(Karl Popper)나 토머스 쿤(Thomas Kuhn)보다 한 세대 앞서 과학의 상대성과 경험적 한계를 인식한 선구적 사유였다.


4. 사회적 활동과 유전학 논쟁

  피어슨은 단순한 학자가 아니라 사회적 개혁에도 적극적인 인물이었다. 그는 진화론과 통계학을 결합하여 인간사회를 분석하려는 ‘생물통계학(biometry)’ 운동을 주도했다. 그러나 여기에는 오늘날 논란이 되는 **우생학(eugenics)**적 관점도 섞여 있었다.

  그는 갈턴과 함께 인간의 지능과 능력이 유전된다고 믿었고, 사회의 진보를 위해 “통계적으로 우수한 유전자”를 보호해야 한다고 주장했다. 이러한 사상은 당시 과학자들 사이에서 광범위하게 수용되었지만, 오늘날에는 인종차별적 편견과 과학적 오용의 근원으로 비판받고 있다.

  그럼에도 불구하고 피어슨의 의도는 사회적 통계를 이용해 정책과 복지를 과학적으로 설계하려는 시도였다는 점에서 일정 부분 긍정적으로 평가되기도 한다.


5. 런던대 통계학과의 창설

  1901년 피어슨은 런던 대학교에 **세계 최초의 통계학과(Department of Applied Statistics)**를 설립했다. 이는 인류 역사상 처음으로 ‘통계학’을 독립 학문으로 인정한 사례였다. 그는 이곳에서 **《Biometrika》**라는 학술지를 창간하여, 수리통계학 연구의 중심지가 되게 했다.

  그의 제자들 중에는 이후 통계학을 완성시킨 인물들이 많았다.

  • R. A. 피셔(Fisher): 현대 통계추론의 창시자
  • E. S. 피어슨(Egon Pearson): 그의 아들로, Neyman–Pearson 가설검정 이론의 공동 창안자

  즉, 칼 피어슨 → 피셔 → 네이먼–피어슨으로 이어지는 흐름이 오늘날의 통계이론의 주류를 형성하게 된다.


6. 철학적 신념과 과학관

  피어슨은 **“실증주의(Positivism)”**적 세계관을 확고히 믿었다. 그는 과학의 목적을 ‘사실의 기록’이 아니라 ‘패턴의 탐지’로 보았다.
  그에게 과학이란 진리를 드러내는 것이 아니라, **“예측 가능한 규칙성의 수학적 구조를 발견하는 행위”**였다.

그는 다음과 같은 주장을 남겼다.

“우리가 알고 있는 세계는 오직 관찰 가능한 현상의 세계이다. 보이지 않는 실체를 가정하는 순간, 과학은 철학이 된다.”

 

  이러한 사유는 후대의 통계적 모델링과 베이즈 추론에도 영향을 주었으며, 데이터 과학이 단순한 계산이 아니라 ‘지식의 구조화 과정’임을 인식하게 한 초석이 되었다.


7. 피어슨의 유산과 비판

  피어슨은 1936년 4월 27일 세상을 떠났지만, 그의 영향력은 이후 수십 년간 계속되었다. 오늘날 거의 모든 과학 분야에서 그의 이름이 들어간 개념을 사용한다. 그러나 그의 사상에는 두 가지 상반된 평가가 존재한다.

긍정적 평가

  • 통계학을 독립된 학문으로 세운 개척자
  • 수리적 엄밀성과 실증적 데이터 해석의 결합
  • 현대 과학철학의 기초를 제시한 선구자

부정적 평가

  • 우생학적 신념으로 인한 사회적 논란
  • 인간의 가치를 통계적 수치로 환원한 위험한 사고
  • 피셔 등과의 학문적 갈등에서 보인 권위적 태도

  하지만 학문적 공헌만 놓고 보면, 피어슨은 과학의 언어를 수학에서 통계로 확장시킨 인물, 즉 ‘데이터 중심 과학의 창시자’라 불러도 손색이 없다.


8. 피어슨의 사상적 의미

  그의 연구는 단순한 계산이 아니라 **‘불확실성의 수학화(Mathematization of Uncertainty)’**라는 새로운 사고의 혁명이었다. 그 이전까지 과학은 확정적 진리를 추구했지만, 피어슨은 불확실성 자체를 다루는 법을 과학으로 승화시켰다. 이 발상은 현대의 기계학습, 인공지능, 데이터 마이닝, 예측 분석 등 모든 데이터 기반 학문에 뿌리를 내렸다.

  피어슨은 또한 “수학적 모델은 현실의 완벽한 재현이 아니라, 현실을 설명하기 위한 도구적 허구”라고 봤다. 이 생각은 오늘날의 통계적 모델링 철학과 정확히 일치한다.


9. 결론: 통계로 세계를 읽은 철학자

  칼 피어슨은 단순히 통계 공식을 만든 사람이 아니라, **“세계는 수학적으로 불완전하지만 통계적으로 해석 가능하다”**는 믿음을 확립한 철학적 사상가였다. 그는 과학과 철학, 수학과 사회 사이의 경계를 허물고, 인간이 불확실한 세계를 이해할 수 있는 새로운 도구를 제공했다.

  그의 삶은 하나의 문장으로 요약할 수 있다.

“우리가 진리를 완전히 알 수는 없지만, 그 진리에 얼마나 가까운지를 측정할 수 있다.”

 

  이 사유야말로 통계학의 본질이며, 피어슨의 진정한 유산이. 생애와 학문적 배경

  칼 피어슨은 1857년 3월 27일 영국 런던에서 태어났다. 그의 가문은 학문적·사회적으로 매우 영향력 있는 중산층 가정으로, 교육적 환경이 잘 갖춰져 있었다. 그는 어린 시절부터 수학적 재능을 보였으며, 케임브리지 대학교의 킹스 칼리지(King’s College)에서 수학을 전공했다. 당시 그의 수학 실력은 탁월했으며, 졸업 후 수학자로서의 길뿐만 아니라 철학과 역사, 문학에도 깊은 관심을 보였다.

 

  학부를 마친 뒤, 그는 독일로 유학을 떠나 괴팅겐과 하이델베르크에서 공부하며 칸트 철학, 독일 관념론, 그리고 수학적 자연철학에 심취했다. 이러한 경험은 이후 그의 학문적 태도에 큰 영향을 주었다. 그는 순수 수학의 논리적 정밀함을 사랑했지만, 동시에 수학을 인간과 자연 현상을 이해하는 언어로 확장하려는 철학적 열정을 품고 있었다.

 

  1880년대 초반 그는 법학과 철학에도 도전했고, 심지어 문학 작품을 집필하기도 했다. 그러나 결국 그는 자연과학으로 돌아와, 과학적 연구의 핵심 도구로서 수학과 통계를 결합하려는 작업에 몰두했다. 그의 학문적 궤적은 매우 다채로웠지만, 일관된 목표는 하나였다.

 

“자연은 수량적으로 설명되어야 하며, 수학은 그 언어다.”

 

2. 갈턴과의 만남: 통계학의 문을 열다

  피어슨의 통계학 인생에서 결정적인 계기는 **프랜시스 갈턴(Francis Galton)**과의 만남이었다. 갈턴은 다윈의 사촌으로, 유전과 인간 능력의 통계적 분석에 관심을 두었던 인물이다. 그는 ‘상관관계(correlation)’와 ‘회귀(regression)’의 개념을 처음으로 제안했으나, 수학적으로 정교하게 다듬지는 못했다. 피어슨은 갈턴의 아이디어에 수학적 엄밀함을 부여하며 통계학을 독립된 과학으로 끌어올린 인물이라 할 수 있다.

 

  갈턴은 피어슨에게 “생물학적 변이의 수학적 법칙을 밝혀라”라는 문제를 던졌고, 피어슨은 이를 해결하기 위해 확률분포의 수학적 구조, 데이터의 통계적 비교, 우연의 법칙을 연구하기 시작했다. 그 결과 피어슨은 1890년대 후반에 통계학의 기초 체계를 거의 혼자서 세웠습니다. 이는 이후 **‘수리통계학(mathematical statistics)’**이라는 학문으로 발전하게 된다.

 

3. 피어슨의 주요 업적

(1) 피어슨 상관계수 (Pearson Correlation Coefficient)

  오늘날 통계학에서 가장 널리 사용되는 개념 중 하나가 바로 **피어슨 상관계수(r)**이다. 이는 두 변수 사이의 선형적 관계의 강도를 수치로 표현한 것으로, -1에서 +1 사이의 값을 가진다. 피어슨은 이 공식을 통해 “두 변수의 관계를 직관이 아닌 수학으로 측정할 수 있다”는 사실을 명확히 했다.

 

  이 개념은 심리학, 경제학, 교육학, 사회과학 등 거의 모든 학문 분야에서 사용되며, ‘데이터 간의 관계를 객관적으로 파악하는 기본 도구’로 자리 잡았다.

 

(2) 카이제곱 검정 (Chi-Square Test)

  1890년대 후반 피어슨은 데이터의 관측값과 기대값의 차이를 검정하는 방법을 제안했다. 이것이 바로 **카이제곱 검정(χ² test)**이다. 이 방법은 관측된 빈도와 기대된 빈도 간의 차이를 측정하여, 두 집단 간의 통계적 차이가 우연에 의한 것인지 아닌지를 판정할 수 있게 한다.

 

이는 생물학의 유전비율 검정, 사회학의 여론조사 분석, 품질관리 등 수많은 분야에서 핵심적 도구로 사용되고 있다. 이 검정법은 후에 피셔(R. A. Fisher)에 의해 더 정교화되며 현대 통계학의 표준이 되었다.

 

(3) 피어슨 분포 체계 (Pearson Distribution System)

  피어슨은 자연현상에서 나타나는 데이터가 단순히 정규분포(Normal distribution)로 설명되지 않는다는 점을 깨달았다. 그는 다양한 형태의 비대칭적 분포를 설명하기 위해 **피어슨 분포군(Pearson family of distributions)**을 제시했다.

 

  그는 미분방정식을 사용하여 여러 확률분포를 체계적으로 분류했으며, 이는 오늘날에도 비정규 데이터 분석에 응용되고 있다. 피어슨의 분포 체계는 실제 현상—예를 들어 생물학적 측정치, 사회적 변수, 경제 데이터—를 보다 현실적으로 표현하는 강력한 틀을 제공했다.

 

(4) 회귀분석 이론의 수학적 정립

  갈턴이 ‘회귀(regression)’라는 개념을 제안했을 때, 그것은 단순한 경험적 관찰이었다. 그러나 피어슨은 이를 선형 방정식의 형태로 표현하여, 예측과 추정의 수학적 도구로 발전시켰다. 오늘날의 회귀분석(regression analysis)은 피어슨이 마련한 수학적 기초 위에 세워졌다고 해도 과언이 아니다.

 

  그는 또한 **공분산(covariance)**의 개념을 체계화하며, 다변량 통계학(multivariate statistics)의 출발점을 마련했다.

 

(5) 통계적 사고의 철학화

  피어슨은 단순히 기술적 도구를 만든 사람에 그치지 않았다. 그는 **“통계는 과학의 언어다”**라는 신념을 갖고, 모든 과학적 탐구가 확률적 사고 위에서 이루어져야 한다고 주장했다. 그의 대표 저서 《The Grammar of Science》(1892)는 과학철학의 고전으로 꼽힌다.

 

  그는 이 책에서 다음과 같이 말했다.

 

“우리가 관찰하는 세계는 본질적으로 불확실하다. 과학의 목적은 ‘진리’를 찾는 것이 아니라, 불확실성을 수량화하여 예측 가능성을 높이는 것이다.”

 

 

 

  이러한 관점은 현대 과학철학자 칼 포퍼(Karl Popper)나 토머스 쿤(Thomas Kuhn)보다 한 세대 앞서 과학의 상대성과 경험적 한계를 인식한 선구적 사유였다.

 

4. 사회적 활동과 유전학 논쟁

  피어슨은 단순한 학자가 아니라 사회적 개혁에도 적극적인 인물이었다. 그는 진화론과 통계학을 결합하여 인간사회를 분석하려는 ‘생물통계학(biometry)’ 운동을 주도했다. 그러나 여기에는 오늘날 논란이 되는 **우생학(eugenics)**적 관점도 섞여 있었다.

 

  그는 갈턴과 함께 인간의 지능과 능력이 유전된다고 믿었고, 사회의 진보를 위해 “통계적으로 우수한 유전자”를 보호해야 한다고 주장했다. 이러한 사상은 당시 과학자들 사이에서 광범위하게 수용되었지만, 오늘날에는 인종차별적 편견과 과학적 오용의 근원으로 비판받고 있다.

 

  그럼에도 불구하고 피어슨의 의도는 사회적 통계를 이용해 정책과 복지를 과학적으로 설계하려는 시도였다는 점에서 일정 부분 긍정적으로 평가되기도 한다.

 

5. 런던대 통계학과의 창설

  1901년 피어슨은 런던 대학교에 **세계 최초의 통계학과(Department of Applied Statistics)**를 설립했다. 이는 인류 역사상 처음으로 ‘통계학’을 독립 학문으로 인정한 사례였다. 그는 이곳에서 **《Biometrika》**라는 학술지를 창간하여, 수리통계학 연구의 중심지가 되게 했다.

 

  그의 제자들 중에는 이후 통계학을 완성시킨 인물들이 많았다.

 

R. A. 피셔(Fisher): 현대 통계추론의 창시자

E. S. 피어슨(Egon Pearson): 그의 아들로, Neyman–Pearson 가설검정 이론의 공동 창안자

  즉, 칼 피어슨 → 피셔 → 네이먼–피어슨으로 이어지는 흐름이 오늘날의 통계이론의 주류를 형성하게 된다.

 

6. 철학적 신념과 과학관

  피어슨은 **“실증주의(Positivism)”**적 세계관을 확고히 믿었다. 그는 과학의 목적을 ‘사실의 기록’이 아니라 ‘패턴의 탐지’로 보았다.

  그에게 과학이란 진리를 드러내는 것이 아니라, **“예측 가능한 규칙성의 수학적 구조를 발견하는 행위”**였다.

 

그는 다음과 같은 주장을 남겼다.

 

“우리가 알고 있는 세계는 오직 관찰 가능한 현상의 세계이다. 보이지 않는 실체를 가정하는 순간, 과학은 철학이 된다.”

 

 

 

  이러한 사유는 후대의 통계적 모델링과 베이즈 추론에도 영향을 주었으며, 데이터 과학이 단순한 계산이 아니라 ‘지식의 구조화 과정’임을 인식하게 한 초석이 되었다.

 

7. 피어슨의 유산과 비판

  피어슨은 1936년 4월 27일 세상을 떠났지만, 그의 영향력은 이후 수십 년간 계속되었다. 오늘날 거의 모든 과학 분야에서 그의 이름이 들어간 개념을 사용한다. 그러나 그의 사상에는 두 가지 상반된 평가가 존재한다.

 

긍정적 평가

통계학을 독립된 학문으로 세운 개척자

수리적 엄밀성과 실증적 데이터 해석의 결합

현대 과학철학의 기초를 제시한 선구자

부정적 평가

우생학적 신념으로 인한 사회적 논란

인간의 가치를 통계적 수치로 환원한 위험한 사고

피셔 등과의 학문적 갈등에서 보인 권위적 태도

  하지만 학문적 공헌만 놓고 보면, 피어슨은 과학의 언어를 수학에서 통계로 확장시킨 인물, 즉 ‘데이터 중심 과학의 창시자’라 불러도 손색이 없다.

 

8. 피어슨의 사상적 의미

  그의 연구는 단순한 계산이 아니라 **‘불확실성의 수학화(Mathematization of Uncertainty)’**라는 새로운 사고의 혁명이었다. 그 이전까지 과학은 확정적 진리를 추구했지만, 피어슨은 불확실성 자체를 다루는 법을 과학으로 승화시켰다. 이 발상은 현대의 기계학습, 인공지능, 데이터 마이닝, 예측 분석 등 모든 데이터 기반 학문에 뿌리를 내렸다.

 

  피어슨은 또한 “수학적 모델은 현실의 완벽한 재현이 아니라, 현실을 설명하기 위한 도구적 허구”라고 봤다. 이 생각은 오늘날의 통계적 모델링 철학과 정확히 일치한다.

 

9. 결론: 통계로 세계를 읽은 철학자

  칼 피어슨은 단순히 통계 공식을 만든 사람이 아니라, **“세계는 수학적으로 불완전하지만 통계적으로 해석 가능하다”**는 믿음을 확립한 철학적 사상가였다. 그는 과학과 철학, 수학과 사회 사이의 경계를 허물고, 인간이 불확실한 세계를 이해할 수 있는 새로운 도구를 제공했다.

 

  그의 삶은 하나의 문장으로 요약할 수 있다.

 

“우리가 진리를 완전히 알 수는 없지만, 그 진리에 얼마나 가까운지를 측정할 수 있다.”

 

 

 

  이 사유야말로 통계학의 본질이며, 피어슨의 진정한 유산이다.