확률

해석학·미적분학 Analysis · Calculus
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px"	<colbgcolor=#26455A>실수와 복소수		실수(실직선 · 아르키메데스 성질) · 복소수(복소평면 · 극형식 · 편각) · 근방 · 유계 · 콤팩트성 · 완비성
함수		함수 · 조각적 정의 · 항등함수 · 역함수 · 멱함수 · 다변수함수(동차함수 · 음함수) · 다가 함수 · 함수의 그래프 · 좌표계 · 닮은꼴 함수 · 극값 · 볼록/오목 · 증감표
함수		초등함수(대수함수 · 초월함수 · 로그함수 · 지수함수 · 삼각함수) · 특수함수 · 범함수(변분법 · 오일러 방정식) · 병리적 함수
극한·연속		함수의 극한 · 수열의 극한 · 연속함수 · ε-δ 논법 · 수렴(균등수렴) · 발산 · 부정형 · 점근선 · 무한대 · 무한소 · 특이점 · 0.999…=1
극한·연속		중간값 정리 · 최대·최소 정리 · 부동점 정리 · 스털링 근사 · 선형근사(어림)
수열·급수		수열(규칙과 대응) · 급수(멱급수 · 테일러 급수(/목록) · 조화급수 · 그란디 급수(라마누잔합) · 망원급수(부분분수분해)) · 그물
		오일러 수열 · 베르누이 수열 · 월리스 곱
		단조 수렴 정리 · 슈톨츠-체사로 정리 · 축소구간정리 · 급수의 수렴 판정 · 리만 재배열 정리 · 바젤 문제 · 파울하버의 공식 · 오일러-매클로린 공식 · 콜라츠 추측^미해결
미분		미분 · 도함수(이계도함수 · 도함수 일람) · 곱미분 · 몫미분 · 연쇄 법칙 · 임계점(변곡점 · 안장점) · 매끄러움
		평균값 정리(롤의 정리) · 테일러 정리 · 역함수 정리 · 다르부 정리 · 로피탈 정리
		립시츠 규칙 · 뉴턴-랩슨 방법 · 유율법 · 경사하강법
적분		적분 · 정적분(/예제) · 스틸체스 적분 · 부정적분(부정적분 일람) · 부분적분(LIATE 법칙 · 도표적분법 · /예제) · 치환적분 · 이상적분(코시 주요값)
		미적분의 기본정리 · 적분의 평균값 정리
		리시 방법 · 2학년의 꿈
다변수·벡터 미적분		편도함수 · 미분형식 · ∇ · 중적분(선적분 · 면적분 · 야코비안) ·야코비 공식
다변수·벡터 미적분		라그랑주 승수법 · 오일러 동차함수 정리 · 선적분의 기본정리 · 스토크스 정리(발산 정리 · 그린 정리)· 변분법
미분방정식		미분방정식(/풀이) · 라플라스 변환
측도론		측도 · 가측함수 · 곱측도 · 르베그 적분 · 절대 연속 측도 · 라돈-니코딤 도함수
측도론		칸토어 집합 · 비탈리 집합
복소해석		코시-리만 방정식 · 로랑 급수(주부) · 유수 · 해석적 연속 · 오일러 공식(오일러 등식 · 드 무아브르 공식) · 리우빌의 정리 · 바이어슈트라스 분해 정리 · 미타그레플레르 정리
함수해석	공간	위상 벡터 공간 · 국소 볼록 공간 · 거리공간 · 프레셰 공간 · 노름공간 · 바나흐 공간 · 내적공간 · 힐베르트 공간 · L^p 공간
	작용소	수반 작용소 · 에르미트 작용소 · 정규 작용소 · 유니터리 작용소 · 컴팩트 작용소
	대수	C*-대수 · 폰 노이만 대수
	정리	한-바나흐 정리 · 스펙트럼 정리 · 베르 범주 정리
	이론	디랙 델타 함수(분포이론)
조화해석		푸리에 해석(푸리에 변환 · 아다마르 변환)
관련 분야		해석 기하학 · 미분 기하학 · 해석적 정수론(1의 거듭제곱근 · 가우스 정수 · 아이젠슈타인 정수 · 소수 정리 · 리만 가설^미해결) · 확률론(확률 변수 · 중심극한정리) · 수치해석학 · 카오스 이론 · 분수계 미적분학 · 수리물리학(양-밀스 질량 간극 가설^미해결 · 나비에 스토크스 방정식의 해 존재 및 매끄러움^미해결) · 수리경제학^{(경제수학)} · 공업수학
기타		퍼지 논리 · 합성곱

}}}}}}}}} ||

통계학 Statistics
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px"	<colbgcolor=#4d4d4d><colcolor=#fff> 수리통계학	기반	실해석학 (측도론) · 선형대수학 · 이산수학
확률론		사건 · 가능성 · 확률 변수 · 확률 분포 (표본 분포 · 정규 분포 · 이항 분포 · 푸아송 분포 · 카이제곱분포 · t분포 · Z분포 · F-분포 · 결합확률분포) · 확률밀도함수 · 확률질량함수 · 조건부확률 · 조건부기댓값 · 조건부분산 · 전체 확률의 법칙 · 베이즈 정리 · 도박사의 오류 · 도박꾼의 파산 · 몬티 홀 문제 · 뷔퐁의 바늘 · 마르코프 부등식 · 체비쇼프 부등식 · 큰 수의 법칙 (무한 원숭이 정리) · 중심극한정리 · 벤포드의 법칙
통계량		평균 (제곱평균제곱근 · 산술 평균 · 기하 평균 · 조화 평균 · 멱평균 · 대수 평균) · 기댓값 · 편차 (절대 편차 · 표준 편차) · 분산 (공분산) · 결정계수 · 변동계수 · 상관계수 · 대푯값 · 자유도
추론통계학	가설 · 변인 · 추정량 · 점추정 · 신뢰 구간 · 상관관계와 인과관계 · 실험통계학 · p-해킹 · 통계의 함정 · 그레인저 인과관계 · 신뢰도와 타당도
추론통계학	통계적 방법	회귀 분석 · 최소제곱법 · 분산 분석 · 주성분 분석 (요인 분석) · 시계열 분석 · 패널 분석 · 2SLS · 생존 분석 · GARCH · 비모수통계학 · 준모수통계학 · 기계학습 (군집 분석 · 분류 분석) · 위상 데이터분석 · 외삽법 · 메타 분석 · 모델링 (구조방정식)
기술통계학 · 자료 시각화		도표 (그림그래프 · 막대그래프 · 선 그래프 · 원 그래프 · 상자 수염 그림 · 줄기와 잎 그림 · 산포도 · 산점도 · 히스토그램 · 도수분포표) · 그래프 왜곡 · 이상점	}}}}}}}}}

1. 개요2. 확률의 수학적 정의

2.1. 고전적 정의2.2. 기하학적 확률2.3. 통계적 확률2.4. 베이즈 확률론(Bayesian probability)2.5. 공리적 확률

2.5.1. 콜모고로프 공리

3. 확률에 관한 것들

3.1. 확률의 독립3.2. 큰 수의 법칙3.3. 확률 0에 대해

4. 일상에서의 확률

4.1. 매체에서 나타나는 확률4.2. 게임에서의 확률4.3. 시험에서의 확률

5. 각종 오해와 통념들6. 맞춤법 관련7. 관련 문서

1. 개요

일정한 조건 아래에서 어떤 사건이나 사상(事象)이 일어날 가능성의 정도. 또는 그런 수치. 수학적으로는 1을 넘을 수 없고 마이너스가 될 수도 없다. 확률 1은 항상 일어남을 의미하고, 확률 0은 절대로 일어나지 않음을 의미한다.[1]≒개연량ㆍ개연율.

ㅡ 표준국어대사전

確率 / probability

모든 경우의 수에 대한 특정 사건이 발생하는 비율이다. 대체로 수학 외에서는, 0과 1 사이의 소수 혹은 분수나 순열 등으로 나타내기 보다는, 다른 비율을 나타낼 때처럼 0과 1 사이의 확률에 100을 곱하여 0과 100 사이의 백분율(%)로 나타내거나 옛날처럼 푼·리로 나타내기도 한다.

2. 확률의 수학적 정의

수학적인 확률 개념은 카르다노, 파스칼, 페르마 등이 '중단된 도박의 상금 분배 문제'[2]를 논의하며 등장한 것으로 생각된다. 다만 확률의 최초의 정의는 조금 나중에 이루어졌다. '무엇이 확률인지'의 문제는 계속 직관에서 벗어난 예들이 발견되어 사람들을 고민하게 하였고, 현대에 와서야 나름대로의 답을 찾게 되었다.

2.1. 고전적 정의

확률의 최초의 정의는 수학자 라플라스의 논문 Théorie analytique des probabilités에 등장했다.

어떤 사건의 발생 확률은 그것이 일어날 수 있는 경우의 수 대 가능한 모든 경우의 수의 비이다. 단, 이는 어떠한 사건도 다른 사건들보다 더 많이 일어날 수 있다고 기대할 근거가 없을 때, 그러니까 모든 사건이 동일하게 일어날 수 있다고 할 때에 성립한다.

즉, 표본공간 [math(S)]가 [math(n)]개의 근원사건으로 이루어져 있고, 각 근원사건이 일어날 가능성이 같다면, 확률은 (근원사건의 개수)/[math(n)]으로 주어진다는 고교과정에서 일반적으로 배우는 정의이다.

이 정의에서 가장 중요한 것은 '모든 사건이 동일하게 일어날 수 있다고 할 때에'라는 부분으로, 즉 근원사건이 같은 정도로 기대되지 않으면 수학적 확률의 정의를 적용할 수 없다. 예를 들어, 복권 하나를 산 뒤 '복권에는 당첨된다와 당첨되지 않는다는 두 가지 경우의 수가 있으므로 내가 복권에 당첨될 확률은 1/2이다.'라고 생각한다면 이는 잘못된 것이다. '복권에 당첨된다'와 '복권에 당첨되지 않는다'라는 두 근원사건이 같은 정도로 기대되지 않기 때문이다. 수능시험의 수리영역에 출제되는 확률문제에서도 근원사건이 같은 정도로 기대되는지가 중요하게 작용하는 경우가 많다.

사실 곰곰이 생각해보면, 이는 완벽한 '정의'라고 할 수 없다. 표본공간 [math(S)]를 유한 개의 근원사건으로 생각할 수 없는 경우, 이 정의는 당연히 무용지물이 된다. 즉, 이는 이산적 상황에서만 성립하는 정의이지, 전체 확률의 의미를 대변한다고 할 수 없다.

확률의 역사는 곧 도박의 역사로, 르네상스 시대부터 시작되었다. 당시 지중해 연안의 도시에는 일확천금을 꿈꾸는 상인들이 많이 모여들었는데 이들은 날씨가 나빠 출항하지 못할 때 심심함을 달래기 위하여 도박을 하곤 했다.

이때 사람들이 그 승률의 대소를 미리 알기 위해 수학자와 함께 연구하기 시작하면서 확률의 사상은 싹텄다. 그러다가 수학자 카르다노가 도박에 수학을 적용하여 이론적으로 연구하기 시작했다.

그러던 중, 17세기의 페르마와 파스칼이 본격적으로 연구하기 시작하였다. 파스칼에게는 주사위 도박의 문제를 수학적으로 생각하여 늘 좋은 결과를 얻곤 했던 드 멜레라는 프랑스 친구가 있었다. 이 드 멜레가 주사위 도박에서의 알쏭달쏭한 두 가지 문제를 수학자인 파스칼에게 물었는데 앞의 두 문제가 ‘드 멜레의 수수께끼’로 잘 알려져 있다.

첫 번째 문제.
드 멜레는 다음과 같이 생각하였다.

'주사위 한 개를 4번 던지면 6의 눈이 적어도 한 번 나올 확률이 0.5보다 크다. 따라서 2개의 주사위를 던질 때는 눈이 나타나는 방법이 주사위 1개를 던질 때의 6배이므로 [math(n = 4\times6 = 24)](회)로 하면 던지는 사람에게 유리하다'
그런데 위와 같이 실제로 실행을 해 보니 24회로는 던진 사람에게 손해가 있었다. 그러면 과연 [math(n)]을 얼마로 하여야 던지는 사람에게 유리할까?

이것이 드 멜레의 첫 번째 문제인데 수학적으로 계산해보자. 2개의 주사위를 [math(n)]번 던져서 적어도 한 번 두 개 모두 6의 눈이 나올 확률은 [math(1-\dfrac{35}{36}n)]이다. 따라서 [math(1-\left(\dfrac{35}{36}\right)n > 0.5)]가되면 던지는 사람에게 유리하다.
로그를 사용하여 이 식을 풀면 [math(n\ge25)]가 되어 [math(n=24)]로는 손해보는 것이 당연하였다.

두 번째 문제.
앞의 2와 같은 내용의 편지를 받고 고민한 파스칼의 답변은 다음과 같다.

'다음 한 판을 더 해서 A가 이긴다면 A는 3번이긴 것이므로 64피스톨을 가지게 된다. 그러나 만약 B가 이긴다면 A도 2번, B도 2번이긴 셈이므로 비기게 되어 각각 32피스톨씩을 가지게 되어 있다.
나머지 32피스톨은 A나 B중 이기는 사람의 몫이 되겠지만 누가 이길지 모르고 A와 B중 이기는 사람의 몫이 되겠지만 누가 이길지 모르고 A와 B두 사람의 솜씨가 비슷하므로 이기거나 질 확률은 반반이다. 그러므로 A에게 32피스톨을 먼저 주고 그 나머지의 반인 16피스톨을 더 주면 된다. 결국 A는 48피스톨을, B는 16피스톨을 가지는 것이 가장 합리적이다.'

이 대답을 확률적 사고로 고쳐 표현해 보면 다음과 같다.

먼저 A가 이 게임에서이길 확률을 구해 보자. A가 다음 번 게임에서 이길 확률도 질 확률도 0.5인데, 만약 다음 번 게임에서 A가 이기면 A는 B보다 먼저 3점을 따는 것이 되어 이 게임은 A의 승리가 된다.
만약, 다음 번 게임에서 A가 지면 그 시점에서는 A도 2점, B도 2점을 얻은 것이 되어 게임은 끝나지 않는다. 이 경우 A가 이 게임에서 이기려면 그 다음 게임에서 A가 이겨야 하는데 일어날 확률은 0.5 X 0.5 = 0.25 이다.
결국 A가 이 게임에서 이길 확률은 0.5 + 0.25 = 0.75 이고, B가 이길 확률은 0.25 이다.
따라서 내기 돈 64피스톨은
A: 64 0.75 = 48 , B = 64 0.25 = 16
으로 분배하는 것이 가장 합리적이다.

2.2. 기하학적 확률

라플라스의 정의를 약간 바꾸어서, 다음과 같은 정의를 생각해 보자. 어떤 시행의 표본공간 [math(S)]가 평면의 어떤 영역이라고 하고, 각 근원사건인 [math(S)]의 점들이 일어날 가능성이 모두 같다고 한다면, 사건 [math(A)]의 확률은 ([math(A)]의 넓이)/([math(S)]의 넓이)로 정의한다. 이런 식의 확률을 기하학적 확률(geometric probability)이라 하고, 일반적으로 2차원인 평면 대신 [math(n)]차원 공간에서 영역의 [math(n)]차원 부피를 생각하는 식으로 쓰인다.

이는 역사적으로 위의 라플라스의 정의로 설명되지 않는 기하학적인 문제를 풀기 위해 발전하였고, 대표적인 예로 뷔퐁의 바늘 문제(Buffon's needle problem)인 "일정 간격으로 떨어져 있는 평행선들 위에, 평행선들 사이의 간격과 길이가 같은 바늘 하나를 떨어뜨릴 때, 바늘이 평행선과 교차할 확률은 얼마가 되겠는가?"[3] 등이 있다.

물론 이 기하학적 확률도 정의라고는 볼 수 없는 것이, 이 정의로는 라플라스의 정의가 설명하는 이산적인 상황은 설명할 수 없기 때문이다. 하지만 더 큰 문제는 정의 자체가 애매하다는 데에 있고, 이는 다음 베르트랑의 역설(Bertrand paradox)에서 나타난다.

원의 임의의 현을 잡았을 때, 그 현이 원에 내접하는 정삼각형의 한 변보다 길 확률을 구하라.

이 문제는 생각하기에 따라 1/3, 1/2, 1/4 등의 다양한 답이 나올 수 있다. 이는 위의 정의에서 '[math(S)]의 점들이 일어날 가능성이 같다면'이라는 조건이, [math(S)]를 어떤 영역으로 생각하느냐에 따라 천차만별로 다를 수 있기 때문이다. 여담으로 공리적 확률에서는 답을 1/2로 둔다. 이는 공리적 확률에서 주어지는 모든 확률은 독립적인 회전이동 혹은 독립적인 평행이동에 대하여 불변이어야 하기 때문[4].

또 다른 문제는 조건부확률을 주는 문제가 있다. 만약 [math(S)]의 부분집합 [math(T)]를 생각해서, "[math(T)]가 일어났을 때 [math(A)]가 일어날 확률"을 생각한다고 하자. 이산적인 경우와 비슷하게 ([math(A\cap T)]의 넓이)/([math(T)]의 넓이)를 생각하면 될 것 같지만, [math(T)]의 넓이가 0이라면 무슨 일이 일어나겠는가?

사실 기하학적 확률과 라플라스의 정의는 모두 고전적 확률론자들의 정의에 속한다. 고전적 확률론자들은 확률을 어떤 현상의 특징에서 도출된 연역적인 것으로 보았다. 예를 들자면 주사위는 육면이고, 각 면이 나올 가능성은 동일하다. 이러한 주사위의 두 특징에 의거하면 주사위를 던졌을 때 1이 나올 확률은 1/6이 된다. 이처럼 관찰 현상의 본질에서 연역적으로 도출할 수 있는 것으로 확률을 바라보는 관점을 고전적 확률론이라고 한다.

2.3. 통계적 확률

확률을, 어떤 사건을 반복하였을 때(독립시행) 일어나는 상대 빈도수로 보는 것을 빈도적 확률(frequentist probability)이라 한다. 수학적으로 확률을 구할 수 없는 상황에서 항상 적용할 수 있다. 즉, '어떤 사건이 발생할 확률이 0.7이다'는 말을 고전적 확률론자들은 그 사건의 특성 때문에 연역적으로 그 사건이 발생할 확률이 0.7로 나온다고 보는 반면에 빈도론자들은 실제로 열 번 던져봤더니 일곱 번 그 사건이 발생했었다고 보는 것이다. 빈도적 확률론은 확률을 귀납적으로 도출한 것이라 할 수 있다.

그런데 주사위를 반복해서 던져서 구한 빈도적 확률은 주사위를 반복해서 던지면 던질수록 고전적 확률에 가까워지는 것을 관찰할 수 있고, 이를 수학적으로 증명한 것이 바로 큰 수의 법칙이다. 실제로 주사위를 1000번 던지는 경우에도 1/6에 가까운 결과를 보인다.

빈도론자와 고전론자 모두 객관적 확률론자들이다.

2.4. 베이즈 확률론(Bayesian probability)

확률을 현상의 관찰에 따른 주관적인 믿음에 기반하여 도출된 것으로 보는 주관적 확률론의 한 계파이다. 유명한 주관적 확률론자로 존 메이너드 케인스가 있다. 케인즈는 베이즈주의 확률에서 한발 더 나간 확률 개념을 가지고 있다. 베이지안(베이즈주의자)도 객관적 베이지안과 주관적 베이지안으로 나뉜다. 케인즈는 질적 베이지안으로 분류되기도 한다.

베이즈 통계학 참고.

2.5. 공리적 확률

수학적으로 정의된 공리적 확률(axiomatic probability)은 안드레이 콜모고로프(Andrey Nikolaevich Kolmogorov, Андре́й Никола́евич Колмого́ров)가 20세기 중반에 제시했다. 통계학 등의 과목과 연계될거라 여겨지는 위의 정의들과 달리, 이 공리적 확률은 해석학과 대수학의 언어와 사고방식을 동원해야 이해할 수 있다. 실해석학에서는 집합 위에서 시그마 대수(쉽게 말해 '셀 수 있는 대상'의 모임)가 주어진 가측 공간을 정의하고, 가측 공간 위에 일정한 성질을 만족하게끔 잘 정의된 함수가 주어진 측도 공간을 다루는데, 콜모고로프가 제시한 공리적 확률이 이와 크게 다르지 않다. 측도론(measure theory)의 측도(measure), 즉 확률측도(probability measure)로 생각한다는 개념이다. 표본공간 위에 시그마 대수가 주어진 사건공간, 사건공간 위에 확률함수가 주어진 확률공간을 정의하는 이런 사고방식은 위의 세 확률 개념과는 맥락이 매우 다르다. 위에서 확률을 정의한 세 가지 개념이 확률의 현실적 의미에 관한 것이라면, 공리적 확률은 숫자로 나온 확률을 계산하려면 확률 개념이 미분이나 적분과 같은 다른 수학적 개념들과 호환되도록 세팅이 되어 있어야 한다는 취지에서 정의된 엄밀하고 일반적인 수학적 개념이다. 이는 공리적 확률론에 처음 입문하는 학습자의 입장에서는 유클리드 기하학의 벡터와 벡터 공간이라는 대수적 구조의 일정한 성질을 만족함으로써 정의되는 벡터 간의 관계처럼 바라볼 수 있으나, 이런 공리적 확률을 제대로 공부하기 위해 사전에 갖춰둬야 하는 기본기가 선형대수에 처음 입문하는 사람이 겪는 것 이상의 난해하고 골치 아픈 내용들이기 때문에 쉽게 다뤄질 수 있는 주제가 아니다. 이 기반을 닦은 콜모고로프는 현대 확률론의 아버지로 존경받고 있고, 이 공리를 그의 이름을 따 콜모고로프 공리(Kolmogorov axioms)라고 한다.

공리적 확률의 특징은 모든 사건들에 확률이 부여되어 있다는 것이다. 정확히는, 확률을 부여하는 것이 가능하다. 다만 이렇게 부여된 확률, 측도가 반드시 유용하지는 않다는 것이 문제. 때때로 필요성에 따라 측도가능한, 즉 확률을 부여하는 집합에 제한을 주기도 한다. 확률은 가산 개의 집합에 대한 합의 법칙만 만족한다면, 자유롭게 주어질 수 있다. 또 하나는 근원사건에 전혀 의미를 두지 않는다는 것이다. 표본공간 [math(S)]의 부분집합들의 모임을 사건공간(event space)으로 생각한다는 것은 맞지만, 여기서 [math(S)]의 개별 원소, 즉 근원사건은 거의 의미가 없다.[5]

어쨌든 이 공리적 확률은 현대수학자들이 보통 생각하는 확률의 개념이고, 위의 두 정의(고전적 정의/기하학적 확률)는 이 공리적 확률의 특수한 사례라 할 수 있다. 또한 큰 수의 법칙으로 인해, 이 공리적 확률이 현실에서의 통계적 확률과 이어진다는 것을 확인할 수 있다.

2.5.1. 콜모고로프 공리

주어진 표본공간 [math(S)]와 그에 따른 시그마 대수([math(\sigma)]-algebra) [math(\mathcal{B})]에 대하여, [math(\mathcal{B})]를 정의역으로 하는 확률함수 [math(P)]는 다음 조건을 만족시킨다.

모든 [math(A\in\mathcal{B})]에 대하여 [math(P(A)\geq0)]
[math(P(S)=1)]
[math(A_1,\,A_2,\,\cdots\in\mathcal{B})]가 상호 배반(mutually exclusive, pairwise disjoint)이면 [math(P(\cup_{i=1}^\infty A_i)=\sum_{i=1}^\infty P(A_i))]

이 세 가지 속성을 확률의 공리(axioms of probability) 또는 고안한 수학자의 이름을 따서 콜모고로프 공리(Kolmogorov axioms)라고 한다. 이를 만족시키는 모든 함수는 확률함수이다.

그런데 역으로, 모든 확률함수가 콜모고로프 공리를 만족시킬까? 새로운 확률함수를 볼 때마다 일일이 이 공리를 만족시키는지를 따지는 것은 너무 비효율적이므로, 좀 더 일반적인 방법이 필요하다. 다음의 정리는 [math(P)]가 제대로 된 확률함수인지를 판별하는 보편적인 정리이다.

유한집합 [math(S=\{s_1,\,s_2,\,\cdots,\,s_n\})]에 대하여 [math(\mathcal{B})]를 [math(S)]의 임의의 부분집합의 임의의 시그마 대수라고 하자. 또한 [math(p_1,\,p_2,\,\cdots,\,p_n)]은 총합이 1인 음이 아닌 실수라고 하자. 임의의 [math(A\in\mathcal{B})]에 대하여

[math(P(A)=\displaystyle\sum_{i:\,s_i\in A}p_i)]

로 정의되는 함수 [math(P)]를 [math(\mathcal{B})]에 대한 확률함수라고 한다.

이를 증명하여 보자. [math(P)]가 콜모고로프 공리를 모두 만족시킴을 보이면 된다.

먼저, [math(P)]는 다음과 같이 첫째 공리를 만족시킨다.

[math(P(A)=\displaystyle\sum_{i:\,s_i\in A}p_i\geq0)]

왜냐하면 [math(p_1,\,p_2,\,\cdots,\,p_n)]이 모두 음이 아니기 때문이다.

또한 [math(P)]는 다음과 같이 둘째 공리를 만족시킨다.

[math(P(S)=\displaystyle\sum_{i:\,s_i\in S}p_i=\sum_{i=1}^np_i=1)]

[math(S)]는 전체집합이므로, [math(i)]의 값에 관계없이 [math(s_i\in S)]이기 때문이다.

마지막으로 [math(P)]는 다음과 같이 셋째 공리까지 만족시킨다. 곧, [math(A_1,\,A_2,\,\cdots,\,A_k)]가 상호 배반일 때 다음이 성립한다.

[math(P(\cup_{i=1}^kA_i)=\displaystyle\sum_{j:\,s_j\in\cup_{i=1}^kA_i}p_j=\sum_{i=1}^k\sum_{j:\,s_j\in A_i}p_j=\sum_{i=1}^kP(A_i))]

첫째 등식과 셋째 등식은 [math(P(A))]의 정의에 의하여 성립한다. 중요한 것은 둘째 등식인데, 이것이 성립하는 이유는 [math(A_1,\,A_2,\,\cdots,\,A_k)]가 상호 배반이기 때문이다. 다시 말해서 둘째 등식의 양변에는 동일한 [math(p_j)]들이 한 번씩 나타난다는 것이다.

3. 확률에 관한 것들

3.1. 확률의 독립

독립된 사건의 경우, 독립시행이라 이전에 했던 결과는 다음 시행에 전혀 영향을 주지 않는다. 예를 들자면, 주사위를 던져서 정말 우연히 6이 10번 연속으로 나왔다고 해서, 그 다음으로 던졌을 때 6이 나올 확률이 높아진다거나, 혹은 도박 등에서 내가 돈을 계속 잃었다고 앞으로 돈을 딸 확률이 높아지는 것이 절대 아니라는 것. 따지고 보면 지극히 당연한 논리임에도 불구하고, 이런 도박사의 오류 등을 간과하여 파산하는 사람들이 수두룩하다. 심지어 확률의 독립을 정확하게 이해하고 있는 사람들도 크게 다를 바가 없다! 연속으로 돈을 잃게 되면, 계속 돈을 부어도 확률은 같다는 이성보다는 '이만큼 잃었으니 이번에는 되겠지'라는 감성이 먼저 작용하는 것이 보통이기 때문.

독립인 사건들이 동시에 일어날 확률은, 각각의 사건들의 확률이 곱해져서 작용한다. 즉, 동전과 주사위를 던져 동전이 앞면이 나오고 주사위의 눈이 1이 나올 확률은 1/2 × 1/6 = 정확히 1/12가 된다. 이를 뒤집어서 설명하면, 90% 확률을 가지고 있는 사건이라도, 그 사건이 10번 연속으로 성공할 확률은 (9/10)¹⁰≒34.87% 정도에 불과하다.

독립사건은 그 확률을 거듭제곱하는 과정이기 때문에 조합 공식이나 파스칼의 삼각형을 응용하면 어떤 사건이 몇 번 일어날 확률을 구할 수 있다. 그러나 말이 구할 수 있는 거지, 만약에 뽑기를 100번 해서 20번 이상 당첨될 확률을 구하는데, 그 20번과 그 이상의 숫자에 대한 확률을 각각 구해서 더하겠다면 그것만큼 훌륭한 삽질도 없다.

그 대신 위에서 서술된 저 90% 확률의 연속성공률을 역으로 응용하면, [math(a)]의 확률로 어떤 결과가 일어나는 사건을 [math(N)]번 시행해서 적어도 몇 번 이상 그 결과를 볼 수 있는 확률도 조금이라도 더 쉽게 알아낼 수 있다(특히 수학 문제에서는 "적어도 한 번 이상 ~"이라는 문구로 굉장히 눈에 익을 것이다). 예를 들어 앞에서 서술한 사건을 [math(N)]번 수행해서 적어도 한 번 이상 그 일이 일어난다는 것의 반대 의미는 아예 그것이 일어나지 않을 확률이므로, 그 사건이 일어나지 않을 확률([math(1-a)])을 [math(N)]번만큼 곱해서 그 값을 1에서 빼면 "적어도 한 번 이상 ~"의 확률을 얻어낼 수 있다.

주의할 점은, 배반사건은 독립이 아니라는 점이다! 만약 수학 문제에서 "배반사건은 독립사건이다"라는 문항이 있다면 무조건 틀린 문장이다. 시비걸지 말고 과감히 틀렸다고 체크하자. 1~5가 적힌 5개의 공 중에서 1개를 뽑는데 1번이 뽑혔다면 2번 공은 뽑힐 수 없다. 즉, 1번 공을 뽑는 것은 2번 공을 뽑는 사건에 결정적 영향을 주므로 배반사건은 종속사건 중에서도 극단적인 종속사건이다! 또한 "배반사건은 항상 독립사건이 아니다" 역시 틀린 문장인데, 이것은 공사건의 존재때문에 그렇다. 예를 들면 1부터 6까지 적힌 일반적인 6면체 주사위를 굴려 1이 나오는 사건과 7이 나오는 사건은 배반사건이면서 독립사건이다.

'번개에 맞을 확률이 로또보다 낮으므로 번개를 맞은사람은 로또를 사라'같은 오류도 흔하다. 이 역시 번개를 맞을 확률과 로또에 당첨될 확률의 독립성을 간과한 오류. 번개에 맞았으면 로또 살 생각 하지 말고 병원에 가자. -~~병원에 갈 정신이 남아있다면 그 자체로 로또 당첨이라는 점은 넘어가자.~~-

3.2. 큰 수의 법칙

정해진 확률은 시행 횟수가 적을 경우 우연에 의해 기존 확률과 크게 벗어난 값을 가질 수 있으나 일정한 확률을 가지고 있는 사건을 계속적으로 반복해 시행하면 결국 시행하면 시행할수록 원래 확률에 가까워진다. 이것을 큰 수의 법칙이라 한다. 예를 들어, 주사위를 던져 1이 나올 확률을 구할 때, 한 다섯 번 쯤 던져 우연히 1이 3번 정도 나오거나 혹은 한번도 안 나올 확률이 있지만, 대략 수백만 번 이상 던지면 1이 나온 횟수는 전체 던진 횟수의 1/6에 가까워져 간다는 것. 카지노에서는 딜러가 플레이어보다 대략 55:45 정도로 유리한 위치를 점하는 것이 보통이기 때문에, 우연히 카지노에서 돈을 번 사람이 자신의 운을 믿고 계속적으로 카지노 게임을 한다면, 궁극적으로 반드시 손해를 볼 수밖에 없다.

이 법칙을 실제로 확인해 본 학자들이 존재하는데, 프랑스 자연주의자 C. Buffon은 4,040번의 동전을 던져 2,048번의 앞면을 얻어 그 상대도수값이 2048/4040=0.5069가 됨을 알았으며, 2차 세계대전중 독일군에 의해 포로가 된 남아프리카 통계학자 J. Kerrich는 수용소에서 생활을 하면서 10,000번의 동전을 던져 5067번의 앞면 즉, 0.5067이라는 상대도수값을 얻었다. 1900년경 영국의 통계학자 K. Pearson은 24,000번의 동전을 던져 12,102번의 앞면, 즉 0.5050이라는 상대도수값을 얻었다.

하지만 확률이 존재하기만 한다면, 즉 0만 아니라면[6] 아무리 말도 안되는 확률의 일이라도 일어난다. 연속으로 로또 당첨, 연속으로 낙뢰 당첨, 말도 안되는 게임의 고강 무기~~, 허경영 효과~~ 등이 존재하는 이유.

이와 같은 확률에 대한 오류는 도박사의 오류 문서에 보다 자세히 설명되어 있으니 해당 문서를 참고할 것.

3.3. 확률 0에 대해

이 문제는 앞의 둘과 다르게, 사람들이 현실에서 상당히 공감하지 못할 내용일 것이다. 당장에 위의 국어사전 정의도 '확률 0은 일어나지 않는 사건'이라는 (엄밀히 본다면) 오개념으로 정의되었다.

수학적으로는 확률이 0인 사건도 얼마든지 일어날 수 있다.[7] 아래는 관련 설명이다.

기하학적 확률 혹은 공리적 확률에 따르면, 확률 0은 단지 영역의 넓이 혹은 측도가 0인 것 뿐이다. 더욱 구체적으로 이야기해 보면, 수직선 위의 선분 [math([0, 1])]위에서 균등하게 점을 뽑는다고 생각했을 때, 한 점을 뽑을 확률은 0이 되지만, 어쨌거나 한 점은 뽑히게 되어 있다. 따라서 '확률이 0인 사건은 일어나지 않는다'라고 가정해 버리면 '선분 위에서 점을 뽑을 수 없다'는 이상한 결론이 나와 버리는 것이다. '하지만 통계적 확률의 의미로 생각해보면 한 번 일어난 사건이 확률 0인 건 말이 안되지 않느냐?'고 물어볼 수도 있지만 이것도 반박되는 것이, 통계적 확률은 무수한 시행에서 평균의 극한을 생각하기 때문이다. 이를 선분 예시로 본다면, [math([0, 1])]에서 수 [math(x)]를 뽑았다면 [math(x)]를 뽑은 사건은 일단 일어났지만, 이 시행을 몇 번이고 반복해도 그 정확한 [math(x)]를 뽑을 일은 앞으로는 일어나지 않을 것이다. 따라서 사건이 일어났음에도 통계적 확률이 0인 것은 전혀 부자연스럽지 않다.

측도 개념을 이해하면 [math([0, 1])]의 균등분포에서 유리수를 뽑을 확률이 0이라는 사실도 알 수 있다. 다만 이는 측도 개념에 대한 정확한 이해가 필요하다. 초한기수와는 또 다른 개념이므로 혼동하면 곤란하다.[8] 물론 초한기수가 가산(countable)인 집합이 측도가 0이 된다는 사실은 있지만, 역이 성립하는 것도 아니고 일단 수학적 정의의 맥락 자체가 집합론과 해석학으로 매우 다르기 때문.

이에 거부감을 느끼는 이유를 추측하자면, 많은 사람들이 '우연히 일어난 사건'과 '내가 지정한 우연히 일어난 사건'을 헷갈리기 때문일 것이다. 예시로는 [math(n)]명의 사람이 있을 때, 생일이 같은 두 사람이 있을 확률이 얼마일지를 묻는 생일 문제(birthday problem)의 경우가 있다. 의외로 [math(n=23)]만 되어도 이 확률은 50%를 넘고, 60명 정도가 있으면 99%에 육박한다. 다만, 누군가 두 명은 생일이 같겠지만, 이들이 내가 생각한 두 명일 가능성은 당연히 1/365로 낮을 것이다. 굳이 무한까지 갈 것도 없이 경우의 수 정도만 해도 우연히 어떤 일이 벌어질 확률은 0에 가깝다. 인류 원리 참조. 그리고 저 맨 밑을 보자. 길긴 하지만 이 내용에 대한 설명은 물론이고 연속으로 일어날 확률은 얼마나 낮아지는지에 대한 내용까지 상세히 설명되어 있으니 많은 도움이 될거다.

한편, '우연히 뭔가를 뽑는다'는 과정도 의외로 비직관적일 때가 많다. [math([0, 1])] 위에서의 균등분포 예시도 인간이 현실적으로 할 수 있는 조작은 아니다. 수를 균등하게 뽑으려면 (10진법 기준으로 생각하면) 소수점 첫째 자리 0~9중 하나, 둘째 자리 0~9중 하나, ... 무한 개의 자리를 모두 균등하게 뽑아야 하는데, 인간은 당연히 무한 개의 자리를 뽑을 수가 없다. 유한 개의 자리만 뽑거나 패턴을 지정하고 멈춰버리면 그건 균등분포가 되기는커녕 모든 실수를 뽑을 수도 없을 것이다. 실제로 많은 확률공간과 확률과정들을 수학적으로 '엄밀히' 정의하려면 이것처럼 무한 번 선택을 가능하게 해 주는 선택공리가 필요하다.

같은 논리로, 확률이 1인 사건이 일어나지 않을 수도 있다. [math([0, 1])]의 균등분포에서 무리수를 뽑는 사건 같은 것. 이 때문에 확률론에서는 '거의 확실한 수렴'(almost sure convergence, a.s.)이라는 용어를 쓰기도 하는 것이다.

4. 일상에서의 확률

눈금이 6개인 주사위를 던졌을 때 특정 수가 나올 확률은 1/6. 로또에서 모든 경우의 수는 8,145,060. 한 장 샀으면 당첨될 확률은 1/8,145,060. 서로 다른 번호로 두 장 사면 2/8,145,060. 그리고 당신이 랜덤문서 이동버튼을 한 번 누르고 이 글을 보고 있을 확률은 4/7220120[9].(2번 이상 눌렀더라도 그 사이 출력된 문서를 확인하지 않았더라면 확률은 똑같이 4/7220120이다.)

확률은 불확실성을 다룰 때 사용되는 좋은 개념으로, 확률을 이용하면 알려진 불확실성을 다룰 수 있다. 대표적인 분야가 바로 양자역학. 입자의 위치와 운동상태를 동시에 알 수 없음을 인정하고, 이를 확률적으로 표현하자는 것이 양자역학의 시작이다.

마틴 가드너에 의하면, 수학 분야 중 직관이 가장 잘 빗나가며 많은 정답이 상식에서 크게 벗어난다고 한다. 특히 이 분야의 대명사와도 같은 몬티홀 문제는 수많은 수학자도 엿을 먹었을 정도.

4.1. 매체에서 나타나는 확률

캐릭터를 지적으로 보이게 만드는 수단으로 확률을 사용하는 경우가 많다. 같은 말이라도 "널 죽일테다!"라고 말하는 것보다 "당신은 86.7%의 확률로 저에게 살해당합니다."라고 말하게 해서 좀 더 지적 능력과 논리~~혹은 중2병~~에 의존하는 것으로 보이게 하는 식이다. 가끔 미래를 예측하는 류의 캐릭터도 이런 식의 대사를 한다. ~~보통 이럴 경우 안 죽는게 더 많다.~~

천원돌파 그렌라간에서는 확률변통탄이라는 무기가 존재하는데 맞을 확률 100%를 내려 결국 공격을 명중시킨다는 개념.~~필중?~~ 이놈들은 확률조차 조정한다는 얘기인데, 워낙 작품자체의 전투가 초월적으로 가고 기합과 열혈로 이루어진 나선력으로 어떻게든 다 되는 작품이므로 과학적인 설정따위 없다.

작전의 성공률이나 합체, 혹은 문제 해결의 확률이 낮을 경우 이걸 당연스레 극복하는 것도 흔한 클리셰 중 하나다.

이런 확률도 있다.

나무위키에서 랜덤을 눌러 원하는 문서 하나가 나올 확률은 1 나누기 문서의 총 개수, 즉 7220120분의 1이다. 이론상으로 어느 정도 시간 차를 두고 눌렀음에도 이 문서로 다시 돌아올 수도 있지만 역시 쉽지 않다. 그리고 당신이 여태까지 나무위키를 많이 봐왔다면, 랜덤을 눌러도 난생 처음 보는 문서가 아닌 이미 봤던 문서가 나올 가능성도 꽤 높을 것이다. 자신의 운을 시험해보고 싶다면 한 번 해보는 것도 재미있을 듯 하다. ~~로또 1등보다 7배 확률이 높다~~

4.2. 게임에서의 확률

~~99%의 확률이 터지고 1%의 확률이 붙는 주작이 넘치는 곳~~

게임과 확률의 관계는 불가분적 관계(뗄레야 뗄 수 없는 관계)이다. 거의 모든 게임은 확률적인 요소를 가지고 있고, 이 확률이 유저의 흥망을 결정할 만큼 큰 영향을 끼치기도 하는 반면, 게임을 즐기는 데에 큰 영향을 주지않는 게임도 있으며, 자신의 실력으로 어느정도 확률을 조절할 수도 있다.

이를테면 RPG에서 고난이도 던전에 드디어 입문을 하여 필요한 아이템을 파밍하는데 될놈은 몇주, 몇달만에 모든 아이템을 맞추지만 안될놈은 몇년을 해도 다 못 맞추는 경우.

대표적으로 극악의 확률을 자랑하는 컨텐츠로는 강화, 가챠(뽑기)가 대표적이라고 할 수 있다.~~만악의 근원~~ ~~될놈될 안될안, 운빨좆망겜~~

이 확률이 게임에 끼치는 영향이 점점 커지자 게임에서도 아무리 운이 없더라도 특정 기간동안 열심히 한다면 자신이 원하는 아이템을 확정적으로 얻을 수 있는 시스템(이른바 정가)을 도입하고 있다.

슈로대나 엑스컴같은 확률기반 턴전술게임의 경우 컴퓨터가 사기를 치는게 아닌가 하는 ~~확알못들의~~ 의심이 끊임없이 나온다. 흔히 말하는 것이 '내 90%는 빗나가고 적의 10%는 잘만 맞는다'인데, 이건 사실 농담조로 하는 이야기지만, 간혹 이걸 진지하게 믿고 괴논리를 펼치는 사람도 있다. 물론 게임을 하다보면 저런 어이없는 상황을 안 겪는것은 아니지만 수많은 확률계산 중 몇 번에 불과한 것이다. 그런 것이 더욱 기억에 남는것은 선택적 기억에 따른 것으로, 당연한 일들은 별로 기억에 남지 않지만 95%가 빗나가는 등의 특이한 일만 기억에 남겨져서 95%로 백 번을 공격해서 95번 맞추는 게임을 해놓고도 빗나간 5번의 기억만 생생한 것이다. 이에 대해선 머피의 법칙 문서도 참조하자.

만약 특정 상황에서 정말로 확률 조작을 가할 경우, 발생하는 결과의 폭이 매우 좁아지기 때문에 플레이어는 마음만 먹으면 테스트를 통해 그것을 쉽게 밝혀낼 수 있으며, 코어게이머들에게 의해 파해되어 역이용을 당하기 십상일 것이다. 난수고정이 되는 슈로대 시리즈에서 일단 고명중기체로 적을 맞춰놓고 리셋한 다음 저확률 고위력의 공격을 해서 명중시키는 꼼수가 대표적. 여담으로 엑스컴의 경우 확률 조작이 있긴 있었지만... 알고보니 그게 저난이도에서 플레이어가 유리해지는 조작이었다.

보통 일상적인 확률책정은 10진법 자연수로 끊어서 하는게 일반적이나, 비디오 게임에서의 확률은 보통 2의 제곱수(16진수 포함)를 기본으로 계산된다. 애초 비디오 게임은 프로그래밍으로 만들어지는데 컴퓨터의 기본적인 연산단위인 바이트(기초적인 연산단위는 bit)에 근간하기 때문이다.

4.3. 시험에서의 확률

5지선다형에서 25문제를 모두 찍어서 맞힐 확률은 (1/5)²⁵, 약 3.3554432×10^-18[10]이며, 2지선다라고 해도 (1/2)²⁵=1/33,554,432이다. 이는 로또 당첨 확률(815만분의 1)보다도 더 낮다. 심지어 반타작할 확률도 고작 0.0000000075(0.0000075%)이다. 2지선다의 경우 50% 확률로 반타작한다.[11][12][13]

조금 더 현실적으로 생각해보자면, 5지선다형 25문제를 다 찍어서 0점 맞을 확률은 고작 (4/5)²⁵=0.378%에 불과하다. 물론 전부 맞히는 것보다는 훨씬 확률이 높지만 정당하게 시험 봐서 0점 맞는다는 것은 말처럼 쉬운 일이 아닌 것이다.

5. 각종 오해와 통념들

이 문단은

"내가 돈을 딸 확률이 1/3인데, 저번 두 판은 연거푸 졌어. 그렇다면 확률에 따라, 이번 판은 반드시 이기겠지? 올인!!"[14]

도박사의 오류 문서 참고. 이전 시행과 이후 시행이 서로 독립적이라면[15] 이러한 가설은 전혀 성립하지 않는다.

동전 던지기를 10회 해서 "앞"만 줄곧 10번 나올 확률은 1/1024보다 낮을 것이다.

확률에는 변함없다. 앞과 마찬가지로 그 "패턴"에 뇌가 구태여 의미를 부여할 뿐이다. 물론 언뜻 패턴이 보이지 않는 경우보다 딱 봐도 패턴이 보이는 경우가 나올 확률이 더 낮긴 하다.[16] 사람의 뇌는 "단지 패턴이 보이지 않는다는 이유만으로" 그러한 1022가지 경우를 마치 전부 똑같은 결과가 나온 것처럼 간주하곤 한다. 이 또한 바로 앞의 편견과 마찬가지로 도박사의 오류에 해당한다.

로또 번호를 "1, 2, 3, 4, 5, 6" 으로 하는 것보다 "1, 7, 12, 25, 37, 44" 처럼 하는 것이 당첨확률이 더 높을 것이다. 최소한, 정말 조금이라도 더 높겠지?

동전 던지기와 마찬가지다. 제비뽑기 같은 경우 뽑는 순서에 따라 확률이 달라진다고 생각하지만, 이것 역시 종이를 뽑는 횟수가 같으면 순서를 바꿔도 확률에는 변화가 없다. 이는 뒤에 갈수록 경우의 수가 줄어들기 때문에 상대적으로 확률이 달라질 거라고 느낄 뿐이다.
그럼에도 불구하고 대부분 후자의 당첨 확률이 더 높다고 느끼는 데는, 단순히 후자의 숫자 배열이 역대 로또 당첨 번호들의 배열과 더 유사하게 생겼기 때문이라는 관점이 있다. 경험적으로 보았을 때 전자처럼 일정한 규칙을 지켜서 나왔다기보다는 후자처럼 무작위로 배열된 경우가 훨씬 더 많았기 때문에 우리가 후자의 경우가 확률이 더 높다고 착각하는 것이다. 2017학년도 수능특강에 이 내용을 다룬 영어 지문이 수록되었다.
정확히 말하면 6개의 숫자가 연속으로 나올 확률은 서로 무관한 숫자가 나올 확률보다 낮기는 하다. 물론 이것은 6개 전체로 따졌을 때 이야기고, 각자 따질 때는 전부 확률이 같다. 확률에 대한 이해가 없으면 알아듣기 어려울 순 있다.
random.org에 따르면, 로또 번호를 직접 골랐을 때보다 무작위로 골랐을 때의 당첨금이 높다. 많은 사람이 고르는 조합과 그렇지 않은 조합이 나뉘고, 이런 조합이 당첨되면 당첨금을 나눠야 하기 때문. 무작위로 고르면 모든 조합이 같은 확률로 나오기 때문에 당첨금을 나눌 일이 줄어든다. 물론 이런다고 당첨 확률이 올라가는 것은 아니다.
또한, 로또에서 흔히 나오는 조작 음모론의 대명사인 "매 회차 로또 구매 수를 보면 1등이 10명은 나와야 정상인데 나오지 않으니 조작이다"라는 것도 이에서 기인한다.
먼저 로또의 확률은 "모든 번호가 나올 확률은 완전 무작위"에서 기인하는 수학적 확률이지만, 정작 로또를 사는 사람들의 심리상 "이 번호는 지난 번에 나왔으니 나오겠지/안나오겠지"라던가 "연속된 숫자나 규칙성 있는 숫자는 아무래도 안 나올거야"라는 무의식적인 심리적 필터링으로 인해 실제 구매하는 번호에 편중이 생기기 때문.
같은 원리로 이런 것도 있다. 우선 A라는 사람은 갓난아기 때부터 키가 평균에 가깝다. 그에 비해 B라는 사람은 48개월 때 170cm를 넘었음에도 불구하고 교통사고같은 특별한 외부 개입도 없었는데 정작 20세까지 컸음에도 최종 키는 180cm도 못 넘었다. 그런데 B보다도 48개월 때 키가 더 크되 최종 키가 더 작을 확률은 얼마인가? A와 성장곡선이 정확히 같을 확률은 얼마인가?
확률이 얼마인지는 모를 지언정 일단 후자가 확실히 확률이 비교도 안되게 훨씬 더 낮다. 그럼에도 불구하고 전자가 훨씬 낮게 느껴지는 이유는 A라는 사람보다 B라는 사람이 평균 키에 가깝고 현실적이기 때문이다.
역시나 이런 것도 생각해볼 수 있다. 500원짜리 동전을 3번 던져서 나올 패턴을 정확히 예측하면 그 500원은 당신이 가질 수 있다. 동전을 던졌다 줍는 데에 걸리는 시간을 5초 정도로 잡는다고 해도 확률이 비교적 높으므로 시도해보는 사람도 많을 것이고 그 중에서 성공한 사람도 많을 것이다. 하지만 확률이란 무엇인가? 연속으로 일어나는 것에 대해서는 기하급수적으로 낮아지는 개념이다. 즉 동전을 100번 던져서 특정 패턴이 나올 확률은 지구상에서 모래알을 랜덤으로 하나 골랐다 다시 버리고 또 랜덤으로 하나 골라서 같은 모래알로 나올 확률만큼이나 낮다.
그래서 3번 던져서 나올 패턴이라면 모를까 10번 던져서 나올 패턴을 예측할 바에 그 시간에 다른 방법으로 돈을 버는 게 훨씬 빠를 것이다. 알다시피 연속으로 일어나는 경우를 예측하는 행위에 대해서는 앞으로의 상황을 아냐 모르냐에 따라 그 난이도가 기하급수적으로 달라진다. 예를 들어 동전을 100번 던진 다음 나왔던 패턴을 그대로 종이에 따라쓰는 건 2초에 1번씩 쓴다고 해도 200초 즉 3분 20초밖에 걸리지 않는다. 그럼에도 불구하고 동전을 100번 던져서 나오게 될 패턴을 예측한다는 것은 결코 쉬운 일이 아니다. 물론 확률이라서 이것도 한번에 뚫을 수도 있지만 그 확률은 앞서 말했듯 2의 100제곱분의 1 확률이라서 로또 당첨률과도 비교할 수 없을 정도로 낮다. 그래서 동전을 100번 던져서 나올 패턴을 맞히면 받을 수 있는 보상은 얼마냐고? 바로 1구(10³²) 원 이상이다. 2의 100제곱이 10³⁰을 넘기니 이정도는 되어야 소비되는 시간에 비해 보상이 적지는 않을 것이다. 그런데 사람의 수명은 얼마인가? 길어야 100년이다. 어차피 동전을 100번 던져서 나오게 될 패턴을 예측하기도 절대 쉽지는 않지만 1구 원이나 받는다고 해도 어차피 평생 동안 다 쓰지도 못하고 죽을 것이다. 1년에 1경을 쓴다고 해도 당신의 수명이 1경 년 정도는 되어야 다 쓰고 죽을텐데 저걸 다 쓰고 죽을 확률 역시나 절대 만만치 않다.
그런데 그럼에도 불구하고 동전을 100번 던지는 것은 쉽다. 심지어 동전을 하나만 갖고 하더라도 동작만 조금 빠르다면 10분도 안 걸린다. 100번 던지든 1000번 던지든 동전은 반드시 어떤 패턴이 나오게 된다. 그런데 이러한 무작위 패턴이든 번갈아가며 나오는 패턴이든 한 면만 나오는 패턴이든 확률은 동일하다. 그런데 실제로는 순수하게 동전을 100번 던져서 전부 다 한 면만 나오는 경우는 사실상 없다. 전 세계 인구가 평생 동안이나 동전을 계속 던져도 절대 쉽지는 않을 것이다. 확률이라서 어떻게 보면 한 번에 뚫는 것도 가능하지만 역시나 로또 당첨률보다도 아득하게 낮으니 시도 횟수에 비해 확률이 매우 낮다면 사실상 그게 그거다. 따지고 보면 0.1과 0.0001의 차이도 산술적으로 보면 0.1 이하로 차이나는 셈이다. 그리고 무엇보다도 중요한 사실은 당신이 지금 당장 동전을 100번 던져서 나온 패턴도 결국에는 한 번이라도 나왔긴 하지만 앞으로 최소 1000조 년 동안은 두 번 다시 나오지 않을 정도로 낮은 확률이라는 사실이다.

다르게 생각해보자면 뽑기를 예시로 들 수 있다. 1부터 10까지의 수 중 하나를 뽑을 수 있고 한 번 뽑은 건 버리고 다시 뽑냐 다시 넣은 다음에 또 뽑냐에 따라 달라진다.
예를 들어 7을 뽑고 버린다고 치자. 이러면 다시 뽑을 때 7만큼은 절대로 나오지 않는다. 그에 따라 특정 수를 뽑을 확률도 1/10에서 1/9로 올라간다. 7을 뽑았는데 다시 넣었다면 특정 수를 뽑을 확률은 변함 없고 7을 연속으로 뽑을 수도 있을 것이다. 그런데 이 스케일을 극단적으로 올려서 1부터 10000까지의 수 중 하나를 뽑을 수 있다면 한 번 뽑은 것을 버리든 다시 넣든 비슷해진다. 당연히 경우의 수가 많아질수록 독립된 것이든 뽑고 버리는 것이든 더더욱 비슷해지며 같은 원리로 동전을 100번 던져서 나온 패턴도 마찬가지로 일생에 한 번 나오면 나왔지 두 번이나 나올 일은 아무리 확률 특성 상 한 번 시도해도 이론상으로는 된다고 해도 그런 일은 사실상 없다는 소리다. 1초마다 시도할 수 있는 것에서 100번 시도해야 하는 것과 1% 확률로 뚫을 수 있는 것이 운이 좋을 땐 후자가 쉽고 반대로 나쁠 땐 전자가 쉽다는 것과 같은 원리다. 당연히 로또 당첨률보다도 아득히 낮은 2의 100제곱분의 1이라는 확률을 뚫는 건 운이 아무리 좋아도 동전을 100번 던지는 것 자체는 쉬울 지언정 패턴을 미리 예측하는 것만큼은 사실상 불가능할 것이다.
와닿게 설명하자면 당신이 과녁에 화살을 쐈는데 다음 번에 쏠 때에 이미 꽂혀있는 화살의 촉 반대쪽에 꽂히는 게 한가운데에 맞히는 것만큼이나 어렵다는 것을 생각해보면 이해하기 쉽다. 물론 세 번째에 쏠 때에는 화살의 촉에 꽂힐 확률이 2배가 된다. 화살을 쏘기 전에 과녁을 마지막으로 유의미하게 움직이게 한 것도 당신이라면 더더욱 와닿을 수 있는데, 따지고 보면 과녁을 이동시킨(즉, 중심 지점을 정한) 것도 당신이고 화살을 쏜(즉, 화살이 어느 지점을 향할지 정한) 것도 당신이다. 아무튼 연속으로 맞히는 게 결코 확률 0은 아니라서 한 번에 뚫을 가능성이 아예 없는 것도 아니지만, 딱 한 가지 부정할 수 없는 건 확률의 개념에서 연속으로 맞히는 행위 자체는 이렇게 어렵고 연속이 길어질수록 확률과 난이도도 기하급수적으로 극악이 되어버린다는 것이다. 이것도 참고하길 바란다. 그리고 이렇게 낮음에도 일어나는데 왜 어떤 건 안 일어나냐에 대해서는 이걸 참고하는 게 좋다.

6. 맞춤법 관련

확율이 아니라 확'률'로 써야 한다. 두음 법칙이 적용되는 경우라고 잘못 생각한 듯.[17] 어두가 아닌 곳에서 '률'을 '율'로 쓰는 경우는 앞 글자가 모음, 즉 받침이 없거나 'ㄴ' 받침으로 끝나는 경우만이다.

7. 관련 문서

그런데 그것이 실제로 일어났습니다
도박사의 오류
무한 원숭이 정리
몬티 홀 문제
큰 수의 법칙
확률론
통계학
어떤 확률 - 유머 유행어
도박 중독, 과금전사 - 인생을 확률에 기대면 이런 쪽으로 빠지게 된다.

[1] 단, 이 설명은 수학적으로는 틀린 설명이다. 확률 0이라 해서 절대 일어나지 않는 것은 아니다. 연속확률변수가 어떤 특정한 값을 가질 확률은 언제나 0이지만, 이를 절대로 일어나지 않는다고 말하지는 않는다. 더욱 자세한 설명은 아래의 '확률 0에 대해' 문단에서.[2] 3판을 이겨야 되는 게임에서 2:1 상황에서 중단되었을 때, 두 사람의 실력이 동등하다고 하면 상금을 얼마로 나눌지의 문제.[3] 이 문제의 답은 놀랍게도 원주율을 사용하여 [math(\dfrac2\pi)]로 주어진다. 즉, 바늘을 여러 번 떨어뜨림으로서 원주율의 근사값을 추정할 수 있는 것.[4] 1/3과 1/4의 경우는 회전이동과 평행이동이 동시에 일어나는 비 독립적 변환이 일어나서 확률이 왜곡된 것.[5] 심지어 사건공간의 원소로 생각되지 않을 수도 있다. 다만, complete probability space에서는 보통 completion을 통해 사건공간의 원소로 편입된다.[6] 사실 연속 확률 변수의 경우, 모든 [math(x)]에 대해 [math(P(X=x)=0)]이 되므로 확률이 0인 사건도 일어날 수 있다. 아래의 '확률 0에 대해'라는 문단 참고.[7] 물론, 주사위를 던졌을 때 7이 나온다던가 하는, 표본 공간 밖의 원소를 뽑는 그런 행위는 당연히 일어나지 않는 확률 0이다. 본문에서 말하는 일어날 수 있는 확률 0에 대한 설명은 아래에서 설명하고 있다.[8] 예를 들면, 소수와 자연수가 둘 다 가산 무한집합인데도 소수 정리를 바탕으로 임의의 자연수를 뽑아서 소수일 확률은 0이라 할 수 있다.[9] 리다이렉트 포함[10] 0.0000000000000000033554432.[11] 좀 더 쉽게, 5지선다형의 20문제(객관식만 있다고 가정할 때)를 찍어서 모두 맞힐 확률은 [math(\left(\dfrac15\right)^{\!20} \approx 10^{-15})] 정확하게는 0.00000000000001048576.[12] 훨씬 더 쉽게, 5지선다형 10문제를 찍어서 모두 맞힐 확률은 [math(\left(\dfrac15\right)^{\!10} \approx 0.0000001)]. 정확하게는 0.0000001024.[13] 2지선다형이라면 [math(\left(\dfrac12\right)^{\!10} \approx 0.001)]. 정확하게는 0.0009765625.[14] 조금 종류가 다르긴 한데 "확률이 1/3이니까 세 판 중 한 판은 따겠지?"라는 생각으로 접근하는 것도 마찬가지 오류를 범하고 있다. 독립 시행 기준으로 세 판을 해서 한 판도 못딸 확률이 무려 29.6%나 된다. ~~반대로 딸 확률이 무려 70.4%나 된다는 소리다.~~[15] 즉, 서로 어떠한 방식으로도 영향을 미치지 않는다면.[16] 앞과 뒤가 섞여서 나올 확률 자체가 1022/1024이기 때문.[17] 확율이라고 쓰면 '화귤'이라고 읽어야 한다.