나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2024-09-02 11:01:51

표준화

정규화에서 넘어옴
1. 개요2. 에디터의 표준화3. 통계학에서의 표준화4. 기타5. 관련 문서

1. 개요

standardization

2. 에디터의 표준화

사용자가 혼란스러워 하지 않도록 윈도우같이 익숙한 OS나 해당 계통에서 유명한 프로그램의 메뉴창이나 단축키 등을 따르지만, 간혹 개발자 편의나 시리즈 전통, 차별화(...) 등의 이유로 Ctrl+Z의 단축키가 Ctrl CV와 동일 기능이거나 하는 경우도 있다. 이 경우 별도의 매뉴얼을 제공한다 해도 손에 익기까지 상당한 시간이 걸린다. 예시로 Ctrl+Y는 일반적으로 실행취소로 취소된 동작을 다시 실행하는 키이지만, 한/글에서는 대대로 커서가 위치한 줄의 내용을 삭제하는 키로 쓰이며, 포토샵에서는 RGB와 CMYK 표시로 변경하는 키로 쓰인다.

3. 통계학에서의 표준화


파일:나무위키+유도.png  
은(는) 여기로 연결됩니다.
관계형 데이터베이스의 정규화에 대한 내용은 SQL/정규화 문서
번 문단을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.
standardization ,standardizing

서로 다른 정규 분포 사이에 비교를 하거나, 특정 정규분포를 토대로 하여 통계적 추정 등의 분석작업을 해야 할 때, 필요에 따라 정규분포의 분산[math((\sigma^2))]과 표준편차[math((\sigma) )]를 표준에 맞게 통일시키는 것으로 이로써 표준 정규 분포가 된다. 정규분포의 치환적분이라고 보면 된다.

표준화(standardization)가 되지 않은 데이터는 비유하자면 늘어났다 줄어들었다 하는 자를 가지고 길이를 재는 것과도 같다. 게다가 서로 다른 단위체계를 가진 서로 다른 연구대상에 대해서도 분석의 호환이 안 된다. 그래서 표준적으로 사용할 수 있는 통계적 단위를 제안하여 그것에 자신의 "자" 를 일치시켜야 하는 것이다. 이 때 모두가 쓸 수 있는 단위로서 제안되는 것이 바로 표준 편차, 즉 시그마(sigma)이다.

즉, 평균을 0으로, 표준 편차를 1로 만들어주는 것이다.
표준화 표본(sample) 모집단
수식 [math(Z=\dfrac{X-m}{s} )]
X:변수, m:평균, s:표준편차
X가 가지는 값과 평균m의 차이가 표준편차s의 Z배.
[math(Z = \dfrac{X(확률변수)-\mu (평균)}{\sigma(표준편차)} )]

어떤 변수든지 원래 값에서 평균을 뺀 새로운 변수를 만들고 그 평균을 구하면 정확히 0이 나온다. 이렇게 변수에서 평균을 빼는 과정을 중심화(centering)라고 한다.

그리고 각 변수(관측치)를 표준편차로 나누는 것을 척도화(scaling)라고 한다.

중심화를 통해서 각 관측치가 평균에 비해서 얼마나 크고 작은지를 확인한 다음 척도화를 통해서 단위 차이를 없앤 숫자를 만들어낸다.

이렇게 계산된 값들은 평균도, 단위도 상관없이 '표준적인 차이'를 의미한다. 어떤 변수를 가져오든 상관없이 표준화를 거친 변수의 평균은 0이 되고 표준편차는 1이 된다.
파일:stdz.jpg

표준화된 정규 분포는 표준 정규 분포(standardized normal distribution) 또는 그냥 z-분포(z-distribution)[1]라고 한다. 정규분포의 최고점으로부터 일정한 거리만큼 멀어지게 될 경우 1시그마, 2시그마, ... 같은 이름으로 불리며, 정규분포상의 특정한 점에서 최고점까지의 거리를 구하는 z-값(z-scores) 같은 것도 있다. 통계학자들은 각 시그마 값이 정규분포 상에서 차지하는 넓이 (-n sigma < z < +n sigma) 같은 것에도 관심이 있어서, 각 시그마 당 몇 퍼센트의 넓이를 차지하는지 정리해 놓기도 했다.

표준정규분포는 평균인 0을 중심으로 좌우대칭이고 종(bell) 모양인데 평균인 0을 중심으로 ±1시그마 내에 속할 확률은 68.27%, 0을 중심으로 ±2시그마 내에 속할 확률은 95.45%, 0을 중심으로 ±3시그마 내에 속할 확률은 99.73%, 0을 중심으로 ±4시그마 내에 속할 확률은 99.9937%, 0을 중심으로 ±5시그마 내에 속할 확률은 99.999943%, 0을 중심으로 ±6시그마 내에 속할 확률은 99.9999998%이다.

산업 현장에서는 여기서 따온 6시그마 같은 개념들도 활용되고 있다.#

수능 표준점수에 활용된다. 물수능 수학 원점 100점과 불수능 수학 원점 100점이 똑같은 100점이 아니다. 예를 들어 불수능 80점과 물수능 100점을 비교해서 어느쪽이 상대적으로 더 잘한 것인지 따질 때 표준화(standardization)란 과정을 이용한다. 예를 들어 2011년에 수학 원점수 80점을 받은 학생과 2015년에 수학 원점수 100점을 받은 학생 중에서 어느 쪽이 상대적으로 잘한 것인지를 표준화를 거쳐 살펴보자. 2011년 수능 수험생들 수학 원점수 평균이 47.8점, 표준편차가 19.7점이었고 2015년 수능 수험생들 수학 원점수 평균은 55.4점, 표준편차는 28.5점이라 했을 때 2011년 80점을 표준화하면 (80-47.8)/19.7=1.63, 2015년 100점을 표준화하면 (100-55.4)/28.5=1.56이 나온다. 시험이 어려울수록 점수는 하향평준화되고 대부분은 낮은 점수대를 형성하고 일부의 고득점자가 생긴다. 그래서 2011년의 평균점수는 47.8점으로 매우 낮고, 표준편차가 19.8점으로 낮다. 즉, 2011년의 80점은 중심(=평균)에서 오른쪽으로 1.63만큼의 거리로 떨어져 있고, 2015년의 100점은 중심(=평균)에서 오른쪽으로 1.56만큼 떨어져있다. 따라서 2011년의 80점이 2015년의 100점 보다 평균에서 0.07만큼 더 멀리 고득점쪽으로 앞서있으므로 상대적으로 더 우수했다고 볼 수 있다. 실제 수능에서는 이렇게 계산된 값에 20을 곱하고 100을 더해서 표준점수를 계산하는데 그러면 평균은 0에서 100으로 바뀌고 표준편차는 1에서 20배 늘어난 20이 된다. 현재 평가원은 이런 방식을 토대로 국어, 수학 등의 과목의 표준점수를 최저 0점에서 최대 200점 사이의 어느 한 수치가 되게 설정하고 있다.#

4. 기타

국유철도운전규칙
제4장 운전
제5조(열차의 운전선로) 상·하열차를 구별하여 운전하는 한쌍의 선로에 있어서 열차의 진로는 좌측으로 하여야 한다. (후략)'''
도시철도건설규칙
제1장 총칙
제5조(열차의 운전 진로) 상행·하행 열차를 구별하여 운전하는 한 쌍의 선로의 경우 열차의 운전 진로는 오른쪽으로 한다. (후략)'''
한국에서는 저렇게 국철과 도시철도의 통행 방향이 다르다. 그래서 서울교통공사코레일수도권 전철 4호선 남태령역 - 선바위역 사이 구간의 꽈배기굴로 인해 표준화의 실패 사례로 수시로 까인다. 자세한 내용은 꽈배기굴, 꽈배기굴/과천선 문서 참조.


최근에는 KTX 이음ITX 마음의 출입문 호환이 안 돼서 부전마산선에서 ITX 마음으로 운행할 때 스크린도어를 다시 새로 깔아야 할 수도 있다는 소문이 들려온다. 이 역시 표준화의 실패 사례에 해당한다.

군경조직에서 표준으로 사용하는 장비나 물건은 제식이라고 부른다.

공업에서의 표준화는 생산품의 품질과 생산능력에 많은 영향을 끼치는데 가장 극단적인 예가 태평양 전쟁의 미군과 일본군이다. 미군은 표준화된 규격으로 M4 셔먼 전차를 만들었고, 일본군은 표준화가 되지 않은 설계로 서로 다른 회사에서 치하를 만들었다. M4 셔먼은 설계상 신뢰성을 크게 확보할 수 없지만 규격화된 생산라인에서 만든 부품들은 어디에서 생산된 부품이라도 서로 호환이 되고, 같은 공구로 생산/수리가 가능했지만[2], 97식 전차는 거의 모든 부품이 호환되지 않아서 보급과 생산에 큰 차질을 빚었다.

5. 관련 문서



[1] Z-disitribution의 평균은 Zero[2] 쉽게 말해 생산지가 다른 대파된 전차 두대를 합쳐서 멀쩡한 전차를 만들 수 있을 정도다.