나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2019-12-01 10:19:02

세이버메트릭스



sabermetrics[1]

1. 개요2. 상세
2.1. 위험성2.2. 사례
3. 말말말
3.1. 2019년 9월 이벤트
4. 유명한 세이버메트리션5. 세이버메트릭스 관련 사이트6. 관련 문서

1. 개요

야구사회과학게임 이론통계학적 방법론을 적극 도입하여 기존 야구 기록의 부실한 부분을 보완하고, 선수의 가치를 비롯한 '야구의 본질'에 대해 좀더 학문적이고 깊이있는 접근을 시도하는 방법론. 기존 주먹구구식 선수 평가론을 전면 부정하고, 야구선수에 대해 좀 더 객관적인 평가를 하기 위해 창안된 이론이다.

어원은 SABR(The Society for American Baseball Research. 미국야구연구협회) + metrics/metrician. 초기에 SABR라는 모임을 중심으로 형성되었기에 이런 이름으로 부른다. 이름에서 알 수 있듯이 세이버메트리션들은 여러 가지 수리적 방법론을 동원해 야구라는 스포츠를 '분자 단위로 분해'하는 것을 일삼는 사람들이다.[2]

2. 상세

The system of keeping batting averages needs a complete overhauling. At present this system merely gives the comparative number of times a player makes a hit without paying any attention to the importance of that hit. Home runs and scratch singles are all bulged together on the same footing, when everybody knows that one is vastly more important than the other. The result is that the records are grossly misleading.
타율을 중요시하는 관점은 완전히 손 볼 필요가 있다. 현재의 시스템은 단지 타자가 안타를 만들어내는 상대적인 빈도만 제공해줄 뿐, 그 안타의 의미와 가치에는 전혀 관심을 기울이지 않는다. 홈런 하나와 행운의 안타 하나는 똑같이 값이 매겨져있지만, 누구나 하나가 다른 하나에 비해 훨씬 더 중요하다는 사실을 알고 있다. 결과적으로 그 스탯은 사람들을 매우 오해하게 만드는 셈이다.

ㅡ F.C. 레인(Ferdinand Cole Lane). 1915년. 원문, 번역본

흔히 빌 제임스가 최초의 세이버메트릭스로 평가받지만, 현재는 F.C. 레인이 최초의 세이버메트리션으로 간주되기도 한다. 그래서 미국야구연구협회는 2012년 레인에게 '헨리 채드윅상(Henry Chadwick Award)'을 수여하기도 했다.[3]

빌 제임스[4]는 "세이버메트릭스는 야구를 객관적으로 이해하려는 시도이다"라고 정의한 바 있다. 이러한 주장을 하는 사람들을 세이버메트리션(sabermetrician)이라고 한다. 속된 말로 야구기록 덕후. 1990년대 이후의 현대 야구는 이들과 떼어놓고 생각할 수 없다. 다만 평범한 사람들이나 가볍게 야구를 즐기는 이들한테는 그저 할 일 더럽게 없는 잉여집단일 뿐(...). 게다가 2000년대 들어서는 세이버매트릭스의 기록 계산법이 절대 진리라고 밀어붙이는 일종의 선민사상을 가진 세이버매트릭스들과 이를 부정하려는 전통 야구관을 가진 야구팬들 때문에 인터넷에서는 세이버매트릭스 진영과 반세이버매트릭스 진영과의 충돌이 수시로 일어나고 있다.

일반적으로 빌 제임스의 Baseball Abstract 시리즈를 세이버메트릭스의 시초로 취급하지만 실제 시초는 1916년 F.C 레인이 '5센트, 10센트, 25 센트, 50 센트를 같은 선상에 두고 비교하는 것이 과연 옳을까?'라는 의문을 시작으로 62경기의 실황 중계를 바탕으로 단타는 0.457점, 2루타는 0.786점, 3루타는 1.15점, 홈런은 1.55점의 가치를 가진다는 것을 밝혀냈다는 것을 야구 통계학 즉, 세이버메트릭스의 시초로 둔다. 라이브볼 시대도 아닌 데드볼 시대타율은 가치없는 지표이며 볼넷과 장타가 중요하다는 매우 앞선 생각을 가진 사람이었다. 그리고 1944년 브루클린 다져스에서 그 당시 단장이였던 브랜치 리키는 야구 역사상 최초로 통계학자인 앨런 로스를 고용해 첫 흑인 선수인 재키 로빈슨을 중심타선에 새우도록 만들었다. 재키 로빈슨이 뛰는 것에 대해 극심한 반대를 한 그 당시 다져스 최고의 선수인 딕시 워커를 트레이드를 시키기까지 했다.

전에 있던 문서에서는 1970년대까지 클래식 스탯만 쓰였으며 세부지표는 거의 안쓰였다 했지만 1944년 브루클린 다져스가 먼저 통계를 사용하기 시작했으며 이 세이버메트릭스라는 단어만 없었을 뿐이지 야구 분석학이라는 세이버메트릭스의 기반이 되는 학문은 1950년대 초부터 각광받기 시작했다. 1954년 <LIFE> 잡지에 위에서 말한 다져스 단장인 브랜치 리키는 로스의 이론에 따른 현대 세이버메트릭스의 기초가 되는 출루율장타율 개념을 10페이지가 넘는 장문의 글에 게시했다. 그리고 조지 린지가 F.C 레인의 이론을 약간 수정한 '득점 기대치' 이론이[5] 나오면서 본격적으로 세이버메트릭스가 시작되었다 볼 수 있다. 언쇼 쿡은 <확률야구>라는 논문에서 야구 작전과 선수 평가에 확률론을 처음으로 접목시켰으며 세이버메트릭스의 기본이 되는 플레이 인덱스를 만들었다. 그의 논문을 본 저명한 작가 프랭크 디포드가 스포츠 일러스트레이트에서 '지금까지의 야구는 틀렸다'라고 할 만큼 큰 파장을 불러일으켰다. 그리고 볼티모어 오리올스에 1969년 얼 위버가 감독으로 취임하면서 통계에 비중을 많이 두었는데 이 시기 오리올스가 통계를 바탕으로 AL 동부를 완전히 독식하면서 다른 팀들도 야구 통계학에 관심을 가지기 시작했다. 그러다 1970년대 들어 빌 제임스를 비롯한 일군 선구자들이 나타나 수학적, 통계학적 방법론을 도입한 새로운 기록 및 통계를 제시하게 되었고, 당시 금융업과 결합하여 급격히 성장하고 있던 미국 통계학계의 야구팬들이 이에 열광하면서 이러한 새로운 통계적 접근이 더욱 발전하게 된다.

이들이 도입한 개념 중 비교적 직관적인 OPS, WHIP와 같은 초보적인 스탯 개념들[6] 은 이제 KBO 야구 중계에서도 흔히 들을 수 있을 정도로 일반화되었다. 하지만 아직 해외에 비해 많이 뒤쳐져 있는데 해외 세이버 메트릭스에서도 유명무실한 타율이나 평균자책점, WHIP나 가지고 판단하는 것을 보면, 더 많은 기록 일지를 보급하여야 하지만, 스탯티즈 사태 이후 망했어요

이들의 통계학적 접근방식은, 과거에는 매우 풍부한 경험을 지닌 현장 야구인 일부만이 어렴풋이 이해하고 있던 야구의 그윽한 경지를 수치화하여 일반인들도 쉽게 접해 이해할 수 있도록 만들었다는 데 가장 큰 의의가 있다. 선수도, 코치도, 기자도 아닌, 그야말로 '단지 야구와 수학이 좋았을 뿐'인 일반인들의 연구가 실제 야구판에 영향을 미쳤다는 점도 높이 평가할 만 하다.

이들의 기여로 인해 바뀐 대표적인 관행이 바로 선수들의 연봉 협상. 이전에는 주먹구구식으로 구단이 책정한 고과가 협상의 기본 자료였다면, 지금의 연봉 협상은 서로가 객관적인 통계수치를 들이대는 법정 싸움[7] 비슷한 것으로 바뀌었다. 물론 KBO의 연봉 협상은 지금도 주먹구구다

지금의 세이버메트리션들은, 모든 플레이 하나하나의 상황을 최대한 객관적이고도 정확히 남겨 세밀한 분석이 가능하도록 하는 데 집중하고 있다. 이에 따라서 필연적으로 세이버메트릭스의 학문화와 전문화가 진행되었는데, 그 부작용으로 야구에 어지간히 관심이 많은 팬들도 이해하지 못하는 어려운 개념과 수학적/통계학적 모델링이 동원되고 있다. 어지간한 계량경제학이나 게임이론 수준까지 도달했다. 일부 수학자들은 이를 논문의 형태로 학계에 발표하기도 했다. 그러다 보니 세이버메트릭스를 접할 수 있는 기회가 늘어난 것에 비해, 일반 야구팬들이 마주하는 심리적인 장벽은 높아졌다고 할 수 있다.

그러나 일반적으로 올드 스쿨, 즉 애매하고 중의적인 흐름을 중요시하는 야구 해설식 분석[8]보다는 세이버메트릭스의 과학적인 접근이 훨씬 더 야구 세계의 진리에 가까워진 경우가 많다. 흔히 통계의 허상을 들이대며 세이버메트릭스를 비판하는 사람들이 있는데, '세이버메트릭스=통계'도 아닐 뿐더러[9] 그런 식으로 통계를 까는 사람들이 가장 허술한 통계인 타율을 신뢰하는 경우가 많다는 점에서 적합하지 못하다. 그리고 사실 세이버메트릭스를 신뢰하지 않는 사람들 중에는 단지 귀찮아서 세이버메트릭스의 주장을 받아들이지 않는 경우가 상당히 있다. WHIP이나 OPS 등의 단순한 스탯이 성공한 것을 고려하면 더더욱 가능성은 높다.

머니볼의 유행으로 오클랜드 어슬레틱스빌리 빈 스타일을 전형적인 세이버메트리션으로 오해하는 경우가 있는데, 이들은 단지 '일정선 이하의 금액을 어떻게 효과적으로 투자할지'를 결정하기 위해 세이버메트릭스를 응용했을 뿐, 이들의 소위 머니볼 스타일이 세이버메트릭스의 전부는 아니다. 더불어 빌리 빈의 오른팔이자 전형적인 세이버메트리션인 폴 디포데스타[10]LA 다저스 단장 노릇을 하면서 구단을 말아먹은 뒤로는, 일선에서는 세이버메트릭스와 전통적인 스카우트 기법을 적절히 섞어 합리적인 운영을 하는 쪽으로 진화하고 있다. 물론 이 빌리 빈 스타일을 통해 스몰마켓의 운영 해법을 찾았다는 점은 의미가 있다.

그리고 빌 제임스와 보로스 매크래컨 등 세이버메트리션들을 대거 기용하고 테오 엡스타인이라는 젊은 단장을 기용한 보스턴 레드삭스가 2000년대 중후반 두 차례 우승을 거머쥐면서 세이버메트릭스의 위상은 추락하기는 커녕 오히려 점점 높아지고 있다. 세이버메트릭스의 성공이라고 하면 일반적으로 오클랜드만 떠올리는데, 오클랜드보다도 많은 영향을 받고 그 이상의 성공을 본 게 보스턴이다. 세이버메트릭스에 호의적이던 존 헨리[11] 구단주가 취임하면서 빌 제임스를 구단으로 끌어 들였고, 빌리 빈을 거액을 들여 단장직 영입을 시도했으며, 이를 실패하자 엡스타인을 단장으로 임명했다. 출루율의 가격이 오르자 수비를 강화하는 현재의 모습 등은 돈에 좀 더 여유가 있는 오클랜드의 그것과 유사한 상황. 헨리 구단주 이전 보스턴이 마초의 팀에 가까웠던 것을 고려하면 밤비노의 저주를 깬 것도 커트 실링의 레드삭스가 아니라 세이버메트릭스라고 봐도 좋을 정도였다.

다만 타격은 OPS, wOBA 같은 간단한 편에 속하면서도 신뢰성이 있는 데이터를 만들었지만, 피칭에 대해서는 DIPS, FIP 등이 많이 누적되었다고 해도 타격에 비하면 부족하며[12], 특히나 수비에 관한 간단한 데이터는 만드는 데 애를 먹고 있다. 기본적으로 수비에 대한 데이타 산출부터 문제인데다, 일반적으로 알려진 수비율도 공을 전혀 건드리지 않으면 그만이고,[13] 빌 제임스가 개발한 레인지 팩터같은 데이터들도 다 장단점이 극명해 변수가 잦은 수비를 비교해 주긴 무리가 따른다. 다만 팀 수비의 경우 DER(수비효율)을 통해 어느 정도 측정이 가능하다. 그런데 이 DER 역시 여러가지 계산법이 있어서 그 방법에 따라 결과가 제각각인 경우가 있다. 깊이 들어가면 ZR, UZR, +/-와 같은 지표가 있지만 이 쪽은 애호가가 아닌 일반 야구팬이 직관적으로 접근하기는 어려운 편이다. 게다가 일정 수준이 넘어가면 대개의 사이트들은 돈 내고 보라는 식으로 진입장벽을 만들어놓기 때문에 일반 팬들과의 단절감은 심화된다.

위에서 언급했듯 세이버메트릭스를 야구 경기보다 통계, 숫자에 집착한다며 비판하는 경우가 있는데, 세이버메트릭스의 핵심은 어떠한 스탯이 선수의 실질적 가치에 가까운 스탯인가를 찾는 것이다. 다시 말해 상대적으로 부정확한 스탯인 타율/다승이 아닌 wOBA/WAR를 보는 게 더 좋다는 것이지, 야구를 보지 말고 스탯만 뒤지자는 것이 아니다. 또한 세이버메트릭션들이 통계를 이용한 숫자놀음을 많이 하는 것도 어디까지나 그 선수의 객관적인 평가를 위한 것일 뿐이다. 가장 좋은 것은 숫자놀음이 아닌 선수의 플레이 그 자체를 보고 선수를 정확히 평가하는 것이지만, 그런 경지에 도달한 사람은 현장의 야구인 중에서도 역대급으로 꼽히는 소수의 몇명 뿐이다. 따라서 차선책으로 통계를 통한 논리적, 합리적 분석을 추구할 수밖에 없는 것이다.

오히려 통계의 허점에 대해서는 세이버메트리션 쪽에서 더 많이 언급하고 있다. 세이버메트릭스에 대한 비판 가운데 많은 수를 차지하는 것이 세이버 스탯에 대한 충분한 이해가 없이 그저 본인의 상식과 다르다는 것을 근거로 이루어지는 형태인데, 세이버메트릭스에서 주로 사용하는 스탯들과 그 스탯을 만들어낸 원리와 공식도 재대로 알아보지도 않고 까는것은 비판이 아닌 비난일 뿐이다. 정작 선수들과 선출 야구인들은 세이버메트릭스를 아는 경우 자체가 적은데다 설명을 들어도 '뭐 그딴 쓸데없는...'이라는 반응을 보인다. 무엇보다 유명한 세이버메트리션 대부분이 비선출이다. 인생을 야구에 바친 야구 전문인들 입장에선 자기들 가지고 수치놀음 하는 이상한 사람들로 보일 뿐.

일반적인 야구팬들 사이에서 언급되는 대표적인 오해의 예로 '타선은 OPS 순으로 나열해야 한다' 같은 것이 있는데, 그 내용 자체도 세이버메트리션 쪽의 의견과는 다르다. <The Book>에서 타석에 서는 횟수와 타석에 섰을 때의 상황을 종합해서 낸 결론에 따르면 1번과 2번, 4번이 가장 중요하며 3번과 5번이 그 뒤를 잇는다. 전체적인 타격 능력이 비슷한 경우 출루에 강점을 가진 선수일수록 앞쪽에 놓으면 좋다. 6~9번은 잘 치는 선수일수록 앞에 두면 된다. 애초에 세이버메트릭스에서는 타순을 중요하게 다루지도 않는데, 연구 결과 효율적인 타선 배치로 인한 이득이 일반적인 통념보다 훨씬 낮게 나타나기 때문이다. 가장 효율적인 타선 조정으로 얻는 점수는 시즌을 통틀어도 5점 미만이다. 결국 이 논제는 세이버메트릭스에 대한 오해 중 하나.

일반적인 야구팬들, 하다못해 세이버메트릭스에 대한 이해가 없던 세이버메트릭스 도입 초창기의 스카우터들도 갖고 있던 오해 중 하나는, 세이버메트릭스가 제시하는 이상적인 선수의 상이 하나뿐이라는 것이다. 대충 그들이 가지고 있던 생각은 '세이버메트릭스가 생각하는 이상적인 타자는 딱 하나인데 2할 중 후반대의 그다지 높지 않은 타율, .360~.380 수준의 높은 출루율, .420~.460 수준의 적당한 장타율재미없는 선수가 그것이다' 라는 것. 세이버메트릭스에 대한 반감을 가지고 있던 스카우터들은 세이버메트리션과의 대담을 나누는 자리에 나와서 '너네들 방법으로 뽑는 선수는 다 똑같을 거다. 우리는 슈퍼스타를 뽑아낼 수 있지만, 이제 야구는 다 재미없어지고 똑같은 애들만 뽑게 될 거다' 라는 뉘앙스로 비꼬기도 했다. 물론 이건 세이버메트릭스를 모르기 때문에 나온 촌극이자 무시. 오히려 세이버메트릭스는 이전에 무시받던 유형의 선수에게도 중요한 가치가 있음을 알려주며, 더 다양한 선수들의 유형이 등장하게 만들었다. 일례로 2017년 7월 3일 기준, 코디 벨린저는 .262, .335 라는 낮은 타율과 출루율을 기록중이지만 미친듯한 홈런 퍼레이드로 .633의 장타율을 기록 중이다. 코리 시거는 벨린저만큼 홈런을 많이 치진 못하지만, 타/출/장이 거진 3/4/5 에 수렴하는 밸런스 잡힌 성적을 보여주고 있다. 다니엘 머피는 볼넷을 거의 얻지 못하며 출루율 따위는 개나 주라는 듯한 타석 접근법을 보여주고 있지만 .334 라는 미친듯이 높은 타율로 출루율 역시 .387 을 유지하고, .569 의 뛰어난 장타율을 보여주고 있다. 이 세 선수는 각각 일발 장타형 홈런 타자, 어줍잖은 밸런스 타자가 아닌 타출장 3/4/5 의 완벽한 밸런스 형 타자, 미친듯이 높은 타율과 꽤나 좋은 파워를 보유한 타자로 제각기 판이한 모습을 보여주고 있지만, 세이버메트릭스로 분석한 이들의 리그 평균 선수 대비 타석 효율은 각각 146%, 143%, 142% 로 매우 비슷하다.

세이버메트릭스가 선수 능력을 수치화하는데 유용한 도구인 것은 분명하지만, 세이버메트릭스를 지나치게 맹신하는 것도 지양해야 할 것이다. 예를 들어 세이버메트릭스의 아버지 빌 제임스는 2017년 한국 언론과의 인터뷰에서 데이터로 사람을 평가한다는 것은 매우 어려운 일이며, 세이버메트릭스를 이용한 선수 평가 역시 틀릴 수도 있다는 것을 인정해야 한다고 말하였다.[14] 기사 링크 물론 어디까지나 세이버메트릭스만으로 평가하기 어렵다는 뜻이고, 현장에서 수집한 정보 등의 다른 정보와 합쳐지면 평가하기 상당히 좋아지며, 최소한 타율이나 타점, 승이나 평균 자책점만 보고 평가하는 것보다는 비교할 수조차 없을 정도로 신뢰도가 높다는 것은 변하지 않는다.

자세한 것은 야구의 기록 계산법 참조.

참고로 류현진에 의하면 2010년 후반 통계 분석이 치밀한 편에 속하는 다저스는 다음과 같은 수준이라 한다.
단순히 A란 타자가 B 투수 상대로 몇 타수 몇 안타인지 같은 기록은 데이터 축에 들지도 않는다. 투수의 구속과 회전수, 회전축, 가로와 세로 무브먼트, 릴리스포인트를 전부 데이터화해 계산에 넣고 타자의 스윙궤적까지 측정해 계산한다. 이렇게 투수와 타자, 구종에 따라 세세하게 예측한 시뮬레이션을 바탕으로 매 경기의 계획과 전략을 세우고, 시나리오를 짜서 경기에 임하는 게 요즘 MLB 구단이다. 물론 이렇게 분석해도 이따금 지난해 포스트시즌처럼 아쉬운 결과가 나오긴 하지만, 단순히 ‘감’에 의존해서 불합리한 선택을 하는 과거 방식과는 비교가 되지 않는다.#

2.1. 위험성

세이버메트릭스는 어디까지나 성적을 분석하는 하나의 툴일 뿐이다.[15]

세이버메트릭스 신봉자들이 범하기 쉬운 대표적인 오류가 '찾지 못한 인과관계는 없는 것이다'라고 성급히 결론짓는 사고 경향이다. 세이버메트릭스는 수치화 된 근거로 분석하는 객관성과 다각도에서 분석하는 다양성이 장점이다. 근거 없는 감에 의존하는 기존 사고방식을 배제하므로 위력을 발휘하지만, 문제는 이러한 장점을 맹신하면 명확한 인과관계를 수치로 제시하기 어려우나 실제로는 존재가 긍정되어온 것조차 부정하게 된다는 것이다.

예를 들어 머니볼로 우승하지 못하는 이유도 인과관계를 찾지 못했기 때문에 단순히 운이 없었다고 결론짓는데, 전혀 사실이 아니다.링크 저 자료는 인과관계를 못 찾았다고 해서 없다고 섣불리 결론짓는 자세가 얼마나 위험한 것인지 보여준다.[16] 즉, 우승하기 위해 현장에서 필요하다고 생각되었던 요소들, 에이스/수비/특급 마무리 투수는 실제로도 우승과 유의미한 관련이 있다. 단지 설득력있는 하나의 지표로 제시하지 못했던 것 뿐이다.

올바른 세이버메트리션의 관점이라면 '찾지 못한 인과관계는 없는 것이다'가 아니라 '없을 수도 있다'로 접근하는 것이 바람직한 태도이다. 세상에는 밝혀진 법칙보다 그 원리가 명확하지 않지만 인과관계가 있는 것으로 추정되는 가설의 숫자가 압도적으로 많다.

2.2. 사례

DIPS 이론의 기반이 된 'BABIP 투수 통제불가론'이 대표적이다.

선수 능력을 수치화하여 평가하는 세이버메트리션에게 투수는 BABIP에 영향을 미칠 수 없고, 특급 투수와 패전처리 투수의 BABIP은 동일하다는 급진적 주장은 매우 매력적이었다. 세이버메트릭스는 야구의 상식과 동떨어진 주장이 수치화 된 자료로 입증될 때 가장 돋보이기 때문. 클래식 스탯인 타율이란 지표가 세이버메트리션에 의해 출루율로 대체된 것처럼 ERA도 DIPS로 대체 될 것이라고 섣불리 단정한 것이다. 더욱이 DIPS는 투수의 성적을 예측 할 수 있다는 점에서 더욱 각광받았다.[17] 성적이 좋은 투수를 ERA와 FIP 간에 괴리가 크다고 플루크 시즌이라고 폄하하고, 성적이 나쁜 투수를 FIP가 좋다고 성적이 회복될 것이라고 낙관론을 펼치기도 했다. 후속 연구결과에서 DIPS 이론에 문제점이 발견되면서 이런 주장은 근거가 없어져버렸는데, 무려 1/3에 달하는 투수가 BABIP을 통제 할 수 있다는 사실이 밝혀진 것이다. 결국 BABIP 투수 통제불가론은 폐기되었고, DIPS 이론 맹신의 후폭풍도 결코 작지 않은 상황이다.[18] 최근에는 ERA 대신 FIP 만으로 투수를 평가하자고 주장하는 세이버메트리션은 없다.

3. 말말말

대부분의 구단들이 큰 결정을 내릴 때 세이버메매트릭스를 기준으로 삼는다. 물론 선수한테 세이버메트릭스가 도움이 될 때가 있다. 예를 들어 구단이 선수를 지원하고 정보를 공유해줄 때, 나도 그런 정보를 통해 배우는 부분이 있다. 구단이 선수의 의견을 존중하고 정보를 제공한다면 좋은 결과가 뒤따르기 마련이다. 그러나 선수와의 대화 없이 선수보다 세이버메트릭스를 앞세운다면 어느 지점에서는 충돌이 빚어질지도 모른다. (숫자의 한계를 의미하는 건가?) 그렇다. 예를 들어 숫자로 봤을 때는 내가 수비면에서 많이 뒤떨어진다고 하는데 경기에서 내 모습을 직접 본 동료들, 코치들, 심지어 상대팀 선수들은 전혀 그렇게 생각하지 않는다. 숫자가 다 담지 못하는 것들이 존재하기에 그들이 내게 그런 말을 하는 게 아닐까 싶다. 세이버메트릭스가 도움이 되지만 나는 다른 선수들의 의견이나 코치들, 감독의 의견도 중요하다고 생각한다. 33세란 나이는 선수로서는 많아 보여도 사회에 나가면 젊은 축에 속한다. 야구에서는 나보다 나이가 많지만 여전히 훌륭한 성적을 보여주는 선수들도 있고, 나이가 어리지만 나보다 성적이 뒤떨어지는 선수들도 있다. 즉 나이가 전부는 아니라는 얘기다.
애덤 존스 #

LA 다저스는 타 팀에 비해 최첨단 통계자료 활용을 중시한다. 연구원처럼 보이는 50여 명의 다저스 구단 리서치팀이 경기력 향상을 위해 다양한 분석자료를 내놓는 시대다. 예전에는 상상도 못했던 것이다. 하지만 아직도 많은 팀들이 다저스처럼 세이버메트릭스 자료를 신봉하는 것은 아니다. 예를 들어, 세인트루이스 카디널스는 포수 야디어 몰리나의 리드에 많이 의존하는 것으로 알고 있다. 통계자료에만 의존하는 것이 꼭 바람직한 것은 아니다. 요즘은 선수를 스카우트할 때 ‘숫자’로 평가할 수 없는 투지, 승부욕, 동료와 관계 등은 잘 보지 않는다.
클레이튼 커쇼 #

타율 3할 5푼을 치는 타자와 처음 상대해도, 데이터 분석에서 나온 대로 던지기만 하면 거의 100% 삼진을 잡을 수 있다.
류현진 #

요즘 야구에서 데이터에 의존하는 부분이 과도하고 야구는 의외성의 경기. 데이터에 지나치게 의존하는 것도 재미를 떨어뜨릴 수 있고, 이에 대응해 새로운 규정이 나오는 것도 달갑지 않다.
추신수 ##

투표권을 가진 기자들 중 내셔널리그 담당은 내 모습도 보지 못했을 것이며 언젠가 세이버메트릭스가 나를 도와줄 시기가 오길 바란다.
에드가 마르티네스 #

야구에서도 ‘유행’이라는 게 있다. 예를 들어 몇 년 전에는 유틸리티 선수들이 인기를 끌던 시절이 있었다. 매 경기마다 다른 포지션을 소화할 수 있기 때문이다. 몇몇 구단들이 유틸리티 선수들의 활약 덕분에 좋은 성적을 거뒀고 그것을 본 다른 구단들도 유틸리티 선수들을 영입하려고 많은 노력을 기울였다. 그러나 유틸리티 선수들을 영입했다고 해서 모든 구단들이 성공하지는 않았다. 세이버메트릭스와 선수들에 관한 통계들도 마찬가지다. 나 또한 내 기록 관련해서 통계들을 살펴봤는데 아직까지도 WAR(대체승리기여도)의 숫자가 높다는 게 확실히 어떤 부분을 의미하는지 잘 모르겠다. 시간이 지나도 선수에게 중요한 것은 ‘야구의 정석’이라고 생각한다. 공을 얼마나 잘 치는지, 수비를 얼마나 잘하는지, 공을 잘 던지고 있는지 등 야구의 기본에 충실하지 않다면 그 숫자들은 아무런 의미가 없다. 유행을 따라가기만 하는 것보다는 기본을 단단히 정립하는 게 더 중요하다.
찰리 블랙먼 #

케미스트리를 위한 세이버메트릭스는 없다.
자니 곰스 #

구단에서 제공하는 통계자료는 무시하는 편이다.
마이클 와카 #

그런 분석 데이터 숫자들을 보유하고 있는건 구단들만이 아니다. 선수들과 에이전트들도 그 숫자들을 갖고 있고, 똑같은 지식을 보유하고 있다.
댈러스 카이클 #

생각했던 것과 메이저리그가 달랐다. 한국에서 보던 것과 너무 달랐다. 플래툰이 철저했고 수비 시프트를 많이 사용했다. 데이터 활용이 생각보다 훨씬 많았다.
박병호 #

프런트와 같은 것을 믿고 있고 같은 목표를 갖고 있다. 데이터 분석과 세이버 메트릭스에 대해서도 완전히 열린 마음을 갖고 있다. 라인업을 구성하기 전 최대한 많은 정보를 갖기 원하지만 최종 책임은 내가 지는 것.
데이브 로버츠 #

만약 우표에 관심이 있는 사람들이 우표 수집을 하고, 몸집이 큰 사람들이 스모를 좋아한다면, 통계를 좋아하고 시시콜콜한 정보에 관심 있는 사람들은 야구에 끌릴 것이다.
스티븐 제이 굴드

내가 각 숫자들에 접근하는 방식은 기계공이 멍키스패너를 들고 일을 시작하는 것과 크게 다르지 않다. 내가 시작하는 것은 늘 내 눈으로 직접 목격하거나 그 곳에 있었던 사람들의 목격담을 듣는 것이 가능한 경기들부터이다. 그리고는 스스로에게 묻는다. 이것은 진실인가? 그것을 증명할 수 있는가? 측정이 가능한가? 이것은 내 기계 전체 구조와 어떻게 들어맞는가? 그리고는 이에 대한 해답을 얻기 위해 각각의 기록들을 파고든다. (중략) 오늘도 야구는 수많은 기록들을 만들어내고, 사람들은 그에 대해 무척 많은 것을 이야기하고, 논쟁하거나 생각한다. 그런데도 왜 사람들은 그 자료들을 이용하지 않고 있는 것일까? 또는 왜 아무도 이런저런 자료들을 앞에 놓고 그것을 '증명해볼 것'을 요구하지 않는 것일까?
빌 제임스, 1979 Baseball Abstract 중

데이터는 신비로운 마법도 절대적 진리도 아니다. 대신 "당신 야구 얼마나 해봤는데?" 라고 묻지도 않는다. 그것은 편견 없는 소통의 언어이며 협력의 플랫폼이다.
신동윤 한국야구학회 데이터분과장.

세이버매트릭스라는 건 확률이잖아요? 그래서 믿을수가 없어요.
안경현 SBS Sports 야구 해설위원.[19]

3.1. 2019년 9월 이벤트

9월 16일(한국 기준) LA 다저스-뉴욕 메츠 경기는 미국 스포츠전문채널 ESPN의 '선데이 나이트 베이스볼'로 미국 전국에 생중계됐다. 경기가 진행되는 도중 ESPN은 다저스와 메츠 선수들에게 세이버메트릭스 전문 용어들을 묻는 영상을 방송에 내보냈다. 다저스 선수 중에는 켄리 잰슨, 코디 벨린저, 맥스 먼시, 워커 뷸러, 키케 에르난데스 등이 출연했고 메츠 선수 중에서는 피트 알론소, 토드 프레이저, 노아 신더가드 등이 질문에 답했다.
ESPN은 출연선수들에게 낱말 맞추기 형식으로 FIP, wOBA, wRC+ 등 용어의 알파벳 첫 글자만 알려주고 나머지 뜻을 질문했다. 출연한 선수들 대부분은 용어들의 뜻을 추측하며 FIP(수비 무관 평균자책점:Fielding Independent Pitching), wOBA(가중출루율:Weighted On-Base Average), wRC+(조정득점생산력:Weighted Runs Created Plus) 등을 전혀 알지 못한다고 응답했다.
다저스 투수 워커 뷸러만이 유일하게 모든 질문에 정답을 제시했다. 뷸러는 다저스 선수들 중에서도 세이버메트릭스 자료들을 신봉하는 것으로 알려져 있다. 팀 동료 키케 에르난데스는 wRC+를 묻자 "뷸러가 말한 것이 정답일 것"이라고 웃으며 응답했다. 그리고 에르난데스는 wOBA는 가중출루율(Weighted On-Base Average)이라고 올바르게 대답하면서도 "정확한 의미는 모르겠다. 하지만 연봉 중재시 중요하다는 것은 알고 있다"고 장난 섞인 응답을 내놓았다.#

4. 유명한 세이버메트리션

4.1. KBO 리그

4.2. 메이저 리그 베이스볼


참고로 이들을 포함한 수많은 세이버메트리션들은 상당수가 특정 구단이나 언론사 등에 고용되어 일하고 있다. 업계에서 세이버메트리션들이 가진 가치를 알아주기 시작하면서 덕업일치의 길이 열린 셈인데, 세간에 알려진 WAR 계산법이라던지 역사적 상수 계산법이라던지 등등을 아마추어의 정보력만으로 이들에 준하는 수준으로 섭렵하는 데에는 한계가 있음을 인정하는 것이 스스로의 정신건강에 이로울 것이다. 이들은 단순한 야덕이 아니라 빅리그 구단에게 고액의 페이를 받는, 학계에서 최고로 꼽히는 인재[25]들이다. 이들은 지금도 일개 아마추어 라이트팬들이 생각하지도 못하는 관점에서 DIPSWAR 같은 세이버메트릭스의 히트작들을 까내리며 뜯어고치고 있다. 까놓고 말해, 선수나 코칭스태프들이 부상 숨기고 팀내의 트러블 숨기는 것처럼 세이버메트릭스 업계에서도 영업기밀이 많다. 만약 이 글을 읽는 이가 새로운 발상을 떠올려서 인터넷에 게시했다면, 그리고 그것이 영어로 어째저째 괴수들의 눈과 귀에 들어갔다면, 흔한 천조국 야구팀의 정보요원들에게 납치되어 평생 직장을 얻을 수도 있다.
역으로 말하자면 인터넷의 열린 토론 공간에서 자신의 정보를 널리 퍼뜨리던 사람들이 구단 산하로 들어가면서, 구단과 외부의 정보격차가 점점 벌어지고 있다는 비판도 나온다. 타구, 투구, 수비를 분석하기 위한 천문학적 비용의 분석도구 들이 구단들에서만 돌고 외부로 풀리고 있지 않은 상황에서, 인적 자원마저도 구단 내부로 들어가면서 2010년대 세이버메트릭스 발전은 정체되어 가고 있다고 해도 과언이 아니다.
대표적인 세이버메트릭스의 장점과 한계를 보여주는 것이 스탯캐스트이다. 빅데이터 분석, 레이더 추적, 심박수 측정 등 야구 분석지 정도 보는 것으로는 답이 없는 자료가 생성 축적되기 시작했고, 여기 접근할 수 있는 사람과 없는 사람의 정보 격차가 안드로메다처럼 벌어졌다. 일부가 공개되기도 하지만 진짜 주요한 정보는 공개되지 않는다고 봐야할 것이다. 단적으로 한국에도 스탯캐스트의 기본이 되는 트랙맨 시스템을 도입해서 구장에 설치한 구단이 몇몇 있지만, 이중 대중에 공개된 자료는 전혀 없다.

4.3. 일본프로야구

5. 세이버메트릭스 관련 사이트

5.1. KBO 리그

5.2. 메이저 리그 베이스볼


다만 해외 사이트들 중에는 연간 일정 금액을 결제해야 고급 정보를 열람할 수 있는 사이트들이 많이 있으니 이용에 있어 유의할 것.

5.3. 일본프로야구

6. 관련 문서


[1] matrix와 혼동하여 세이버트릭스라고 쓰는 경우가 많은데 metrics이므로 세이버트릭스가 옳은 표기이다.[2] 참고로 농구에도 비슷한 부류의 학파(...)가 있는데, 그 쪽은 APBR메트릭스라 부른다. APBR는 Association for Professional Basketball Research의 약자다. 세이버라는 독음과 달리 간단히 읽기에는 영 좋지 않은 약자다보니 그냥 APBR메트릭스라고만 부르는 모양.[3] 오늘날 통용되는 야구 기록법을 창안한 헨리 채드윅을 기념하여, 야구 연구에 기여한 인물을 대상으로 수여되는 상이다. 2009년에 제정되었다.[4] 흔히들 빌 제임스를 세이버메트릭스의 아버지라 부르지만 빌 제임스는 자기 자신을 세이버메트릭스의 아버지 또는 개척자라 말한 적은 없다. 그거 높은 평가를 받는 이유는 세이버메트릭스라는 용어를 제안했으며 대중성을 확보했기 때문이지, 세이버메트릭스를 처음 만들어서가 아니다.[5] 여기서는 단타 0.41점, 2루타 0.82점 ,3루타 1.06점, 홈런 1.42점.[6] 이들은 엄밀히 말하자면 세이버메트릭스 스탯이 아니다.[7] 이는 사실 비유하는 말이지만, 연봉조정 등의 여러 절차나 MLB 사무국에 구단의 횡포를 제소하는 행동을 보면 정말로 법정 싸움과 같은 모습이 되고 있다. 또한 MLB에서 활동하는 에이전트들은 대개가 로스쿨을 나와서 변호사 자격증을 갖고 있다. 대표적으로 스캇 보라스.[8] 하일성의 해설을 떠올려 보라. 편안하다고는 할 수 있어도 절대 정확하지는 않다.[9] 세이버메트리션들은 야구 기록 못지않게 야구 역사의 덕후이기도 하다. 일례로 위의 제임스의 경우 Historical Baseball Abstract라는 엄청나게 두꺼운 책에서 120년 간 MLB와 니그로리그를 역사 서술의 방법으로 분석했다. 또한 미국의 SABR에서는 동양 야구, 19세기 중반 야구, 유니폼의 역사, 야구선수 개개인의 biography 등 통계연구 이외에도 다양한 연구 분과를 두고 있다.[10] 그리고 2016년부터 NFL 클리블랜드 브라운스에서 일하고 있다.[11] 금융가로서 선물전문가다.[12] 이 차이를 극명하게 느낄 수 있는 가장 쉬운 방법은 MLB 통계 사이트의 양대산맥이라 볼 수 있는 팬그래프와 베이스볼 레퍼런스의 WAR을 비교해보면 된다. 타자의 WAR은 대개 10% 이내, 많아야 20% 수준의 차이가 날 뿐이지만 투수의 경우 심한 경우 두 배 가까운 차이가 나기도 한다.[13] 에러를 할 수 있는 가장 좋은 방법은 공을 잡을 수 있는 위치에서 공을 잡으려고 시도하는 것이라는 이야기까지 있다. 때문에 세이버메트릭스에서는 초기부터 에러를 클러치 히터로 표현되는 타점과 함께 극도로 불신하는 성향을 보인다.[14] 국내 사례만 봐도, 세이버메트릭스에 기반해 외국인 선수를 영입한 NC 다이노스의 2018년 외국인 선수 영입이 실패한 것만 봐도 알 수 있다.[15] 툴은 어디까지나 분석하는 도구이므로 그 결과를 신봉해서는 안된다.[16] 오클랜드 어슬레틱스가 20년 동안 월드 시리즈에 나가지 못하는 이유를 단순히 운이 없다고 볼 수는 없다. 같은 스몰 마켓팀인 캔자스시티 로열스는 그 기간 동안 2차례 월드 씨리즈에 나갔고 한 번은 우승했다.[17] 미래를 예측하는 지표는 스포츠 이외 영역까지 확대해도 극소수에 지나지 않는다.[18] 더 이상 땅볼이나 내야 뜬 공 투수를 무시 할 수 없어서 DIPS를 보완하는 연구가 진행되고 있지만 아직까지 뾰족한 방법이 없는 상태이다. FIP 추종자들은 FIP와 변형 DIPS 간에 유의미한 차이가 없으니 FIP가 우수하다거나 대안부재로 그냥 FIP를 쓰자고 주장한다. 하지만 BABIP에서 장타/단타를 구분하지 않아서 땅볼투수의 FIP가 무차별해진 것이지 영향력이 없는 것이 아니다. 대안부재로 FIP를 써야한다면 장시간 검증되어온 ERA가 이미 있다.[19] 한 가지 간과해선 안 되는 사실이 있는데, 세이버메트릭스가 통계인 건 맞지만, 확률과 같은 수많은 데이터를 하나로 집계한 것이 통계이다. 즉, 통계를 내는데 각종 확률들이 통계 안에 들어간다는 것이다. 그리고 안경현은 세이버매트릭스가 고안해 낸 각종 야구의 기록 계산법을 객관적인 통계가 아닌 확률이라는 우연성으로 치부해 버리는 발언 때문에 세이버메트릭스와 이를 잘 이해하는 야구팬들부터 무수한 비판을 받고 있다. 적지 않은 야구 팬들은, 안경현을 현대야구에 뒤쳐진 상당히 구시대적인 야구관을 가졌다 평가 한다.[20] 사이언스북스에서 단행본으로 나오기도 했는데, 통계 책보다는 야구 책으로서의 성격이 더 강하다.[21] 스포츠 바깥 영역에서도 놀라운 성과를 냈다. 2008년과 2012년의 미국 대통령 선거 선거인단 배정 예측에서 완벽에 가까운 적중률기록. 다만 2016년 선거 예측은 틀렸다[22] 또한 스포츠 중심 포털이라는 간판답게 파이브서티에이트에서 독자적으로 통계에 기반한 축구 칼럼을 쓰기도 했는데(네이트 실버 본인이 쓴 건 아니고, 소속 필진이 쓴), 몇몇 칼럼이 번역되어 국내 축덕들에게 상당한 관심을 끌기도 했다.[23] 정치 평론가로도 유명하다. 2003년부터 2011년까지 MSNBC에서 <Countdown with Keith Olbermann>이라는 뉴스 평론 프로그램을 본인의 이름을 걸고 진행했었다. 이때 상당히 강성이어서, 빌 오라일리 등으로 대표되는 폭스 뉴스와 대립각을 세웠고, 조지 워커 부시 정부와 08년 대선 당시 공화당 부통령 후보였던 세라 페일린은 올버만에게 두고두고 씹히는 안주거리였다. 유투브에서 검색만 해도 영상이 쏟아질 지경.[24] 올버맨과 코스타스는 1992년부터 1997년까지 ESPN의 레전드 심야 스포츠정보프로그램 'Sportscenter'를 함께 진행했다. 이후 지금도 숨겨왔던 나의 절친.[25] MBA 출신도 많고, 통계학, 컴퓨터 공학, 물리학 같은 이쪽 관련 학문의 석박사 학위를 가진 이들도 부지기수다. 월 스트리트실리콘 밸리에서도 이들을 두고 스카우트 경쟁을 할 정도.[26] 참고[27] Expected wOBA. 타구의 속도와 각도를 기반으로 1루타, 2루타, 3루타, 홈런 등을 다시 구해 wOBA 공식에 적용시킨 스탯. 구장 효과, 상대 수비, 타자 본인의 스피드 등이 배제된 '타구의 질'을 구하는 스탯[28] 타구의 비거리, 체공 시간으로 구한 '포구 확률'을 기반으로 외야수의 포구 능력을 평가한 스탯.