cat tag


뒤늦은 머니볼 메호대전(메시 vs 호날두) 내맘대로 뉴스논평

http://news.zum.com/articles/54515065?cm=newszum
<우클릭후 새탭에서 열기를 클릭해 주세요>
<슈퍼 컴퓨터로 분석했더니 메시가 호날두보다 2배 뛰어나다는 결과>

언론사를 비판하는 내용은 아니라는 것을 미리 밝혀 두고 싶습니다. 즉, 다시 말해서 이런 기사가 나오는 것이 문제가 있다는 것은 아닙니다. 외국에서 이렇게 분석했다라는 것을 알려주는 것은 무리가 없지요.

두 선수 모두 축구에서는 엄청난 능력이지만 축구외적에서는 두 선수 모두 순탄치는 못했어요. 메시는 병으로 인해서 피지컬적 능력의 한계를 가지고 있었고, 호날두는 뛰어난 재능이 오히려 유소년팀 시절에 왕따를 당했다고 하지요.

하지만 축구적인 재능에는 월드클래스급이나 최근에 날강두 문제가 한 번 있기는 했었지요.

그래서 한국에서는 더욱 메호대전의 결과를 찍었다라는 결론도 있어요.

여기에 슈퍼 컴퓨터도 메시를 선택했다고 하지요.

그런데 여기에 대해서 한번 이야기해 보려고 합니다.

이런 부분은 데이터를 분석한 것입니다. 비슷하게 야구에서는 머니볼이 있어요. 선수들의 데이터를 모두 모아서 그 선수가 어떤 선수인가 분석하는 것이지요. 그것으로 이 선수가 가치가 있는가? 없는가? 라는 부분을 분석합니다.

여기에서 애쓸래틱스의 빌리빈이 머니볼로 좋은 성적을 냈기 때문에 항상 이야기를 들어요. 이런씩의 분석이 슈퍼 컴퓨터를 이용한 분석이지요.

그런데 슈퍼 컴퓨터라는 것은 의미가 없고, 사실 어떤 방식으로 분석했느냐? 하는 것이 중요한 것이에요. 그것을 PC로 하면 더 늦게 결과가 나올 뿐 달라지는 결과가 나오는 것은 아니에요. 슈퍼 컴퓨터라는 말이 가지는 우리의 감정을 자극한 부분이 있고 슈퍼 컴퓨터 자리에 인공지능이 붙어도 똑같은 것이지요. 여러분의 감정을 자극했지만, 그것이 완벽하다라는 부분은 아니라는 것을 살펴보자는 것이지요. 즉, 어떤 방식으로 최고의 선수를 뽑기 그 변수는 어떻고 그 변수에 어떤 가중치를 주었나? 에 따라서 결과는 매우 달라지는 것이라는 것을 말해보려 합니다.

만년 하위팀 애쓰래틱스가 상위권으로 도약하고 신인선수들의 결과가 잘 뽑았다라는 것이 머니볼이 좋게 평가되는 이유이지요.

그런데 이것이 데이터를 이용한 행태론이 된다는 이야기인가? 라는 부분에 대해서는 살펴봐야 하겠지요.

여기에서 2002년은 빌리빈이 머니볼을 했던 시즌이고 영화로 만들어진 시즌이지요.

행태론이 맞다면 이때부터, 애쓰래틱스는 선수에 대해서 정확히 판단하고 다른 팀보다 더 좋은 결과를 얻어야 할 것입니다.

야구에서는 축구보다 더 많이 데이터가 일반화되어 있어요. 타율, 홈런, 장타율, 출루율등 많은 것을 통계에 적용하고 있어요. 그래서 이러한 통계자료를 분석하면 좋은 선수가 보인다고 생각하는 행태론을 적용을 한 것이 바로 머니볼이에요.

이것은 인공지능 개발자들이 하는 것과 유사하고 행정학에서 행태론과 비슷합니다. 하지만 결과는 보통이상은 되었지만, 우승을 하는것은 무리가 있었다라는 것이지요.

<우클릭후 새탭에서 열기를 클릭해 주세요>
<2002년 애쓸래틱스 드래프트 결과>

신인 선수들은 드래프트를 통해서 프로팀에 오게 됩니다. 팀의 성적이 나쁜 팀부터 드래프트를 한명씩 하면서 선수를 되려와서 육성해서 그 선수들이 성장해서 나중에 MLB에서 뛸수 있게 되지요. 그런데 여기에서 애쓰래틱스가 2002년도에는 트레이드를 하면서 대신 드래프트 1픽을 받아온것이 많아요. MLB에 뛰는 뛰어난 선수들을 다른 팀에 보내는 대신 너희 1픽을 우리에게 줘~! 같은 것이지요. 그래서 1라운드 지명이 7명이에요. 다른 팀은 1라운드에서 팔아버린 팀은 1라운드에 지명도 못하거나 혹은 한명 지명하는데 애쓸래틱스는 무려 7명을 지명한 것이에요. 샌드위치 픽(다른 팀이 모두 1라운드 지명후에 지명하는 것)을 포함해서 말이지요.

그래서 2002년도에 1라운드 픽 7명 + 45라운드 지명해서 MLB에 몇명 갔는냐? 하면 13명이에요. 52명 중에 13명 갔다는 것이지요.

<우클릭후 새탭에서 열기를 클릭해 주세요>
<2002년 화이트 삭스 드래프트 결과>

화이트 삭스는 1라운드 픽을 1명 했어요. 그런데 12명의 선수가 MLB에 갔지요. 머니볼이 1라운드 지명 7명 하고도 1명 한팀과 거의 비슷하지요. 7명이라는 특수성이 있어서 애쓸래틱스가 그 년도에도 가장 많은 선수를 MLB에 보내기는 했지만 다른 팀들도 1라운드 7명을 지명했다면 몇명을 더 보냈을지 몰라요.

더욱 중요한 것은 애쓰래틱스가 그 후로 10명 이상 MLB까지 등록된 선수를 만들어낸 연도는 2004년과 2008년 뿐이에요. 머니볼 하고 인공지능 한다고 대단할 것 같죠? 결국 이것이라는 것이에요. 인공지능이 마치 정확하고 엄청난 결과를 만들어낼 것 같잖아요. 현실이 이렇다니까요.

머니볼 영화에서도 이야기합니다.(제가 좋아하는 영화중 하나. 이유는 다음 이유로^^) 지금까지 저 평가 되었던 선수. 이러이러하면 미래에 좋은 야구 선수가 될 것이라고 생각했던 선수. 잘 달리고, 공 빠르게 던지는 선수가 아니어서 저평가 되었던 선수. 이 선수들에게 애쓸래틱스가 기회를 주고 좋은 성적을 거둔것을 중점으로 홍보했어요. 사회가 사람들의 능력의 검증을 제대로 하지 못하는 문제로 문제아들, 즉, 이런 사람들은 성공하지 못한다이지만 실제로는 엄청난 능력을 발휘하는 선수들을 이야기하는 것이지요. 사회에서 기회를 안주어서 능력을 발휘하지 못한 사람들이 성공하는 영화라고 홍보했어요.

출루율등은 야구에서 별로 신경을 쓰지 않았어요. 그러나 1루에 나가는 확률의 60% 가량이 포볼로 나가는 출루율이라는 통계에 의해서 나타나는 부분에 결정된다는 것이지요.

이러한 부분으로, 과거 특징, 출루율이 좋은 선수는 미래에도 출루율이 좋을 것이다라는 가정에서 출발해서 그런 선수들을 애쓰래틱스에서 모아서 팀을 꾸려서 하위권으로 상위권으로 보내지요. 문제는 우승이 없어요. 왜? 그것이 답이 아니었기 때문이지요.

행태론이 가지는 문제. 사람의 행태에서 과거를 통해서 미래를 본다는 부분에서는 이것이 사람에 해결책이 아니라는 것이에요.

이 이유는 과학적으로도, 현실적용에서는 행정학에서 국가가 행태론을 해봤던 과거에서도 결과는 분명히 행태론으로는 사람의 성장가능성들을 정확하게 판단할 수 없는 것이에요. 과거 행태로 미래는 안되지요.

단, 사회가 차별을 통해서 특정 능력을 폄하하고 인정하지 않음으로써 문제선수로 꼽혔던 선수들중 여러가지 능력의 대한 검증을 하고 능력이 있는 사람들을 선별할 수 있는 새로운 기준을 만들었다는 것에서는 머니볼이 기여는 했지만, 그것이 강팀이 되어가는 완벽한 이론이 안되는 것이지요.

머니볼의 장점은 기존의 선수를 선별하는 작업에서 출루율(선구안) vs 타율인가? 장타율 vs 도루인가? 구속 vs 컨트롤인가? 등 많은 상대적인 개념이 나타나고 있는 것이지요.

그러나 애쓸래틱스가 상위권에 간 성과는 있는 것이지요. 여기에서 문제의 초점이 바뀌었어요. 즉, 문제는 머니볼 자체가 행태론의 문제와 같은데, 머니볼로 혹은 행태론으로 모든 문제가 해결될 것인가? 선수들의 과거 데이터 행태로 행태로는 해결할수 없는 문제인가? 를 심하게 고민하지 않는다는 것이지요. 즉, 문제를 풀기 위해서 과거를 보는 것이 적당한가? 아닌가? 를 고민하지 않고 이것을 통계의 문제로 삼고 더 많은 데이터들을 모으고 더 많은 인간의 행태의 법칙을 발견하면 해결될것으로 보는 시각이 문제일 수 있다는 것이지요. 그렇게 열심히 한 애쓸래틱스가 미래에도 별거 없어요. 상위권은 종종 가지만 그 이상은 없다는 것이에요. 신인 드래프트 픽도 별것 없고요.

매호대전으로 다시 넘어갑시다. 슈퍼 컴퓨터, 인공지능은 필요없어요. 메시가 더 뛰어나다는 것에서 이번 날강두 사태로 결과에 만족하는 사람들도 있을 거에요. 저처럼 원래 메시다! 라고 생각했던 사람에게는 당연하다라고 생각할수도 있겠지요.

그런데 이 문제에서 어떤 통계자료에 더 가중치를 두었나 등으로 결과는 뒤바뀔수 있다는 것이에요. 야구에 머니볼 적용하는냐? 아니면 다른 통계를 더 중요하게 생각하는냐? 에 따라서 결과가 뒤바뀌듯이 말이지요. 드래프트 픽이 예측 가능하지 않잖아요.

이런것과 같아요. 좋은 결과를 알아낼 수 없는 행태론을 하면서 결과가 언젠가는 나올 것이라고 믿는 것과 같은 것이지요. 과거의 행태 데이터를 모아서 미래 행태를 예측할 수 있다라는 것은 불가능 하다라는 이론은 너무 많아요.

<우클릭후 새탭에서 열기를 클릭해 주세요>
<빅데이터로 추천 서비스>

이런 부분과 빅데이터로 학습하는 인공지능 똑같아요. 추천해도 안맞지요. 물런 기존의 고전적인 방식에 비해서 약간의 이득이나 우리가 생각하지 못했던 것이 이루어지는 약간의 결과는 있을 수 있어요. 즉, 애쓸래틱스가 상위권은 갔다는 결과는 있어요. 하지만 우승은 없어요.

결과는 이것과 같을 거에요. 인간의 과거 행태로 빅데이터 모아서 특정 규칙을 만들고 그 규칙에 의해서 대응한다는 전략은 과거에 대해서 어느정도 성과는 있어도 우승은 없는 애쓸래틱스가 되는 것이지요.

사람은 여러가지 변수들에 영향을 받아서 과거에 이런 결정을 했다고 미래에도 같은 결정 단계를 거치지 않아요. 같은 결정 체계를 가질 수 있는 사람들은 합리적/경제적 인간관 정도라고 볼수 있는데 이런 부류의 사람들은 다루기 쉬워요~! 이건 사실! 행정학 이론중에서도 합리적/경제적 인간관이라는 가정만 붙어 있는것 많아요^^. 돈을 더 많이 얻는 방법으로만 행동하니까요. 하지만, 복잡인등은 불가능하고 우리 대부분이 복잡인이잖아요. 돈보다 더 중요한 가치가 있다라는 분들! 그런 분들은 합리적/경제적 인간관이 아니에요. 여러분 스스로에게 물어보면 되지요.

과거 데이터로 예측한다? 애쓸래틱스의 결과를 보아라~! 빅데이터, 슈퍼 컴퓨터 따위 인간의 행태에는 적용해봤다 안된다라는 것이에요.

슈퍼 컴퓨터로 메시가 호나우두 보다 뛰어나다라는 말에 속은 시원하시겠지만, 그것이 정확한 결과라기 보다는 어떤 변수에 가중치를 주었는가? 등으로 결과는 바뀔 수 있다는 것이지요.