cat tag


수학과 인공지능에서 경험을 적용하는 방법 내맘대로 뉴스논평

https://news.joins.com/article/23658621?cloc=joongang-home-newslistright
<마우스 우클릭후 새탭에서 열기를 해주세요>
<수학 후행학습 교재에 관한 기사>

제가 가장 좋아하는 과목은 수학입니다. 좀 특이하다고 할 수도 있겠지만요. 어떻게 보면 여러분이 사용하는 컴퓨터도 단어뜻은 계산기이고, 실제로도 복잡한 계산을 빨리 하기 위해서이고 포탄의 탄도 계산을 위해서 만들어졌어요. 이것이 발전해서 지금은 여러분이 블로그를 쓰거나 게임을 하거나 하는 것도 실제로는 다 연산을 통해서 이루어지지요.

학교에서 배우는 수학은 수학답지 않다라는 비판을 받기도 합니다. 수학이라는 것이 연산을 통해서 문제를 푸는 과정이 아니라, 공리에서 시작해서 그 안에서 연역적 과정을 통해서 다른 사실을 확인하는 과정인 증명을 배워야 하는데, 그것보다는 문제풀이가 주를 이루지요. 우리가 말하는 창의적인 부분이 바로 이 증명이지만 우리나라는 수학에서 활용적 부분에 포커스를 맞추고 있다고 생각합니다. 저는 두 가지 모두 중요하다고 생각합니다만 저도 한국의 교육과정을 거쳤기에 후자에 좀더 강한 것이 사실이지요^^.

문제풀이에서는 다음과 같은 것이 중요합니다.

우리가 공리를 통해서 특정한 정리를 만들어내면 그것들을 조합해서 문제를 만들어내지요. 그 조합을 문제를 보고 찾아내는 과정에서 알고 있는 지식을 어떻게 활용하는가? 하는 것을 배우고 이것은 프로그래밍 할 때도 많은 도움이 됩니다.

수학에서는 풀이 방법이 하나가 아니라 여러 개인 경우도 있고, 이러한 부분을 찾을 때 문제풀이 수학에서 여러가지 가능성 있는 방법을 찾는 과정에서 특정 문제를 해결하는 방법. 즉 지식을 활용해서 해결책을 찾는 방법을 배우는 것이고,(구체적인 문제를 통한 예시제시는 생략하겠습니다) 이 과정에서 우리가 알고 있는 지식을 활용하는 방법이 늘어나는 것이지요. 우리가 공리를 통해서 만들어낸 정리를 3가지 알고 있다면 활용하는 방법에서 5^3의 경우의 수가 생깁니다. 정리가 100가지라면 199^100의 경우의 수가 생기지요. 문제로 만들수 있는 199^100가지 유형의 문제를 만들어 낼 수 있어요. 그러나 보통은 1~5개 정도 정리를 사용해서 문제를 출제하니까 100가지 정리를 학생이 알고 있다면, 약 104^5가지 유형이 현실적인 풀 수 있는 문제조합이고, 문제를 보고 이것에서 가능한 방법을 찾는 경우에서 출제자가 의도한 정리들의 조합만이 아니라 다양한 다른 정리의 조합으로도 문제를 해결이 가능할 수가 있어요. 이 과정에서 우리는 지식을 활용하는 방법을 배우고 이것은 컴퓨터에 적용하는 방법도 도움을 받을 수 있어요. 꼭 공리를 정리를 증명하는 것만 수학에서 배우는 것이 아니라 문제풀이 수학도 그만큼 중요한 면이 있다라고 말하고 싶고 이러한 부분은 프로그래밍 뿐만 아니라 실생활에서도 많은 도움이 된다고 하고 싶어요. 수학을 배우는 이유는 이런면이 있기 때문이지요. 그렇다고 모두가 수학을 잘할 필요는 없다라고 생각하고 자신이 잘하는 것을 통해서 대학에 가고 성공하는 것이 바람직하다라고 생각하지만요. 다른 학문들도 그 학문들이 가지는 다른 의미. 수학에서 배울 수 없는 것을 배우는 것들이 있기 때문이고, 사람들마다 능력이 다르므로 꼭 수학을 모두 잘해야 할 필요는 없는 것이지요. 자신이 잘 하는 것으로 성공하는 사회로 바뀌어야 한다고 생각합니다.

그러나 이 활용방법이 늘어나면 우리의 경험도 프로그래밍 하는 방법을 찾아낼 수 있습니다.

이런 후행학습 교재들은 학생이 모르는 몇가지 정리를 배운다면, 예를들어 하나의 정리를 더 배우면 제곱수로 해결할 수 있는 문제가 늘어나는 것이에요. 그래서 수학에서는 중학교 1학년 때 수학을 안했다면 다시 1학년 과정을 복습해야 2학년 과정을 할 수 있어요. 1학년때 배우는 정리가 섞여서 문제가 출제되면 1학년 과정을 모를 때는 풀 수 없는 문제가 될 가능성이 있지요. 문제는 같은 해결방법에 대해서 여러가지 정리를 적용할 수 있기 때문에 간혹 늦게 배우는 정리를 적용할 수 있을 때도 있지만요. 그래서 수학을 좀 적게 공부했을 경우 후행학습은 매우 필요합니다. 어떻게 보면 정리 자체가 많은 수가 아니여서 가장 빨리 점수를 올릴 수 있는 과목이 수학이지요. 언어 과목 어휘력과 비교하면 단시간에 점수 올릴 수 있어요. 정리 하나를 더 알면 제곱수로 풀 수 있는 문제가 늘어나는 과목이지요. 그에 비해서 언어 과목들은 단어 수십~수백개를 더 알아야 하나 더 맞출 수 있지 않아요? 같은 과목이니까요.

<마우스 우클릭후 새탭에서 열기를 해주세요>
<제철 공장에서 인공지능을 사용한 사례에 관한 기사>

다시 본론으로 돌아와서, 인공지능에서도 이러한 문제들의 해결 방법을 과학기술과 그렇지 않은 부분을 나누어서 봐야 합니다.

왜냐하면 빅데이터로 학습하는 인공지능이 이러한 부분에서 개발자가 정한 변수로 빅데이터를 통해서 변수들간의 상관관계를 찾고 그것에 대한 일정한 관계식을 통해서, 즉 빅데이터의 값에서 모순이 생기지 않는 관계식을 통한 연산을 해서 결과를 도출하기 때문이지요.

이러한 부분에서, 과학 기술은 기본적인 공리에서 정리를 찾는 수학과 그리 차이가 없습니다. 기본적인 물리나 화학의 법칙은 연역적 혹은 귀납적으로 나온 법칙을 어기는 경우는 없는 것이지요.

F=ma를 어길 수 있는 운동은 없고, 유체에서 F=pVg를 어길 수 있는 물체도 없습니다. 즉 기본적인 법칙이 있기 때문에 이 법칙을 찾아서 적용하면 그것은 문제가 없는 것이지요.

제철 공장에서 빅데이터로 학습하는 인공지능이 가능할 수도 있는 것은...중요한 것은 이것의 해결 방법이 의사결정나무분석(Decision Tree Analysis)인데 의사결정나무분석으로 특정 과학지식을 정리 할 수 있다면 이것이 가능한 것이에요. 정확히 말하면 경험이라기 보다는 과학기술을 말로 하지 않고 인간의 머리 속에 있는 것을 과학기술로 증명한 것이지요.

이러한 부분에서 빅데이터는 인간의 사생활이 아니므로 빅데이터의 문제도 생기지 않습니다.

<마우스 우클릭후 새탭에서 열기를 해주세요>
<기상 예보에 인공지능을 사용한 사례에 관한 기사>

지구과학에 해당하는 기상 예보 역시 일정한 법칙을 따르게 되지요. 변수에 대해서는 나비 효과의 예로 나오는, 지구 반대쪽에 있는 나비가 날개를 한번 펄럭였기 때문에 태풍이 일어난다 같이 변수를 찾기 어려운 문제가 있긴 하지만요.

이것보다 더 쉬운 문제는 바둑입니다. 변수도 다 알고 법칙도 다 알고 있지요. 이러한 부분은 경험을 프로그래밍 했다고 보기는 어렵고 이 부분에서는 일정한 법칙을 통해서 해결할 수 있어요.

이러한 부분의 빅데이터는 우리의 사생활 과도 관련이 없는 부분이지요. 하지만 여기에서 문제점은 빅데이터로 학습하는 인공지능이 아니더라도 이 부분에서 전방추론(연역추리)과 후방추론(귀납추리)를 통해서 해결 할 있고 이러한 방법은 빅데이터가 꼭 필요한 빅데이터로 학습하는 인공지능만으로 해결할 수 있는 문제가 아니라는 것이지요. 다른 방식으로도 이 문제는 해결 할 수 있습니다. 그러나 이런 분야에서는 빅데이터에 해당하는 부분에서 우리의 사생활 정보가 들어가지 않으므로 큰 문제가 없습니다.

<마우스 우클릭후 새탭에서 열기를 해주세요>
<인공지능이 추천을 해준다는 기사>
<마우스 우클릭후 새탭에서 열기를 해주세요>
<인공지능으로 채용을 하려던 아마존이 여성차별 결과를 낸 인공지능을 보고 포기했다는 기사>

이러한 문제가 사회과학으로 오면 매우 문제가 커집니다.

사회과학에서는 과학과 달리 여러가지 가치를 검토해야 하고, 시간에 따라서 변화하며, 과학과 같이 일반성만 따지는 것이 아니라 개개인이 다른 특수성까지 생각해야 한다는 것이지요.

이러한 부분에서 공리에서 결과를 찾는 방법에서는 한계가 있으며, 여러가지 가치를 검토하는 것에서 일반 법칙을 만들어내는 것은 한계가 있으며, 또한 빅데이터에 해당하는 부분이 우리의 사생활이라는 것이지요. 개발 과정에서 사생활 침해가 일어나는 것입니다.

인공지능이 추천한다고 해도 이 추천이 제대로 될 수 없는 것이고, 인간의 가치는 다양하며, 문제 종류 별로 중요한 가치는 다르고 시간에 따라서 중요한 가치가 변화하기 때문에 과거의 인간의 가치로 여성을 차별한 것이 현재에는 맞지 않다는 결론이 나오는 것이지요.

이러한 부분에서 일정한 법칙을 만들고 그 법칙을 통한 연산으로 결과를 내는 빅데이터로 학습하는 인공지능의 한계가 있다는 것입니다. 그 법칙이 시간에 따라서, 문제에 따라서, 사람들에 따라서 변화하는데 그 법칙을 고정시킨 문제가 있는 것이지요.

빅데이터로 학습하는 인공지능이 할 수 있는 분야. 즉 일기예보 같은 것도 제대로 못하면서 너무 쉬운 바둑 하나 보여주고 모든 것이 다 될 것이라고 하는 것은 성급한 일반화의 오류일 뿐이며(바둑도 100% 정확도로 답을 찾은 것이 아니지요), 빅데이터로 학습하는 인공지능을 위해서 우리의 사생활을 데이터 3법등으로 포기하라는 것은 있어서는 안되는 일이지요.

지금 중요한 것은 빅데이터로 학습하는 인공지능이 모든 것이 다 될것이라고 착각하는 부분을 제거하고 인공지능이 어떤 것이 되고 어떤 것이 되지 않는 가? 라는 것을 정확히 알아야, 이 과정을 통해서 새로운 해결책. 우리가 알고 있는 정리들과 지식들을 동원해서 이것을 해결해야 한다는 것이지요.

되지도 않을 인간의 선호나 채용 혹은 사회과학 문제에 적용하는 것은 실패를 알고도 시도하는 것인데, 이러한 부분에서 실제로는 되지 않으면서 우리가 인공지능은 정확하다라는 편견을 이용한 상술에 해당되는 사항일 뿐입니다.

일기예보부터 정확도 100% 만들어놓고 다른 것 하세요~! 하는 것이 맞겠지요. 그런데 그런일은 빅데이터 아무리 모아도 안될 것이라는 것을 알아요. 사실 과학에서도 기상은 연역적 연구가 불가능해서 귀납적 연구를 하는 분야이고, 빅데이터도 많이 쌓여있으니 되는 분야부터 100% 정확도로 되는 것을 증명하고 다른 분야를 해야 하는 것 아니겠어요? 그러나 우리는 아침 몇시 몇분에 비가 내리고 몇시 몇분에 비가 그칠 것이며 어느 지역에서 내일 몇시 몇분에 화산 폭발이 일어나니 대피해 주십시요. 같은 정확한 예보는 앞으로도 경험하지 못할 거에요.

그럼 인간의 경험에 대해서 어떻게 프로그래밍 할 수 있을까요? 전 빅데이터로 학습하는 인공지능으로는 불가능한 부분이라고 생각합니다. 그렇다고 인간의 경험을 프로그래밍 하는 방법을 찾아야 하지요. 이러한 부분에서 어제 글에서 약간 관련된 부분인데, 예전부터 포스팅을 했지만 저의 경우는 해석기하학을 이용해서 해결했는데, 역시나 여러가지 해결책을 다양한 부분을 이용해서 여러가지로 만들 수 있을 것이라 생각하고, 해결책이 없는 것은 아니며 우리가 아는 지식을 조합해서 해결하는 방법이 다양하게 있다는 것만 지금 말하고 싶어요. 이것이 중요한 것은 언어우위설을 증명하기 위해서 꼭 해야 하는 부분이지만 해결책이 빅데이터로 학습하는 인공지능 방식이 경험을 만들어 낼 수 있는 방법은 아니라는 것이지요.

덧글

  • 타마 2019/12/17 09:47 #

    아마존 케이스는 좀 미묘하군요. AI의 판단이 오판&차별인지 아니면 그저 현 시국에 맞지 않아서 정확한 분석을 포기한 것인지 말이죠. 앞으로도 이런 논란은 계속되겠죠. AI가 정확도를 높임과는 상관없이 인간이 AI를 신뢰하지 못하는 (혹은 신뢰하길 거부하는) 상황이 빈번할테니...
※ 로그인 사용자만 덧글을 남길 수 있습니다.