cat tag


인공지능이라는 단어에서 오는 혼란 내맘대로 뉴스논평

https://news.joins.com/article/23663003?cloc=joongang-home-newslistright
<마우스 우클릭후 새탭에서 열기를 해주세요>
<빅데이터로 학습하는 인공지능을 인공지능이라고 작성한 기사>

인공지능과 관련된 글이 제 포스팅에 꽤 많은 부분을 찾이하고 예전에 다른 서비스에서 블로그 쓸 때도 30~50% 정도는 인공지능에 관련된 글이었어요.

인공지능 개발자에게 도움이 되는 글은 수학적 내용이 들어가는 부분들이 있어서 작성에 시간이 많이 걸리고, 제가 만들어낸 부분은 제가 이름 붙인 U-AC 알고리즘을 제외하고 다른 부분은 아직 알려줄 수 없는 부분이 있어서 U-AC 알고리즘 빼고는 자세하게 보면 만들 수 있을 정도로 말한 적이 없어요.

인공지능 개발자가 아니면 구체적인 방법은 알 필요는 없지만, 블로그에서 인공지능에 대한 확증편향을 제거하고 인공지능에 의한 미래를 예측하는 글을 적을 때 가장 혼동을 일이키는 부분이 빅데이터로 학습하는 인공지능을 인공지능으로 작성하고, 빅데이터로 학습하지 않는 인공지능도 인공지능으로 글을 작성할 때 발생하더라고요.

예를들면, 인공지능(빅데이터로 학습하는 인공지능)은 한계가 있어서 결국 결과값을 신뢰할 수 없다라고 작성하고 다른 포스팅에서는 인공지능(빅데이터로 학습하지 않는 인공지능)은 앞으로 인간을 대체할 수 있다라고 작성하면 인공지능에 대해서 한계가 있다고 했다고 했다가 다 된다고 했다가 하면서 혼란을 줄 수 있었다는 것이지요. 물런 근거를 읽으면 그 차이에 대해서 인공지능 아는 분들은 알 수 있게 작성했지만, 둘 다 처음에 구분하지 않고 인공지능으로 작성해서 혼란을 일으켰어요. 그래서 이 부분을 정확히 구분해서 써야 하겠다 라는 생각을 하게 되었지요. 그 서비스에서 검색 서비스에 올려준 것은 오직 인공지능이 인간을 대체할 수 있으며 가능성이 무궁무진하다고 작성한 포스팅만 올려주면서 유입량이 그쪽만 높았죠. 나중에 구분해서 쓸 때는 빅데이터로 학습하지 않는 인공지능의 가능성이 무궁무진하다라고 쓴 글은 유입량이 매우 낮았고 빅데이터로 학습하는 인공지능은 한계가 있다와 비슷했어요. 그 N회사가 편파적으로 블로그 포스팅을 뽑아서 검색엔진에 올리는 것에 대해서 알게 되었지요. 인공지능의 가능성은 무궁무진 하다에서 비슷한 질의 컨텐츠의 빅데이터로 학습하지 않는 인공지능의 가능성이 무궁무진하다의 글이었음에데 그 결과는 빅데이터로 학습하지 않는 인공지능으로 적느냐? 아니면 그것을 인공지능으로 적느냐? 하는 것에서 결과는 천지차이로 났으니까요.

그런 부분을 막기 위해서는 인공지능의 방식에 대해서 구분할 필요가 있는데, 원칙적으로는 빅데이터로 학습하는 인공지능과 빅데이터로 학습하지 않는 인공지능을 모두 인공지능으로 불러도 상관은 없어요. 둘 다 인공지능인 것은 맞으니까요. 이 기사를 쓴 기자도 잘못 한 것은 없는데 독자들이 확증편견을 지우려면 빅데이터로 학습하는 인공지능과 그렇지 않은 방식들의 결정적인 차이를 독자들이 알고 있어야 한다는 것이지요. 그렇지 않다면 인공지능의 한 방식만이 인공지능의 방식으로 착각하고 그것으로 인해서 많은 잘못된 결정을 할 수 있으니까요. (기자분은 정확히 기사를 작성하셨고 문제는 없어요^^ 저도 기사를 작성하라면 똑같이 작성했을 거에요^^ 단지 기사를 읽으면서 제가 블로그를 작성하면서 겪은 똑같은 경험이 있어서^^..)

이 기사에서 인공지능의 방식을 구분하지 않음으로 혼란을 일으킬 수 있는 부분은 "인공지능은 무수히 많은 기보를 입력해 쌓은 데이터로 최선의 수를 찾는다" 라는 부분입니다. 물런 그 뒤에 그렇게 찾은 수는 최선의 수가 아니라고 말했지요. 이 기자분이 정확하게 말했어요. 틀린 것 없습니다. 그런데 좀 다른 부분도 알아야 할 것들이 있어요.

바둑은 이미 몇십년에 해결책이 나왔어요. 그 방법은 학습도 하지 않고 빅데이터도 필요 없어요. 그 대표적인 방식이 트리 알고리즘입니다.

예를들어 이런 거에요 바둑판은 19X19이지만 3X3에서 바둑을 둔다면..실수로 백돌부터 뒀네요^^.

어쨌든, 백돌이 둘 수 있는 곳은 9곳 중에 한곳입니다. 여기서는 (1,1)좌표에 두었지요 A를 통해서 그 흑돌을 옆에 (1,2)좌표에 그 다음에 백돌을 (1,3) 좌표를 두고 하면 그렇게 뒀을 때 결과가 나와요. B를 통해서 다음에는 흑돌(1,2)가 아니라 (1,3)이라는 다른 곳에 뒀을 때 역시 모든 경우의 수의 결과도 다 확인 할 수 있을 것입니다. 이렇게 처음부터 둘 수 있는 모든 경우의 수를 다 적용해서 결과를 확인할 수 있어요. C를 통해서 백돌이 처음에 (1,2)를 두고 흑돌이 (1,1)을 두었을 때 결과가 달라지므로 중복을 허용하지 않으면서 순서가 있는 경우의 수라는 것이지요.

그럼 경우의 수는 서로 돌이 잡히는 경우나 바둑돌이 없더라도 둘 수 없는 곳(두면 바로 잡히는 곳은 룰로서 둘수 없고 반복수도 둘 수 없어요)등을 제외하고 알아보다라도 (3X3)! 이라는 것이지요. 9!=9x8x7x6x5x4x3x2x1 입니다.

바둑판은 19X19 잖아요. 이것에 대해서 계산을 하려면 적어도 (19X19)! 의 계산을 초읽기 시간내에 할 수 있어야 한다는 것이지요. 그런 컴퓨터가 있으면 모든 경우의 수를 확인하고 이기는 곳에만 두니까 트리 알고리즘으로 만들면 다른 방식의 인공지능은 트리 알고리즘을 이길 수 없고, 사람도 못이겨요.

이렇게 문제를 해결하는 것이 후방 검색, 후방 추론이라고 합니다. 전방 검색 전방 추론을 하는 것이 시간이 더 절약됩니다. 이유는 계산량이 적은데 바둑에서 이것이 발견 안되고 있습니다. 또한, 양방향 추론등 여러가지 방법들이 나오고 트리 알고리즘이 아니더라도 빅데이터로 학습하지 않는 방식도 계속 개발되고 있습니다. 이러한 방식은 빅데이터가 아예 필요없고 학습도 안한다는 것이지요.

그러나 바둑은 인공지능이 도전할 만큼 매력적인 부분이 사실은 아니에요 >_<;; 이런 보드 게임은 이미 몇십년 전에 해결책 다 찾아두었는데, 그것에 대해서 전방추론 방식 찾는 것은 사실 인공지능 개발자가 풀어야 할 많은 다른 문제들에 비해서 매력적이지 않아요. 제가 풀어낸 문제는 무한대 경우의 수 문제에 대해서 흥미롭게 풀었는데, 흥미로운 다른 문제들이 많은 것도 사실이지요. 그럼에도 바둑을 쇼로서 하는 경우도 있게 된 거지요. 인공지능 개발자들은 다른 곳에 매달려 있고, 그런 개발자들에게 바둑은 컴퓨터 속도만 빨라지면 해결될 것이니 그냥 기다리면 되는 문제야~! 정도 아니겠어요? (수학으로 예를 들면 라이프니치가 미적분 발견하고 있던 시절에, 덧셈 뺄셈 빨리 하는 방법을 연구해 봅시다 하는 거에요 >_<;;)

그래서 바둑 인공지능에서 사용하는 것이 이런 경우의 수를 줄이기 위해서 어떤 부분에 대해서 경우의 수를 확인하고 또 어떤 부분에 대해서 경우의 수를 확인하지 않을 것인가? 를 결정하는 것입니다. 일단 기본적으로 정확도는 트리 알고리즘에 비해서 많이 하락하고, 확인하지 않을 경우가 많을 수록 결과는 더욱 신뢰할 수 없겠지요. 이 과정에서 빅데이터로 학습해서 중요도 있는 경우의 수만 확인하는 과정에 쓰이는 것이지요. 그 중요도를 찾아내는 과정에서도 문제가 많아요.

이런 씩의 해결방법은 정확하지 않은 것이에요. 여러분이 인공지능에 대해서 정확하다는 확증편견과 달리 정확하지 않은 값을 찾는 것이고, 그 점에서 인간보다 못할 가능성은 언제나 있는 것이지요. 그런 면에서 이런 빅데이터로 학습하는 인공지능은 인간과 생명과 관련된 부분, 인간의 다양한 가치등에 적용은 하기 힘듭니다. 하지만 바둑이라는 보드 게임의 의해서 한국에서는 전국적 확증편향에 빠지게 되었지요. 그동안 사실을 알렸던 분들이 많아서 바둑으로 2번은 힘들지 않을까 생각 합니다.

이런 (1)인공지능이 정확도가 낮기 때문에 모든 것이 다 될 것이라는 착각을 버려야 되지요. 그러나 (2)인공지능의 가능성은 무궁무진 합니다.

처음에도 말했지만, 그냥 인공지능이라고 작성해도 글이 틀린 것은 아닌데, 글은 읽으신 분들은 (1)인공지능은 빅데이터로 학습하는 인공지능으로 (2) 인공지능은 빅데이터로 학습하지 않는 인공지능이라는 것을 아실 거에요..

일반인들이 기사를 읽고 이것의 차이. 각각의 인공지능 제작 방식의 차이와 그 장단점 정도를 이해할 수 있어야 인공지능 관련 기사를 정확하게 읽을 수 있는 것이지요. 그 점이 인공지능에 대한 확증편견을 제거하는데 가장 중요한 부분입니다.

빅데이터를 수집하게 한다고 바뀔 것은 없으며 우리의 사생활 침해만 될 것이라는 것이지요.