cat tag


데이터 3법을 위한 바둑쇼는 이제 그만 내맘대로 뉴스논평

http://news.zum.com/articles/56962292?c=08
<마우스 우클릭후 새탭에서 열기를 해주세요>
<이세돌이 인공지능과 바둑을 오늘부터 둔다는 기사>
<마우스 우클릭후 새탭에서 열기를 해주세요>
<커제가 이세돌과 4국후 언급한 것에 대한 내용 - 나무위키>

검색으로 모든 것을 찾을 수 없습니다. 기업에서 자신들이 불리한 정보는 다 내리고 찾기 어렵게 만들거든요. 예전에 이세돌과 알파고 4국때 커제가 직접 와서 봤고, 그때 커제가 했던 말이 알파고가 둔 87수는 바둑 초보자도 안하는 실수다라고 한 말이 있었는데 지금은 검색으로 찾을 수가 없어요. 그와 비슷한 "이제 알파고는 나의 상대가 안된다." 라고 언급한 것이 나무위키에는 남아 있길래 나무 위키 링크 달았어요. 전에 쓰던 블로그 서비스 탈퇴 안 했다면 그 기사를 링크한 포스팅을 찾아서 그 기사를 달았을텐데 말이지요^^. (포스팅 모두 비공개후 탈퇴할 때까지 네이버가 수집했던 저의 모든 개인정보에 대해서 네이버 회사에서 상업적이든, 비상업적인든 비식별화했든, 하지 않았든 더 이상 사용하는 것을 인정하지 않으며 모든 개인정보 삭제를 요청한다라고 작성하고 탈퇴해서 네이버에서 지금은 삭제했는지는 모르겠지만요 >_<;;; 모든 포스팅을 비공개하고 탈퇴해서 그 기사를 찾을 길도 없어졌네요.)

이 87수가 매우 중요한 것이에요. 물런 커제는 이세돌이 둔 78수도 언급했지만, 87수가 가지는 의미는 빅데이터로 학습하는 인공지능이 인간이라면 초보자도 안하는 실수도 한다는 것을 보여주는 것이기 때문이지요. 제가 이 부분을 포스팅을 많이 하고 인용해서인지 검색엔진에서 다 내렸더라고요. 예전에는 처음에 있었는데 말이죠. 여러분에게 잘못된 정보를 주입하고 여론을 조작하기 위해서 조작등을 하는 드루킹같은 애들만 있는것이 아니라 기업들도 확증편향을 가지게 만들려고 하고 있지요.

이 87수는 인공지능이 정확도가 낮다는 것을 인지할 수 있는 좋은 예제인데, 바둑같은 경우에는 컴퓨터를 이용해서 인간을 이기는 것이 아니라 정확한 해법. 각 상황에서 어디에 두는 것이 가장 유리한가? 하는 문제의 해법은 이미 트리 알고리즘을 이용해서 해결되었어요. 인공지능은 이런 후방추론(후방 검색이라고도 함)에 의한 답을 찾고도 전방추론(전방 검색이라고도 함)을 찾아보는데, 후방추론보다 전방추론이 연산량이 보통 더 적기 때문이지요. 그러나 아직 이 전방추론은 개발되지 않은 것으로 알고 있어요. 이때는 바둑에 대한 지식을 어느정도 가져야 하는 데, 바둑 문제는 그리 중요한 문제가 아니니까 굳이 전방추론에 매달릴 필요가 없으니까요. 특히 저 같이 바둑 10급 수준이라면 더욱 그럴 것이며 바둑에서 인공지능이 이기느냐? 지느냐? 문제는 이미 트리 알고리즘 이후에는 의미가 없는 문제이니까요.

하지만 중요한 것은 이러한 정확한 답을 찾는 방법이 나온 것은 바둑이 인간이 할 수 있는 모든 것을 알고(변수를 다 알고 있음) 평가함수를 만들 기 쉽고(숫자로 된 집 계산) 각각의 상황에서 경우의 수가 한정되어 있는 방법이지만 다른 문제는 이것과 전혀 다른 양상을 보인다는 것이지요. 바둑에서 된다는 것은 다른 문제에서 된다는 것과 같은 의미가 아니며, 심지어 답을 정확히 구할 수 있는 바둑에서 조차(단, 정확한 결과를 얻는 방법에서의 초읽기 시간내 결과 도출을 위한 연산량은 지금 컴퓨터보다 더 빠른 컴퓨터가 필요한 정도.) 빅데이터로 학습하는 인공지능은 정확한 값을 얻지 못하는 방법이라는 것이지요.

<마우스 우클릭후 새탭에서 열기를 해주세요>
<AI 정책에 관한 기사>
<마우스 우클릭후 새탭에서 열기를 해주세요>
<일자리 안전망을 구축해야 한다는 내용에 Ethics에 전혀 색이 없는 한국 기사>
<마우스 우클릭후 새탭에서 열기를 해주세요>
<벌써 데이터 3법을 통과시켜 달라고 요청한 기사>
<마우스  우클릭후 새탭에서 열기를 해주세요>
<빅데이터로 특정 산업을 예측한다는 기사>

인공지능을 통해서 455조의 수익을 낼 수 있다고 예측되므로 관련 정책을 한다고 하는데, 인공지능을 통해서 455조 수익을 낼 수도 있습니다. 그러나 그것이 빅데이터로 학습하는 인공지능이 아니라면 말이지요.

인공지능의 방식은 많습니다. 학습 + 빅데이터는 정확하지 않은 결과를 찾는 방식이고 이 방식에서는 이세돌과 알파고 4국의 87수 같은 악수를 결과값으로 도출 할 수 있어요.

그래서 이러한 부분의 교육을 한다면 저는 이 부분이 꼭 필요하다고 생각합니다.

1. 트리 알고리즘을 이용해서 정확한 바둑의 결과값을 찾는 과정의 이해 (이 방식은 초등학생도 이해할 수 있어요. 수학적으로 그리 어렵지 않으니까요)
2. 빅데이터로 학습하는 인공지능의 결과값에서 오류가 도출되는 이유의 이해와 결과 (이 방식은 수학적으로 대학교에서 배우는 수학이 필요하므로 정확하게 전달하기 어렵지만 인공지능 역사를 통해서 유추로 가르친다면 고등학교 과정에서 미분의 최대 최소와 극대 극소를 배우고 나서 개념을 설명할 수 있습니다. 고등학생들이 이해는 할 수 있다는 것이지요. 극대 극소를 통한 최대 최소값 찾기는 과거 인공지능 방식에서 실제로 쓰였습니다.)
3. 빅데이터로 학습하는 인공지능의 정확도와 어떻게 협업해야 하는지의 이해
4. 빅데이터에 대한 윤리적 사회적 문제의 이해

이 부분을 분명하게 배워야 한다고 생각합니다.

즉, 정확한 값을 찾는 방식은 인공지능에서 학습과 빅데이터 없이도 가능한데, 현재 하드웨어 환경에서 그것을 구현할 하드웨어의 능력이 부족해서 가능하지 않는 방식이 많으므로 빅데이터로 학습하는 인공지능 방식이 나왔고 이 방식은 연산량을 줄이고 정확도를 버렸습니다. 그렇기에 초보자도 안 하는 실수를 빅데이터로 학습하는 인공지능은 하는 것이며, 이러한 부분에 대해서 항상 생각하고 인공지능은 정확하지 않으므로 인간이 그 결과값에 대해서 항상 검토해야 한다는 것을 의미하는 것이지요.

이것만 알아도 인공지능에 대한 환상을 제거하는데 큰 도움이 될 것이라고 생각합니다. 또한 여기에서 왜 인간과 협업해야 한다고 말하는지에 대한 이유이기도 하지요.

만약 이 부분에 대한 환상을 제거하지 않고 인공지능이 도입되고, 인공지능의 결과를 그대로 믿으면 여기저기에서 87수 같은 악수가 등장함에도 그것이 진리라고 믿고 하는 문제가 발생하는 것이지요. 예를들어 인공지능 판사를 빅데이터로 학습하는 인공지능으로 만들었을때 87수 같은 악수로 무죄를 유죄로 변신시켰다면 그것을 어떻게 해결해야 할까요? 혹은 반대로 유죄를 무죄로 변신시켰다면 말이지요. 빅데이터로 학습하는 인공지능이 정확하지 않으며 모든 것에 대해서 인간이 재검토 해야 한다는 것은 잊어서는 안되는 것이지요. 그러한 면에서 455조는 약간의 허구적 개념이고, 인간을 대체해서 그 만큼의 경제적 이익을 취하려면 빅데이터로 학습하는 인공지능 방식부터 버려야 한다는 것이지요. 빅데이터로 학습하는 인공지능에서 나올 경제적 이익은 매주 낮습니다. 단지 그 과정에서 필요한 우리의 사생활 정보를 악용하는 것이 더 나쁘며, 오히려 사회적 비용만 양산하게 될 것이라는 것이지요.

위의 어떤 사업이 뜰지 확인한다는 기사에서 우리의 사생활 정보를 활용한다고 되어 있어요. 이런 사생활 정보가 기업에 의해서 악용된다는 것은 문제가 있지요. 기업들은 이러한 정보에 접근해서는 안됩니다. 이것은 헌법 17조의 위반이 될 수도 있어요. 헌법 17조에 의해서 우리는 개인정보 자기 결정권이 있지요.

이러한 부분에 대해서 기업들은 데이터 3법을 통해서 동의도 받지 않고 사용하려고 하는데, 이 정보는 기업이 연구에 참여할 사람들을 모집하고 그 참여자들에 의해서 정보를 얻어서 연구해야 하는 것이 당연한 것이지요. 우리의 사생활 정보를 기업이 마음대로 가져가고 심지어 활용해서는 안되는 것이지요.

이러한 부분에서 바둑쇼. 그것이 의미하는 바가 위와 같은 것들이라고 해도, 사람들의 가진 확증편향. 지금까지 인터넷들에서 잘못된 정보를 퍼뜨리고 이것에 의해서 생긴 인공지능은 정확하다라는 잘못된 정보에 의해서(100% 정도로 정확도로 찾는 방식도 있지만, 빅데이터로 학습하는 인공지능은 100% 정확도로 찾는 방식은 아니에요. 그리고 그런 결과라는 것을 인공지능 기술을 모르고 있더라도 여러분이 조금만 노력하면 찾을 수 있지요) 데이터 3법을 통과시켜 지금까지 접근하지 못했던 우리의 사생활 정보를 활용하려 하지만 이것은 문제가 심각하지요.

이런 부분에 있어서 이번 주가 매우 큰 고비이고, 지금까지 바둑에서 빅데이터가 학습하는 인공지능이 가지는 문제를 많이 알려왔고 이런 부분을 알리는 이 분야의 지식을 가진 사람들도 많다는 것을 알고 있어요. 인터넷 여기저기에서 논쟁을 불사하며 말하는 많은 분(참지식인. 침묵하면 고 연봉등의 이익을 얻을 수 있지만, 진실을 알리시는 분들)들이 있다는 것을 알지만 확증편향을 벗겨내기는 어려움도 많은 것이 사실이지요.

게다가 일자리 안전망등 그럴듯한 정책을 소개하지만, 애초에 빅데이터로 학습하는 인공지능은 인간과 꼭 협업을 해야 하며, 그래서 경제적 효과는 거의 없다고 예측되며, 우리의 사생활 정보만 기업이나 국가가 수집할 수 있는 방법이 생기는 것이지요. 이 점이 매우 위험한 것입니다. 결국 빅데이터로 학습하는 인공지능이 결과를 만들어내도 바둑의 87수와 같은 악수인지 아니면 정당한 결과값인지에 대해서 인간이 결과를 다 확인해야 하는 것이니까요. 결국 인간이 하는 것과 같은 것이지요. 그래서 인지 사회 안전망도 그닥 소용없는 것이에요. 기본 소득제와 비교해서 실업 수당 조금 길게 받는 것 밖에 더 있어요? 전 데이터 3법 통과를 위해서 생색만 내는 수준이라고 생각합니다. 455조의 수입에 내기 위한 인공지능의 능력을 예측했다면 그 결과에 비해서 너무 적은 부분이지 않나요? 하는 것이지요. 오히려 국가는 빅데이터가 가져올 문제점을 무시하고 있지만, 여기에 대한 결과에 대해서는 정확히 예측하고 있어서 사회 안전망이라면서 기본 소득제 정도 이상을 제시하지 않는 것과 같아요. 사회를 변화시킬 힘이 없고 거의 영향력이 없다는 것을 아니까 실업수당 조금 길게 받는 정도를 제시하는 것이지요.

게다가 사회 안전망 기사에서 있는 표에서 붉은색 마크가 의미하는 바를 설명해 놓지 않았지만 추리해 본다면 붉은 색이 진할수록 더 잘 준비된 것으로 보이는데, 여기에서 Ethics(윤리) 부분에는 전혀 색도 없어요. 우리나라 개인정보 보호법이 지금도 좋지 못한데 데이터 3법까지 통과되면 우리의 사생활 보호에 대해서는 무법천지로 가는 것과 다름 없는 것이지요. 우리의 정보를 가명 정보로 바꾸어도 이것을 실명으로 바꿀 수 있는 재식별화 기술이 있고, 심지어 우리 동의도 없이 수집하겠다라는 것이니 말이지요.

헬조선에서 살기에 이런 면은 정말 싫다. 라는 느낌을 받을 한 주가 될 것 같아요. 데이터 3법의 최대 고비가 될 것 같네요. 그리고 데이터 3법이 통과되면 빅데이터로 학습하는 인공지능으로 바뀔 것이 없으니 이러한 정책들이 수면 아래로 가라앉고 감시 사회를 위한 다음 걸음을 이행해서 우리의 사생활 정보를 수집하는 것에 만족하면서 없던 정책이 될 것이라고 전 예측합니다. 하더라도 생색용으로 의미없는 부분 조금 들어오겠지요. 이산수학 좀 배우면서 몇몇 프로그래밍 언어의 문법적 부분을 조금 가르치고 조금 더 나가면 수능에 소스 보여주고 빈칸에 들어갈 적당한 함수는? 혹은 밑줄 그어 놓고 소스를 잘못 입력한 부분은? 같이 문제 출제하며 인공지능과 큰 관련이 없는 프로그래밍 조금 가르쳐 주면서 말이지요.

하지만, 국가로서는 이러날 가능성이 있다고 생각한다면 이런 부분에 대해서 대처하지 않는 것보다는 이러한 것을 대어하는 것이 좋기 때문에 이런 대책을 만든것은 이해하지만, 다시 말해서 이번 바둑 쇼 때문에 여론이 악화될 수 있으므로 단지 여론 무마용으로 한다면 나쁘지 않다고 생각하지만(실제로 대책을 보면 이 이유라고 보이기도 합니다. 하지만 정확한 지식을 전달해서 해결하는 것이 더 좋지 않겠어요? 하는 아쉬움이 있어요.), 이 문제로 데이터 3법이 통과되는 어이없는 일이 일어나서는 안된다고 생각합니다.