machine learning, data mining, 기계학습, 데이터마이닝, 인공지능 컬럼...

[기계학습, 머신러닝, 데이터마이닝] 이제, 컬럼을 시작하다.

초록생선 2015. 11. 11. 12:45

최근 IT 뉴스에서 심심찮게 등장하는 내용이 "인공지능, 기계학습"인것 같다(사실, 대략 2년전 정도?). google trend는 아래와 같더라.


위 결과는 내 생각과는 다르다.  data mining은 지속적 감소 추세고, machine learning 또한 감소후, 최근 증가 추세이다. 내가 학교를 졸업할 당시가 2005년 이었는데, 그때는 네트워크나, 임베디드, 데이터베이스, 혹은 소프트웨어 엔지니어링 관련된 대학원 전공이 꽤나 인기가 있었다. 대조적으로, 내가 있었던 인공지능 연구실은 그때 "사람수"를 걱정할 처지였으니 말이다. 최근, 업무 관계로, 어떤 대전 소재 대학 연구소를 간적 있었는데, 10년전과는 상이한 얘기를 들었는고, 그것이 뭐냐 하면, 많은 이들이 AI관련(특히 기계학습) 연구를 하려고 몰려든다는 것이다. 걱정, 기대, 우려, ... 많은 생각이 들었다.


10년전만 해도, AI는 80년대의 암흑기(?)의 연장선상인것 같았다. 다만, 그때즈음부터(사실 이전부터 였겠지만) SVM같은 알고리즘이 각광받기 시작했고, 더군다나 google의 선방으로 이제 "알고리즘(당시엔 pagerank)"으로 산업이 될 수 있음을 보여주기도 하였다. 어떻든, 그렇지만 AI의 인기는 높지 않았고, "그냥, 그랬다".


컴퓨터 공학의 여러가지 분야가 있겠지만, AI에 관심이 높다는 것은 반갑고, 즐거운 일이다. 기존 우리나라의 산업 자체가 H/W였는데, 그래서 그에 관련된 분야가 인가가 많은건 당연한 일이었다. 이제, AI가 주목받는다는건 이제 우리도 S/W에도 저변이 확대된다는 것으로 이해했기 때문이다.


물론, H/W에도 AI가 있을순 있지만, AI 자체는 S/W라 고려된다. 그리고, S/W 중에서도, 어떻게 보면, 순수 과학에 가까운 학문과도 매칭된다. 즉, 공학 보다는 학문이라... 는 견해이다. 예를 들면, 과학에서는 "순수 물리, 이론 물리" 뭐 이런 종류가 되지 않을까? 이런 순수 학문인 AI에 관심이 높아진다는건, 어쩌면, 우리나라의 과학계에서 보기힘든 현상이지 않나 싶기도 하다.


이런, 반가운 일 뿐인데, 왜 "우려, 걱정"이 들게될까?
이유는, 일본의 "잃어버린 10년" 이야기에 항상 등장하는, 거품, 거품, 바로 거품 떄문이다.


2000년 인터넷 닷컴, Web 2.0 이런것들이 거품이였다. 크게 커졌다가, 이름과 "DO THAT/DON'T DO THAT" 명언들을 남기고 쪼그라 들어 버렸다. 그리고, 2000년도 후반부터 들이 닥친 세계적인 불경기등, 지속적으로 성장해야하는 IT 기술들의 위기도 오는 듯 했다. "가상화/클라우드"의 약발이 떨어지자, 다음으로 옮겨 붙은 주제중 하나가 바로 "인공지능"인듯 하다. 사용하지 않았던, 남아있는 IT관련 아이템중 쓸만한 놈이였나보다...


어제 오늘 뉴스에, "구글, '이메일 자동 응답 기능' 선보인다 - 인공지능이 이메일 답장"가 등장하더랬다. 나는 무척이나 놀랬는데, 왜냐하면 이런 시스템은 이미 몇십년전 부터 기업에서 응용(Q&A와 같은)되었고 논문으로 나왔었기 때문이다. 물론, 소수에서 사용되는 부분을 구굴의 강력한 IT Infra를 이용하여 양지로 끌어오리는 점은 대단한 것이지만, 논리적으로 해당 연구는, 이미 존재하고 있었다는 것이다. 이와 유사하게 이미지, 음성등의 분석도 이미 과거에 있었던 내용이다. 그런데 IT 뉴스등에서는 "최근의 새로운 기술"과 같이 설명한다는 점이다. (물론, 알고리즘 자체가 발전하긴 했지만, 그래도 멀리서 바라봤을때는 크게 발라진바 없다. H/W 향상으로 인한 Infra의 확장을 제외하고)


이러한 전반적인 트렌드는 꼭 "Web 2.0"과 "가상화"를 방불케 한다. 쉽게 타오르고, 서서히 꺼져나가는것. 나의 "걱정"은 바로 이것이다. "타오르는것"은 반갑지만, "꺼지는것"이 우려가 된다는 것이다. AI는 IT 뉴스 거리이기도 하지만, 나의 전공 과목이였기도 하기 때문이다. 그래서, "꺼지는것"을 바라본다는것이 슬퍼지기 때문이다.


많은 이들이 AI로 몰려온다. 하지만 앞서 얘기했듯이, AI는 "응용"보다는 "전통"적인 학문에 가깝기 때문에, "응용"에만 관심을 두려한다면, 결국 학문적 한계에 다다르고, 실망하게 될 지도 모른다는 것이다. 단지, SF 영화에 나오는 인공지능은 둘째치고라도, 각자가 꿈꾸는 AI에 대해 기대를 않고 시작했지만, 그 과정이 순탄하지 않다는 뜻이다.


본 블로그 주제 글에서, 이와 관련된 컬럼을 쓰고자 한다. 뉴스에서 알려주지 않는 현실적인 AI, 한계, 그리고, 산업 현장에서 사용할 수 있는 AI 적용 방법론등을 언급할 것이다. AI라고 하지만, 거의 모든 주제는 기계 학습 혹은 데이터 마이닝이며, 비 전공자도 이해할 수 있는 방법으로 진행할 예정이다.