작년 11월 인공지능 회사 ‘OpenAI’에서 공개한 챗봇 ‘ChatGPT’는 연일 화제의 중심에 있다. 이에 <지스트신문>은 인공지능 모델의 표현 방법과 동작 방식을 연구하는 우리 원 A 교수에게 ChatGPT의 이론적 배경과 한계 및 전망에 관해 물었다.
핵심 원리는 인공신경망 ‘트랜스포머’
ChatGPT는 OpenAI에서 개발한 언어모델 ‘GPT’를 활용한다. 언어 모델이란 실제로 사용되는 문장들을 결정 및 생성하는 인공지능 모델이다. 2018년 GPT-1을 시작으로 GPT-2와 GPT-3이 공개됐으며, ChatGPT는 GPT-3.5를 기반으로 서비스한다. 지난 3월 14일 발표된 GPT-4는 ChatGPT의 유료 서비스인 ChatGPT-Plus와 검색엔진 ‘Bingchat’을 비롯한 몇 가지 응용 프로그램에 적용됐다.
모델의 차이에 대해 A 교수는 “GPT 계열은 기술적인 틀은 유지한 채 학습하는 데이터의 규모만 확장되는 방식”이라고 답했다. 실제로 GPT-3.5를 기반으로 하는 ChatGPT에서는 2021년 9월 이후 사건에 관한 정보를 얻을 수 없다.
GPT는 인공신경망의 일종인 ‘트랜스포머(transformer)’를 바탕으로 한다. 트랜스포머의 원리에 대해 A 교수는 “입력 정보들에 대한 복잡한 연관 관계를 어텐션 메커니즘(attention mechanism)1)을 통해 효율적으로 학습하는 방식”이라고 설명했다. 트랜스포머는 자연어처리2) 분야에서 실용성을 인정받아 최근 개발되는 인공지능에서 중요하게 활용되고 있다.
‘빅스비’, ‘시리’와 차이점은?
빅스비와 시리 같은 개인 비서 서비스는 음성 인식, 언어 모델 등 여러 인공지능이 복합적으로 작용하는 서비스의 한 종류다. 반면, GPT는 이러한 서비스를 구성하는 인공지능 모델의 일종이다. GPT와 같은 인공지능 모델이 모여 빅스비 또는 시리 등 인공지능 서비스를 이루는 셈이다.
최근 개발되는 인공지능 서비스는 대부분 트랜스포머를 기반으로, 데이터의 종류와 학습 방식에서 차이를 두고 있다. 실제로 마이크로소프트에서 개발한 ‘BingChat’을 비롯한 여러 응용 프로그램이 GPT를 기반으로 운영되고 있다. 이에 관해 A 교수는 “개인 비서 서비스도 앞으로는 트랜스포머를 기반으로 한 모델이 적용될 가능성이 높다”라고 예측했다.
대형 언어 모델, 기술 발전에 유용해
GPT를 비롯한 대형 언어 모델이 우리 삶에 미칠 영향에 대해 A 교수는 “인류가 해결하지 못했던 문제를 줄이는 데 큰 도움이 될 것”이라 답했다. A 교수에 따르면 대형 언어 모델은 서로 다른 언어 기반의 문제들을 한 모델에 모두 담을 수 있어 문제 간 학습정보 공유 능력이 강력하다. A 교수는 이러한 발전이 과거의 모델이 넘을 수 없었던 한계를 극복했다는 점에서 기술 발전에 도움을 줄 것이라고 내다봤다.
대화형 인공지능의 한계, 우리가 나아갈 방향은?
ChatGPT의 가장 큰 기술적 문제는 사람이 체감하기에 부족한 정확도다. 인공지능이 생성하는 내용은 희소성이 높아 일관된 지식 표현에 어려움을 겪는다. 이어 A 교수는 “추론 과정에도 문제가 있어 오랜 기간 연구가 진행 중인 분야”라며 인공지능 연구가 맞춰야 할 초점을 제시했다.
저작권 문제는 ChatGPT가 일으킨 인공지능 관련 화두 중 하나다. 일례로 ChatGPT가 생성한 내용을 대학교 과제로 제출하는 사례가 있다. 이에 대해 A 교수는 “어떤 저작물이나 시험 결과가 AI에 의해 생성됐는지 여부는 알 수 없다”고 답했다. 더불어 이러한 논의가 오히려 인공지능 사용에 부정적인 영향을 줄 수 있다는 의견을 피력했다. A 교수는 “인공지능 활용에 대한 제약이 생겨도 이를 완전히 막을 수는 없다. 오히려 인공지능 사용 여부를 확인하기 어려워지는 악순환이 이어질 것”이라 밝혔다. 이어 “인공지능이 대체할 수 있는 일을 인간이 계속하는 것이 바람직한 방향인지 고민해야 한다”며 윤리적 문제의 방향성에 대한 질문을 던졌다.
1) 어텐션 매커니즘 : 문장 전체의 중요성을 모두 분석하는 대신 중요한 부분만을 집중(attention)해 문장을 분석하는 방식이다.
2) 자연어처리 : 인간의 언어를 컴퓨터에 인식시키는 기술.