본문 바로가기

과학 칼럼/과학 뉴스레터

ChatGPT와 함께할 미래 (1)

300x250

사이언스 리포트

ChatGPT의 등장이 미치는 영향

사실 GPT-3 생성형 AI (generative AI)로 2020년에 출시된 기술이다. 이는 AI 챗봇 스타일의 툴을 사용하여, 사용자가 산문이든, 시든, 심지어 컴퓨터 코드조차도 만들어 달라고 요청하기만 하면 설득력 있는 유려한 텍스트를 대량 생산해 낸다. 그런데 지난해 OpenAI의 chatGPT가 무료로, 일반 사람들도 쉽게 접근할 수 있도록 출시되면서 유명해졌다.

 

chatGPT를 이미 사용하고 있는 사람이 아마도 많을 것이다. 내 주변의 경우 학생들이 과제를 할 때 자료분석이나 보고서 작성용으로 사용하고 있고, 이렇게 블로그를 쓸 때 질 좋은 내용을 한번에 업로드하기 위해 쓰기도 한다. (나는 수익형 블로그가 아니므로 현재 블로그 글을 쓸때 chatGPT를 사용하지 않고 있다)

 

그러나 무엇보다도 과학 분야에서 이 chatGPT 사용 가능성은 매우 뜨거운 화두이다. 생성형 AI가 지닌 본질적인 문제점 때문에, 이 chatGPT의 사용은 유용한 도구가 될 수도 있지만 칼이 될 수도 있다. 이 글에서는 chatGPT의 이러한 양면성에 대해서 살펴보고 앞으로 우리가 나아가야 할 방향이 무엇인지 개인적인 의견을 담아서 적었다.

 

chatGPT는 과학 논문 원고를 받고 5분도 안 되는 시간에 논문에 적힌 한 수학공식이 참고한 논문에서 잘못 인용되었다는 것까지 알아낼 정도로 정교하게 수정할 수 있다. 또한 읽기 쉽게 문체를 수정하기도 한다.

 

유려하지만 사실이 아닐 수 있다

chatGPT를 사용해 본 사람들 사이에서 chatGPT가 너무나 천연덕스럽게 거짓말을 한다는 우스갯소리가 나온 적이 있다. stack overflow는 개발자들 사이에서 서로의 코드를 리뷰해 주고 질문에 서로 답하는 사이트이다. 지난 12월에 Stack Overlow는 일시적으로 chatGPT의 사용을 금지했다. 왜냐하면 ChatGPT가 쓴 것으로 추정되는 아주 설득력 있지만 잘못된 답이 아주 높은 비율로 증가하기 시작했기 때문이다.

 

아무래도 이렇게 신뢰성이 낮아지는 이유는 chatGPT, 즉 Large language models(LLM)이 만들어지는 과정에 있다. LLM은 그 데이터베이스가 탈고를 거친 책이나 기사, 논문도 있지만 대부분 온라인 텍스트가 차지한다. 온라인 텍스트에는 신뢰할 수 없거나, 편견어린 시각이 담긴 글도 있을 것이고 시대에 뒤떨어지는 글도 존재한다.

 

특히 온라인 상에 데이터가 적은 기술적인 주제에 대해 잘못된 정보를 많이 생산한다고 한다. 또한 chatGPT는 출처를 기재하지 않다 보니, 이러한 문제가 해결되기 어렵다.

 

그러다 보니 chatGPT는 잘못된 정보가 쓰여져도 잘못된 점을 지적할 수 있고 검토가 가능한 ‘전문가’에게 적합한 툴이다. 만약 순진한 유저가 잘못 사용하게 되면 이 유저는 이 잘못된 정보를 어딘가로 퍼뜨릴 것이고, 이 정보는 다시 chatGPT의 데이터베이스로 포함되면서 잘못된 정보를 계속해서 생산하는 악순환이 될 수 있다.

 

단점은 해결될 수 있을 것인가?

해결은 간단하다. 연구자들을 위한 서치엔진을 만들면 된다. 실제로 Elicit은 이 엔진이 찾은 웹사이트나 문서를 짧게 요약하여 보여주고, 참고한 출처를 알려준다.

 

지난해 9월 구글 자회사 DeepMindChatGPT가 가진 이러한 문제점을 해결한 Sparrow를 개발하여 올해 베타 서비스를 선보일 것이라고 발표했고, 다른 경쟁사 Anthropic도 이러한 문제점을 해결하겠다고 말했다. Meta는 과학 논문에 특화된 Galactica라는 LLM을 개발하여 demo를 내놓았으나 부정확성과 인종차별 발언 생산 등의 문제로 회수되었다.

 

한편 MicrosoftBingEdge는 대화를 통해 검색할 수 있는 브라우저로 업데이트했다. Bing은 chatGPT와 다르게 출처를 알려주기도 하고, 최신 텍스트도 모두 검색이 가능하다는 차별점이 있다. 또한 ‘작성’탭을 분리해서 채팅으로 적는 것보다 글을 써서 활용하는 유저에게 유용하다는 장점도 있다. 톤이나 형식, 길이도 선택 가능하다.

 

what is the most famous topic in April 2023?
Bing said the latest information that I asked.

 

실제로 chatGPT가 아주 창의적인 결과물을 만들어내는 데는 한계가 있다는 데 공감대가 있는 듯 하다. 그러나 아주 뻔한 일, 비슷하지만 다른 말을 여러 개 반복적으로 수행해야 할 때, 보고서같이 형식이 있는 글을 틀에 박힌 단어와 문체로 써야 할 때 유용하게 사용할 수 있다.

 

출처:

(1) nature | Vol 614 | 9 February 2023

(2) https://zdnet.co.kr/view/?no=20230208084857 

 

300x250