ChatGPT의 이미지 업데이트가 시사하는 것
by 길진세(BC카드 AI Biz Lead PM)
들어가며
AI에 관심이 있는 독자라면 SNS등에서 지브리 수요일 (Ghibri Wednesday)를 들어보았을 것이다. 2025년 3월 26일, open AI는 자사의 ChatGPT 4o의 이미지 생성기능을 대폭 강화했다. 이전 버전에서도 이미지를 생성하고 수정할 수 있었지만 이번 업데이트에서는 사용자가 업로드한 사진의 내용을 이해하고 이를 수정하는 능력이 대폭 상향되었다.
이에 사용자들은 자신과 주변인물들의 사진을 ChatGPT에 업로드하고 다양한 스타일로 변경을 요청하며 변화를 살폈다. 일본의 스튜디오 지브리는 천공의 성 라퓨타, 마녀배달부 키키 등으로 유명한 애니메이션 제작소이다. 밝고 따듯한 그림체가 주류를 이루는데 몇몇 사용자가 ChatGPT가 지브리 그림체로 사진을 바꿔줄 수 있음을 SNS를 통해 알리며 일종의 놀이문화가 형성되었다. ChatGPT 사용자들은 너나 할 것 없이 지브리 그림체로 사진을 바꿔보며 AI의 발전에 놀라워했다. 그래서 이 기능의 발표일이 수요일이었던 것에 착안해 ‘지브리 수요일’ 이라고 부르기 시작한 것이다.

그림 1. ‘지브리 수요일’에 대해 SNS에서는 다양한 의견이 나타났다. (출처: X)
ChatGPT의 이미지 처리능력이 향상된 것이 핵심이지만 이번 업데이트가 가지는 중요한 시사점은 따로 있다. 바로 인공지능의 접근성과 사용성에 관한 것이다.
프롬프트 엔지니어링의 장벽
대중들이 인공지능의 강력함을 본격적으로 느끼게 된 것은 2022년 11월 ChatGPT가 출시된 이후이다. 텍스트 기반으로 사용자의 질문을 이해하고 맥락에 맞춰 답을 하는 것은 정말 놀라웠다. 초기에는 할루시네이션 (Hallucination, AI가 허위를 진실되게 말하는 현상)이 많았지만 빠르게 기술이 발전하며 AI는 점차 놀라운 완성도를 보여주었다.
동시에 일반인들에게는 생소한 프롬프트 엔지니어링 (Prompt engineering) 이라는 말이 확산되었다. Chat GPT는 자연어를 이해하기 때문에 많은 사람들은 열광했다. 그러나 Chat GPT와 같은 생성형 AI 에게 보다 정확하게 지시를 하기 위해서는 AI가 잘 이해하는 형태로 명령어(Prompt)를 제공하는 것이 중요했다.
그래서 프롬프트 엔지니어 직군이 생겨났고 숙련된 엔지니어는 몸값이 천정부지로 올라가는 현상도 나타났다. 이는 일반인들에게는 큰 장벽이었다. 생성형 AI를 잘 이용하기 위해서 프롬프트 엔지니어링을 배워야 하는데 무엇을 어떻게 배워야 할 지조차 몰랐기 때문이다.
이는 문답형인 ChatGPT 뿐만 아니라 이미지를 편집하는 여러 AI서비스들에서도 마찬가지였다. DALL-E와 같은 대부분의 이미지 생성 AI는 확산 모델 (Diffusion Model)을 사용했다. 이 모델에서 사용자가 원하는 이미지를 얻기 위해서는 매우 세부적이고 긴 프롬프트가 필요했다. 원하는 그림의 배경, 색감, 구도, 스타일 등 모든 요소를 상세히 묘사해야 했다. 이 표현을 할 때 복합적이거나 추상적인 표현을 하면 모델은 이해하지 못했다. 그리고 아무리 프롬프트를 잘 구성한다고 해도 이미지 안의 텍스트는 제대로 표현하지 못했다. 소수의 전문가들이 원하는 이미지를 만들어 낼 수 있었고 많은 사용자들은 긴 시간을 투자해 연구해야 했다.
Chat GPT 업데이트가 가져온 변화, 이미지 생성의 대중화
3월 26일 chat GPT는 이미지 생성 방식을 자기회귀(Auto regressive)로 바꾸었다. 이 방식은 데이터를 한번에 한 픽셀씩 순차적으로 생성하는 인공지능 접근법이다. 기존 확산 모델과 자기 회귀 모델의 차이점은 아래와 같다.
<표. 이미지 모델별 차이 (출처:필자)>
항목 | 확산 모델 (Diffusion Model) | 자기 회귀(Auto regressive) |
---|
생성방식 | 전체 이미지를 점진적으로 개선 | 픽셀을 하나씩 순서대로 생성 |
속도 | 비교적 빠름 | 상대적으로 느림 |
텍스트 표현력 | 텍스트 렌더링에 약함 | 텍스트 렌더링이 매우 우수 |
이미지 퀄리티 | 고품질이지만 세부 묘사 약함 | 매우 정교하고 디테일한 표현이 가능 |
프롬프트 난이도 | 복잡하고 자세한 묘사가 필요 | 간결한 프롬프트로 가능 |
이미지 생성 방식이 바뀌며 프롬프트 난이도가 매우 낮아지게 되었다. 기존에는 아주 자세하게 설명하지 않으면 이미지 생성을 명령하는 것이 어려웠는데 이제는 아주 짧은 설명만으로 높은 완성도의 이미지가 나타난다. 이는 AI가 맥락에 맞는 배경, 조명, 환경 등을 이미지 내에서 스스로 생성하기 때문이다. 평범한 스냅사진을 올리고 ‘벚꽃놀이를 왔다고 생각하고 배경을 바꿔 달라’ 라는 프롬프트를 넣으면 AI가 스스로 밝은 대낮, 구름 없는 맑은 하늘, 봄 배경에 맞는 환경을 스스로 창조해 넣는 것이다.
AI 사용이 점점 더 편리해진다면
서두에 언급한 ‘지브리 수요일’ 현상은 프롬프트 엔지니어링의 장벽을 없애고 대중적인 호응을 이끌어낸 것이기 때문에, AI 발전에 매우 중요한 한걸음이라고 하겠다. 기술의 발전은 늘 있어왔지만 대중이 접근하기 쉽고, 스스로 사용하려 하하 될 때 큰 변화가 생긴다.
스티브 잡스가 아이폰을 발표하기 전, PDA폰이라고 하는 비슷한 기기가 있었다. Window CE 라는 운영체제를 사용했는데 컴퓨터에 능통한 사람이 아니면 다루기 어렵고 에러도 잦았다. 아이폰의 등장은 새로운 기술보다 기술에 대한 접근을 쉽게 한 것에서 큰 의미가 있다.
필자는 지브리 수요일 현상을 보며 그때와 비슷한 느낌을 받았다. 사람들은 스스로 재미있어서 ChatGPT의 이미지 생성을 시도하고 있으며 별다른 프롬프트 없이 AI는 인간이 만족할 수준의 결과물을 만들어내고 있다. 앞으로 인공지능은 계속해서 발전해 나갈 것이다. 다양한 기술이 개발되고 있으나 결국 대중 전체에게 영향을 미치는 것은 인간을 이해하고 쉽고 편리하게 해 주는 기술일 것이다. 이는 금융과 핀테크에도 마찬가지이다. 앞으로 어떤 기술이 제2의 ‘지브리 수요일’이 될지 지켜보자. “끝”.