챗GPT 더 '똑똑'해졌다…새로운 이미지 생성 AI 모델 출시
"텍스트와 이미지 첫 결합 모델…이용자 의도 파악해 생성"카툰·메뉴판·자연법칙 등 복잡한 이미지도 손쉽게 만들어내
김태종
입력 : 2025.03.26 03:00:00
입력 : 2025.03.26 03:00:00

[샌프란시스코=연합뉴스.오픈AI 제공]
(샌프란시스코=연합뉴스) 김태종 특파원 = 챗GPT 개발사 오픈AI가 한층 진화한 새로운 이미지 생성 인공지능(AI) 모델을 25일(현지시간) 선보였다.
오픈AI는 이날부터 '챗GPT-4o(포오) 이미지 생성'(ChatGPT-4o Image Generation) 모델을 출시한다고 밝혔다.
새 모델은 오픈AI의 시그니처 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델로, 텍스트와 이미지를 통합한 첫 모델이라고 오픈AI는 설명했다.
오픈AI의 멀티모달 담당인 가브리엘 고는 "우리는 텍스트에 대한 지능을 가진 GPT-4의 강점과 최고의 이미지 생성 모델의 시각적 지능을 결합한 모델을 만들고자 했다"며 "이번 모델이 바로 그 목표를 달성한 결과물"이라고 말했다.
새 모델은 오픈AI의 기존 이미지 모델인 '달리'(DALL-E)보다 더 쉽고 정교하게 이미지를 생성한다고 오픈AI는 소개했다.
기존에는 이용자가 원하는 이미지를 위해 프롬프트를 하나하나 입력해야 했지만, 새 모델은 이용자의 의도를 파악해 이미지를 생성한다는 것이다.
복잡한 요청도 쉽게 수행한다고 오프AI는 전했다.
예를 들어, 기존 AI 이미지 생성 모델들은 단순히 자전거 이미지는 잘 생성하지만, '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 어려움을 겪었다.
훈련되지 않은 데이터였기 때문이다.

[샌프란시스코=연합뉴스.오픈AI 제공]
무엇보다 텍스트를 이미지에 정확히 삽입하는 기능이 크게 개선됐다는 게 오픈AI의 설명이다.
'여러 종류의 고래를 보여주는 포스터를 만들어 줘'라고 요청하면 고래의 종류와 이름을 정확히 매칭해 생성한다.
기존 모델은 이런 객체 속성 관계를 잘 이해하지 못하고 글씨는 종종 깨지는 경우가 많았지만, 새 모델은 훨씬 더 복잡한 지시도 잘 수행하는 것으로 평가됐다.
자연법칙에 관한 이미지도 쉽게 만들어낸다.
무지개를 정의하는 '뉴턴의 프리즘 실험'에 관한 이미지를 간단한 설명과 함께 생성해달라고 하면 문구가 들어간 이미지가 한눈에 보기 쉽게 생성된다.
만화를 그려달라고 하면 대화가 들어간 카툰이 깔끔하게 생성되고, 메뉴판이나 수학 공식을 그려달라고 하면 한눈에 보기 쉽게 생성한다.
투명 배경도 지원해 강아지 스티커를 만들 때 투명 배경을 요청하면 이를 반영할 수 있고, 비즈니스 로고와 같은 이미지도 투명 배경으로 생성할 수 있다.
오픈AI는 새 모델이 이미지를 생성한다는 점에서 기존 '달리'의 업그레이드 버전이긴 하지만, 두 모델의 기반 기술이 완전히 다르고 이에 새 모델에서 다양한 개선이 이뤄졌다고 설명했다.
오픈AI는 새 모델이 또 한국어로도 이미지 생성이 가능하며 이날부터 챗GPT 프로 등 유료 가입자는 물론, 무료 가입자도 사용할 수 있다고 전했다.

[샌프란시스코=연합뉴스.오픈AI 제공]
taejong75@yna.co.kr(끝)
증권 주요 뉴스
증권 많이 본 뉴스
매일경제 마켓에서 지난 2시간동안
많이 조회된 뉴스입니다.