ChatGPT 이미지, 사진 생성 속도 4배 증가

ChatGPT 이미지, 사진 생성 속도 4배 증가
AI 생성 이미지

GPT 이미지 1.5가 이번 주부터 모든 ChatGPT 사용자와 API(응용 프로그래밍 인터페이스)를 통해 배포되기 시작했습니다. 구글의 나노 바나나 프로(Nano Banana Pro)와 유사하게, GPT 이미지 1.5는 후처리 기능을 제공하여 얼굴의 유사성, 조명, 구성, 색조 등 편집 과정에서 세밀한 수정 조정을 가능하게 하여 일관성을 유지할 수 있습니다. 이는 대부분의 이미지 생성 AI가 반복성에서 부족한 성능을 보이기 때문에 큰 진전을 의미합니다. 사용자가 얼굴 표정을 조정하거나 조명을 차갑게 하는 등의 수정을 요청할 때, 모델은 종종 전체 이미지를 재해석하여 일관성이 결여되는 경우가 많습니다.

ChatGPT 이미지의 새로운 버전은 사진 생성 속도를 4배 빠르게 합니다. GPT 이미지 1.5로 생성된 몇몇 이미지가 포함되어 있습니다. 비디오: OpenAI. 새로운 기능 외에도, 업데이트에서는 사용자들이 ChatGPT의 도구 모음에서 별도의 항목을 통해 이미지 생성 기능에 접근할 수 있도록 하고 있습니다. OpenAI의 애플리케이션 부문 CEO인 피지 시모(Fidji Simo)는 ChatGPT가 이제 창의적인 스튜디오처럼 작동할 수 있다고 밝혔습니다. “새로운 이미지 보기 및 편집 인터페이스는 여러분이 상상하는 대로의 이미지를 쉽게 생성하거나 인기 있는 프롬프트와 사전 설정된 필터에서 영감을 받을 수 있도록 돕습니다.”라고 그는 말했습니다.

이미지 생성 도구의 개선 외에도, OpenAI는 ChatGPT의 시각적 요소를 강화하여 사용자 경험을 향상시키고자 합니다. 시모에 따르면, 회사는 단위 변환이나 스포츠 점수 확인 등과 같은 작업에 유용하게 사용될 수 있도록 검색 쿼리에서 더 많은 이미지를 명확한 출처와 함께 표시할 계획이라고 합니다. “창의성을 발휘할 때, 당신이 하고 있는 것을 보고 형성할 수 있어야 합니다. 이미지가 단어보다 이야기를 더 잘 전달할 수 있을 때, ChatGPT는 그것들을 포함해야 합니다.”라고 시모는 작성했습니다.

GPT 이미지 1.5는 구글과의 경쟁에서 GPT-5.2 모델을 출시한 이후 OpenAI의 최신 움직임입니다. 지난달, OpenAI의 CEO인 샘 알트만(Sam Altman)은 구글이 제미니 3(Gemini 3)와 이미지 생성기 나노 바나나 프로를 발표한 후 AI 분야에서 선두 자리를 유지하기 위한 계획을 수립하며 “레드 알람” 상태를 활성화했습니다. 이 두 제품은 LMArena 평가 기준에서 모두 높은 점수를 기록했습니다.