이번 주는 정말 숨 막힐 정도로 많은 일이 있었어요. OpenAI의 이미지 모델 새 버전, DeepSeek의 오픈소스 폭탄, GPT-5.5 출시, 그리고 개발자들 사이에서 빠르게 퍼지고 있는 새로운 개념 하네스 엔지니어링까지. 한 주 만에 이렇게 많은 소식이 쏟아지는 게 요즘 AI 판이에요. 하나씩 정리해 드릴게요.
1. ChatGPT Images 2.0 – 이미지가 드디어 생각을 한다
4월 21일, OpenAI가 ChatGPT Images 2.0(gpt-image-2)을 출시하며 이미지 생성에 추론 기능을 결합한 최초의 이미지 모델을 선보였어요. 출시 12시간 만에 Image Arena 리더보드 1위를 차지하며 242점의 역대 최대 격차로 2위를 앞질렀습니다.
이 모델은 Instant와 Thinking 두 가지 모드로 작동하고, Thinking 모드는 프롬프트를 분석하고, 웹을 검색하고, 그림을 그리기 전에 스스로 결과물을 검증하는 방식으로 동작해요. 배치 생성은 한 번에 최대 8장의 이미지를 캐릭터·스타일 일관성을 유지하며 생성할 수 있어, 만화 페이지나 스토리보드, 멀티씬 마케팅 키트까지 가능해졌습니다.
OpenAI는 이번 Images 2.0에 대해 이미지는 장식이 아니라 언어라며 단순 렌더링 도구에서 시각적 사고 파트너로의 전환을 선언했어요.
👉 인사이트
이제 이미지를 생성하는 것보다 어떤 목적과 맥락으로 기획하느냐가 더 중요해졌습니다. 자동화 흐름 안에 이미지 생성이 자연스럽게 녹아드는 시대가 오고 있어요. 마케터나 디자이너에게 이건 단순한 툴 업그레이드가 아니라 일하는 방식 자체를 다시 생각해 봐야 하는 신호일 수 있습니다.
2. GPT-5.5 등장 – 쉬지 않는 OpenAI의 출시 공세
한국 시각 4월 24일 오전 3시경, OpenAI가 GPT-5.5 Thinking과 GPT-5.5 Pro를 공개했어요. Codex 전용 모델 없이 앞선 두 모델에 기능이 통합된 형태로 출시됐습니다.
4월 22일에는 Codex 기반의 워크스페이스 에이전트도 공개하면서, 팀 단위로 복잡한 업무와 장기 워크플로우를 처리할 수 있는 공유 에이전트 기능까지 선보였어요. 업계에서는 OpenAI의 이 같은 릴리즈 속도 자체가 경쟁사 진입을 막는 장벽이 되고 있다는 분석도 나옵니다.
👉 인사이트
지금 OpenAI는 모델 성능 경쟁보다 출시 속도와 생태계 장악을 전략으로 쓰고 있는 것 같아요. 사용자가 "또 새 모델이 나왔네"를 반복하다 보면, 어느새 갈아타기가 더 어려워지는 구조가 되는 거죠.
3. DeepSeek V4 – 오픈소스가 처음으로 폐쇄형 플래그십을 꺾다
이번 주 개발자 커뮤니티에서 가장 화제가 된 소식 중 하나예요.
4월 24일, DeepSeek이 V4-Pro와 V4-Flash를 동시에 오픈소스로 공개했습니다. V4-Pro는 LiveCodeBench, Codeforces, Apex 등 주요 코딩 벤치마크에서 GPT-5.4, Claude Opus 4.6, Gemini 3.1-Pro를 제쳤어요. 오픈소스 모델이 핵심 코드 능력에서 폐쇄형 플래그십 모델을 전면적으로 압도한 건 2026년의 매우 상징적인 사건입니다.
V4-Pro는 1.6T 파라미터(활성 파라미터 49B)의 MoE 모델로, 1M 컨텍스트 길이를 지원합니다. 100만 토큰 컨텍스트에서 단일 토큰 추론 FLOPs가 V3.2 대비 27%, KV 캐시는 10%만 필요해 장문 처리 효율이 대폭 개선됐어요.
다만, 현재는 프리뷰 단계라 정식 릴리즈가 아니라는 점은 참고해 두세요.
👉 인사이트
오픈소스가 폐쇄형 모델을 꺾었다는 건, AI 접근성 지형이 본격적으로 바뀌고 있다는 신호예요. 조직 입장에서는 "어떤 비싼 유료 모델을 쓸 것인가"보다 "어떤 오픈소스 모델을 어떻게 우리 환경에 올릴 것인가"를 함께 고민할 타이밍이 됐습니다.
4. 하네스 엔지니어링 – 에이전트 시대의 새로운 직무 역량
이번 주 개발자 생태계에서 가장 빠르게 퍼지고 있는 개념 중 하나예요. 처음 들어보셨다면, 앞으로 자주 접하게 될 거예요.
하네스 엔지니어링은 AI 에이전트의 행동을 지배하는 시스템, 제약, 피드백 루프를 설계하는 분야예요. 핵심 공식은 에이전트 = 모델 + 하네스로 요약됩니다. 하네스란 에이전트를 감싸는 모든 것, 즉 에이전트를 안내하는 가이드, 행동을 검증하는 센서, 그리고 에이전트가 추론하는 데 필요한 데이터 컨텍스트 파이프라인을 포함해요.
Thoughtworks의 Birgitta Böckeler가 제시한 멘탈 모델에 따르면, 에이전트의 신뢰를 높이기 위해서는 두 가지 제어 방식이 필요합니다.
- 가이드(피드포워드 제어): 에이전트가 행동하기 전에 좋은 결과물을 만들 확률을 높임
- 센서(피드백 제어): 에이전트가 행동한 후 스스로 수정할 수 있도록 도움
4월 AI Engineer World's Fair에서 세 명의 독립적인 연사가 에이전트 하네스와 컨텍스트 엔지니어링을 다음 우선순위 1위로 꼽았다고 해요. 2년간의 모델 경쟁 이후 업계의 관심이 이동했다는 신호입니다.
👉 인사이트
에이전트를 만드는 것보다 에이전트가 신뢰할 수 있게 작동하는 환경을 설계하는 것이 더 어렵고 중요한 일이 됐어요. 앞으로 이 에이전트는 어떤 하네스 위에서 돌아가는지를 물어볼 수 있는 역량이 기술 조직과 비기술 조직 모두에서 중요한 판단 기준이 될 것 같습니다.
이번 주 키워드를 하나로 묶자면, 에이전트가 실제 업무 환경에 본격적으로 내려앉기 시작했다는 느낌이에요. 모델 성능 경쟁보다 어떻게 안정적으로 운영하고 신뢰를 쌓을지가 핵심 질문이 되고 있습니다.
AX의 시작은 기술이 아니라 문제 정의에서 출발합니다.
생성형 AI 활용부터 조직 전반의 AI 확산 전략까지, 귀사의 상황에 맞춘 최적의 솔루션을 함께 고민하겠습니다. AI·AX 전환과 관련한 교육, 컨설팅, 실행 방안이 필요하시다면 언제든 캐럿글로벌로 문의해 주세요! 😊
