1. Claude Opus 4.5 – 에이전트·코딩 특화 최상위 모델

Anthropic이 Claude Opus 4.5를 공개했습니다. 공식 설명부터 “에이전트, 코딩, 컴퓨터 사용에 가장 강력한 모델”이라는 표현을 쓰고 있는데요.
- 화면 스크린샷에서 특정 영역을 확대해 분석하는 새로운 ‘줌’ 액션 지원
- 슬라이드·스프레드시트·복잡한 UI를 보고 직접 클릭·조작하는 컴퓨터 사용 능력 강화
- GitHub Copilot에도 탑재돼, VS Code·웹·모바일·CLI 등에서 선택 가능한 상위 모델로 들어감
👉 인사이트
이제 “코파일럿”이 단순 자동완성이 아니라, ‘모니터를 보면서 대신 클릭해주는 동료’ 수준까지 올라가고 있습니다. 기존에 주니어 개발자·운영 담당자가 하던 반복 업무(관리 콘솔 클릭, 리포트 추출 등)는 점점 “에이전트 + 시니어 1명이 감독” 구조로 바뀔 가능성이 커 보입니다.
2. Gemini 3 Deep Think – “진짜 생각하는 모드”

Google은 Gemini Ultra 유저를 대상으로 “Gemini 3 Deep Think”를 제공합니다. CEO 순다 피차이가 직접 “지금까지 우리 중 가장 강력한 추론 능력”이라고 표현할 정도로, 복잡한 수학·과학·논리 문제에 최적화된 모드인데요.
- 인간 수준의 벤치마크(ARC-AGI 2, Humanity’s Last Exam 등)에서 최고 성능을 기록
- 여러 가설을 병렬로 두고 비교·검증하는 “병렬 추론” 구조를 강조
👉 인사이트
Gemini 3 Deep Think는 단순한 언어 모델을 넘어, 기업의 문제 해결 방식에 새로운 가능성을 제공합니다. 복잡한 수학, 과학, 논리 문제를 해결하는 능력을 기반으로 ‘전략적 의사 결정 고도화’, ‘R&D 및 기술 개발 고속화’, ‘비즈니스 로직 자동화’ 등 생산성 도구에서 ‘지적 문제 해결 파트너’로 역할을 확장한 것이죠.
3. Google Antigravity – 에이전트가 코딩·테스트까지 도맡는 IDE
Google은 코드 제작부터 테스트까지 전 과정을 수행하는 AI 코딩 에이전트 Antigravity를 출시했습니다. 이전 포스팅을 통해 직접 러닝 루트 사이트를 만들어보며 Antigravity의 특장점을 소개했었죠.
👉 인사이트 (HR 관점)
이제 중요한 역량은 “코드를 잘 치는 사람”보다 “AI 에이전트에게 일을 잘 시키는 사람”입니다. 사내에서 Citizen Developer(시민 개발자) 프로그램을 고민하고 계신다면, Antigravity 같은 에이전트 IDE는 교육·실습에 아주 좋은 테스트베드가 될 수 있어요.
4. OpenAI ‘Code Red’ 발동 – ChatGPT 비상 체제

Open AI CEO 샘 올트만이 내부적으로 Code Red를 발동했다는 내용이 연이어 보도됐습니다.
이는 Google이 Gemini 3 pro, Nanobanan Pro 및 Antigravity 등 고성능 AI 서비스를 대거 발표하면서 Open AI가 상당한 위기감을 느낀 데 따른 조치로 해석됩니다.
OpenAI는 이에 대응하여 광고·쇼핑·에이전트 관련 일부 로드맵을 뒤로 미루고, ChatGPT 품질 개선에 올인하는 모드로 전환하겠다는 방침을 밝힌 상태입니다.
👉 인사이트
AI의 최강자로 꼽히는 OpenAI가 스스로 ‘코드 레드(Code Red)’를 발동했다는 많은 것을 시사합니다. 앞으로 Google, OpenAI, Anthropic 등 대형 AI 기업 간 경쟁이 더욱 치열해지면서, 더 빠르고, 더 안정적이며, 사용자 맞춤형 답변을 잘 제공하는 모델이 계속 등장할 것입니다.
이 과정에서 각 조직은 AI를 활용해 코드 작성, 썸네일 제작, 광고 크리에이티브 등 기존에 사람이 수행하던 업무를 점차 대체하게 될 것이고, 이를 통해 비용을 절감하면서도 더 나은 품질의 콘텐츠를 만들어낼 수 있을 것입니다.
즉, AI를 잘 활용하는 조직이 생존한다는 것을 의미하죠.
5. 알리바바의 오픈소스 이미지 모델, Z-Image

알리바바가 6B 파라미터의 경량 텍스트-투-이미지 모델 ‘Z-Image’를 공개했습니다. 이 모델은 오픈소스로 제공되며, GitHub와 웹 서비스 형태로 모두 이용할 수 있고, Turbo(생성), Edit(편집), Base 세 가지 버전을 제공합니다.
👉 인사이트
무겁게 작동하던 이미지 생성 모델이 점차 ‘가볍고, 로컬에서 돌릴 수 있는 실용 모델’로 옮겨가는 흐름입니다. 덕분에 이제는 디자이너가 아니더라도 간단한 텍스트로 원하는 이미지를 제작하고, 업무에 바로 활용 할 수 있는 기회가 열린 것이죠.
이제는 전 직원이 기본적인 프롬프트 작성 능력과 시각 커뮤니케이션 감각을 갖추는 것이 조직의 경쟁력이 되는 시대가 된 것 같습니다.
6. Kling O1 – 영상 생성도 ‘옴니(Omni) 시대’로

쿠아이쇼(Kuaishou)의 Kling AI가 Kling O1이라는 통합 멀티모달 영상 모델을 출시했습니다. 발표에 따르면, 텍스트·이미지·비디오를 하나의 파이프라인에서 다루는 ‘통합 비디오 엔진’을 지향합니다.
- 자연어로 영상 장면 설명 → 시작·끝 프레임 제어 → 특정 구간만 편집 등 세밀한 컨트롤 지원
- 이미지 모델(Kling O1 Image)도 함께 공개해 “이미지 → 영상”으로 이어지는 워크플로우 제공
- FAL, WaveSpeed 등 플랫폼을 통해 API 형태로도 제공
👉 인사이트
“촬영 전에 콘티·무드필름을 싹 다 AI로 만들어 보는 시대”가 열리고 있습니다. 마케팅·교육·브랜드 영상 제작에서 “기획자·디자이너가 곧 영상 제작자”가 되는 구조가 가속화되고 있죠.
7. Meta SAM 3D – 사진 한 장으로 3D 만들기
Meta는 Segment Anything 시리즈의 최신작으로 SAM 3와 SAM 3D를 발표했습니다. SAM 3는 이미지·영상에서 객체를 탐지·세그멘테이션·트래킹하고, SAM 3D는 사진 한 장만으로 사람·사물의 3D 형상과 포즈를 복원하는 모델입니다.
- e커머스(상품 3D 뷰), 게임·XR 콘텐츠, 디지털 휴먼 제작 등 활용도가 매우 넓음
👉 인사이트
3D 작업의 장벽이 “전문 툴”에서 “이미지 한 장 + 프롬프트”까지 낮아지는 순간입니다. 디자인·제조·교육 등에서 “2D 중심 콘텐츠 팀”이 “라이트한 3D 팀”으로 변신할 수 있는 기반이 마련되고 있어요.
🏁 마무리
지난 주만 놓고 봐도,
2. 더 똑똑한 에이전트 (Antigravity, ChatGPT 쇼핑, OpenAI Code Red)
3. 더 정교한 비전·영상·3D (Z-Image, Kling O1, SAM 3D)
이렇게 세 축이 동시에 업그레이드되고 있습니다.
하지만 성능 경쟁이 치열해질수록, LLM의 환각(Hallucination)을 정확히 이해하고 관리하는 능력이 더 중요해집니다. 이전에 OpenAI의 “Why Language Models Hallucinate” 논문을 소개하면서, LLM이 왜 그럴듯한 거짓말을 하는지, 우리가 어떻게 비판적으로 활용해야 하는지 정리해 드린 적이 있어요.
결국 관건은 하나입니다.
“우리 조직은 이 강력한 도구들을 어디까지 맡기고, 어디부터는 사람이 책임지고 검증하게 할 것인가?”
이런 질문에 같이 답을 찾아가는 여정, 캐럿글로벌이 함께하겠습니다!
빠르게 변화하는 AI 시대, 조직의 AX(AI Transformation) 전환은 더 이상 선택이 아닌 필수입니다.
AX의 시작은 기술이 아니라 ‘문제 정의’에서 출발합니다.
생성형 AI 활용부터 조직 전반의 AI 확산 전략까지, 귀사의 상황에 맞춘 최적의 솔루션을 함께 고민하겠습니다. AI·AX 전환과 관련한 교육, 컨설팅, 실행 방안이 필요하시다면 언제든 캐럿글로벌로 문의해 주세요!😊
