1. GPT-5.4 압도적 성능 공개
이번주 AI 트렌드의 핵심은 Chat GPT입니다.
OpenAI는 지난주 GPT-5.4 Thinking과 GPT-5.4 Pro를 ChatGPT, API, Codex에 도입했다고 발표했습니다. OpenAI 설명대로라면 이번 버전은 추론, 코딩, 에이전트 워크플로 성능을 하나로 묶은 모델이고, 특히 복잡한 전문 작업에서 더 높은 정확도와 효율을 목표로 하고 있습니다.
1-1. 이제는 답부터가 아니라, “생각의 방향”부터 보여줍니다
GPT-5.4 Thinking은 응답을 만들기 전에 자신의 추론 계획을 먼저 제시하는 방식이 추가됐습니다.
이제는 답변이 완성되기 전에 “이런 순서로 접근하겠다”, “이렇게 정리하겠다” 같은 계획을 먼저 보여주기 때문에, 사용자가 중간에 방향을 조정하기가 훨씬 쉬워졌습니다. OpenAI도 이 점을 강조하면서, 여러 번 다시 설명하지 않아도 요구사항에 더 가까운 결과를 얻도록 설계했다고 밝혔습니다.
이 변화는 꽤 크게 느껴지는데요. 왜냐하면 이제 ChatGPT가 단순히 대답하는 도구가 아니라, 일을 같이 설계하는 도구로서 업무 조력자가 되기 때문이죠.
1-2. 심층 웹 리서치도 더 강해졌습니다
OpenAI는 GPT-5.4에서 심층 웹 리서치 기능도 개선됐다고 밝혔습니다. 특히 매우 구체적인 질문이나, 긴 추론이 필요한 작업에서 더 강한 성능을 보이고 맥락도 더 안정적으로 유지한다고 설명했어요.
이게 왜 중요하냐면, 실제 업무에서는 “요약 좀 해줘”보다 “여러 자료를 비교해서 결론을 정리해줘” 같은 요청이 훨씬 많기 때문입니다. 자료 조사, 리서치, 비교 정리처럼 사람이 시간을 많이 쓰는 작업에서 ChatGPT의 활용도가 더 높아질 가능성이 큽니다.
1-3. 드디어 ‘컴퓨터를 쓰는’ AI 느낌이 더 강해졌습니다
이번 GPT-5.4의 가장 큰 변화 중 하나는 컴퓨터 사용 기능이 기본 제공된다는 점입니다. OpenAI는 GPT-5.4를 자사 범용 모델 가운데 처음으로 최신 수준의 컴퓨터 사용 기능을 기본 탑재한 모델이라고 소개했습니다. 스크린샷을 보고 마우스·키보드 조작을 수행하거나, Playwright 같은 라이브러리를 활용해 실제 컴퓨터 작업 흐름을 다룰 수 있도록 설계됐다고 설명합니다.
쉽게 말하면, 이제는 “이걸 해줘”라고 말했을 때 단순히 설명만 하는 게 아니라 직접 도구를 다루고, 여러 앱을 넘나들며, 워크플로를 수행하는 방향으로 더 가까워졌다는 뜻입니다.
요즘 AI 업계에서 자주 나오는 키워드가 바로 에이전트인데요. GPT-5.4는 이 흐름을 더 분명하게 보여주는 업데이트라고 볼 수 있습니다.
1-4. 100만 토큰 컨텍스트, 긴 작업에 더 유리해졌습니다
GPT-5.4는 최대 100만 토큰 컨텍스트를 지원합니다. OpenAI는 이를 통해 에이전트가 장시간에 걸쳐 작업을 계획하고, 실행하고, 검증할 수 있다고 설명했습니다. 또 도구 검색 기능이 추가돼 다양한 커넥터와 도구를 더 효율적으로 찾아 쓸 수 있게 됐다고 밝혔습니다.
이건 짧은 질문 하나 답하는 데서 끝나는 모델이 아니라, 긴 문서 여러 개를 함께 보고 중간 맥락을 유지하고 복잡한 작업을 이어서 처리하는 데 더 적합하다는 의미예요.
실무에서는 이런 차이가 꽤 크게 느껴집니다.
특히 문서, 회의록, 데이터, 리서치 자료를 한꺼번에 다루는 분들에게요.
1-5. 문서·스프레드시트·프레젠테이션 같은 진짜 일 쪽으로 더 가까워졌습니다

OpenAI는 GPT-5.4가 특히 스프레드시트, 프레젠테이션, 문서 생성·편집 성능을 개선하는 데 중점을 뒀다고 밝혔습니다. 내부 벤치마크에서는 스프레드시트 모델링 평균 점수가 GPT-5.2의 68.4%에서 GPT-5.4는 87.5%로 올랐고, 프레젠테이션 결과물도 인간 평가자의 68%가 더 선호했다고 설명합니다. 또 사실 오류 관련 비식별 프롬프트 세트에서 GPT-5.2 대비 개별 주장 단위 오류 가능성이 33% 낮아졌다고도 밝혔습니다.
이걸 한 줄로 정리하면 이렇습니다.
GPT-5.4는 말 잘하는 챗봇에서, 실제 결과물을 만드는 업무 도구 쪽으로 한 걸음 더 이동했습니다.
2. 윈도우용 Codex 출시
이제 Codex는 맥 유저만의 도구가 아닙니다
OpenAI는 2026년 3월 4일 업데이트를 통해 Codex 앱이 Windows에서도 제공된다고 발표했습니다. Codex 앱은 여러 에이전트를 동시에 관리하고, 장시간 작업을 병렬로 돌리고, 결과를 한곳에서 검토할 수 있도록 만든 에이전트 기반 개발용 커맨드 센터 성격의 앱입니다.
이번 윈도우 버전에서 특히 눈에 띄는 건 Windows 네이티브 환경 지원입니다. OpenAI 개발자 문서에 따르면 Windows용 Codex 앱은 PowerShell과 Windows sandbox를 기반으로 네이티브하게 실행되며, 필요하면 WSL 구성도 사용할 수 있습니다.
이게 왜 의미 있냐면, 많은 개발자들이 여전히 윈도우 환경에서 일하고 있기 때문이에요. 그동안 AI 코딩 도구는 맥 중심, 혹은 리눅스 친화적으로 느껴지는 경우가 많았는데, 이제는 OpenAI도 본격적으로 윈도우 개발 환경까지 에이전트 워크플로를 확장하고 있다는 신호로 볼 수 있습니다.
즉, 이번 소식은 단순히 앱 하나 더 나왔다가 아니라 AI 코딩 에이전트가 점점 더 일상적인 개발 환경 안으로 들어오고 있다는 흐름으로 보는 게 더 맞습니다.
3. AI를 활용한 취약점 발견
이번 주에는 AI가 실제 보안 현장에서 어디까지 갈 수 있는가를 보여주는 사례도 나왔습니다.
Anthropic은 Mozilla와의 협업을 통해 Claude Opus 4.6이 2주 동안 Firefox에서 22개의 취약점을 발견했고, 이 중 14개는 고위험으로 분류됐다고 밝혔습니다. Mozilla 역시 자사 공식 블로그에서 이 협업 결과로 22개의 CVE가 발급됐고, 관련 문제는 최신 Firefox에 수정 반영됐다고 설명했습니다. 국내에서는 AI타임스도 이 내용을 전하며, AI가 약 20분 만에 자바스크립트 엔진에서 심각한 메모리 취약점을 찾아냈다고 보도했습니다.
여기서 중요한 건 숫자보다 방향입니다.
이전까지 AI를 두고 “코드 잘 짜네”, “문서 잘 쓰네” 정도로 받아들였다면, 이제는 보안 점검, 버그 탐지, 취약점 분석 같은 고난도 영역에서도 AI가 실제 성과를 내기 시작했다는 점이 더 중요해 보입니다.
물론 여기에는 단서도 있습니다. Anthropic과 Mozilla 모두 사람 연구자의 검증과 협업 과정을 강조했습니다. 다시 말해, AI가 단독으로 모든 걸 해결한다기보다, 보안 전문가의 생산성을 크게 높이는 방향으로 먼저 자리 잡을 가능성이 커 보입니다.
AX의 시작은 기술이 아니라 ‘문제 정의’에서 출발합니다.
생성형 AI 활용부터 조직 전반의 AI 확산 전략까지, 귀사의 상황에 맞춘 최적의 솔루션을 함께 고민하겠습니다. AI·AX 전환과 관련한 교육, 컨설팅, 실행 방안이 필요하시다면 언제든 캐럿글로벌로 문의해 주세요!😊
