4월 셋째 주, 5일 동안 5개의 도메인 특화 AI 제품이 쏟아졌음. Anthropic은 Claude Design과 Opus 4.7을 내놨고, OpenAI는 생명과학 전용 GPT-Rosalind, Codex 대규모 업데이트, 차세대 Agents SDK를 출시했음. Cloudflare는 Agent Cloud를 열었음.
1. 우연이 아님. 세계 최대 AI 연구소 둘과 인프라 대기업 하나가 같은 주에 같은 방향으로 움직인 것임. “하나의 모델이 모든 걸 한다” 시대가 끝나고, “AI가 당신의 직업을 안다” 시대가 열리고 있다는 신호임.
2. 지난 2년간 AI 경쟁은 규모에 관한 것이었음. 파라미터를 더 쌓고, 컴퓨트를 더 태우고, 벤치마크 숫자를 더 올리는 경쟁이었음. 그런데 서사가 바뀌고 있음. 새로운 경쟁은 깊이에 관한 것임. 어떤 AI가 생화학을 이해하는가, 어떤 AI가 디자인 시스템을 아는가, 어떤 AI가 macOS 터미널에서 프로덕션 코드를 쓸 수 있는가.
3. 가트너는 2027년까지 기업이 사용하는 생성형 AI 모델의 50% 이상이 도메인 특화 AI 모델(Domain-Specific Language Model)이 될 것으로 전망했음. 2023년에는 약 1%에 불과했음. 헬스케어 AI 투자는 $500M(약 7,200억 원)을 넘겼음. 버티컬 모델의 환각률은 범용 모델 대비 70~85% 낮아졌음 (AIMultiple, Future Processing).
4. 이 글은 변곡점을 찍은 한 주의 기록이자, 기업 AI 전략에 던지는 질문임.
>
TL;DR — 범용 AI 넘어 버티컬 AI 시대 개막
4월 13~17일, 생명과학/디자인/코딩/에이전트 인프라까지 도메인 특화 제품 5개 동시 출시 GPT-Rosalind BixBench 1위, Claude Design 디자인 반복 20회에서 2회로 단축 Opus 4.7 SWE-bench 87.6%(+6.8pp) 달성하면서 가격 동결 — 버티컬 제품을 구동하는 수평 엔진
INSIGHT
AI 경쟁은 가장 큰 모델에서 해당 도메인을 가장 깊이 아는 모델로 전환됐음. 5일간 5개 출시가 그 변곡점임.
ACTION
자사 워크플로우에 맞는 버티컬 AI를 점검할 시점임. 가트너 전망: 2027년까지 기업 AI의 50% 이상이 도메인 특화형으로 전환.
5일간 5개 출시 — 무슨 일이 있었나
5. 5일. 5개 출시. 하나같이 범용 벤치마크가 아닌 특정 직업 도메인을 겨냥한 제품임.
FIG 1
5개 출시, 하나의 테제: 버티컬 AI 수렴
SOURCE: TheByteDive 분석, 2026년 4월
6. 타임라인을 정리하면 이렇게 됨.
| 날짜 | 제품 | 기업 | 도메인 |
|---|---|---|---|
| 4/13 | Agent Cloud | Cloudflare + OpenAI | 에이전트 인프라 |
| 4/15 | Agents SDK v2 | OpenAI | 개발자 도구 |
| 4/16 | GPT-Rosalind | OpenAI | 생명과학 |
| 4/16 | Codex 업데이트 | OpenAI | 소프트웨어 개발 |
| 4/16 | Opus 4.7 | Anthropic | 수평 엔진 |
| 4/17 | Claude Design | Anthropic | 디자인 시스템 |
7. 패턴이 분명함. OpenAI는 “GPT-5″를 내놓지 않았음. 생화학자를 위한 모델을 만들었음. Anthropic은 “Claude 4″를 발표하지 않았음. 두 문장으로 프로토타입을 만드는 제품을 출시한 것임.
8. 쉽게 말하면 이렇게 됨. 범용 AI는 맥가이버 칼과 같음. 뭐든 할 수 있지만 어떤 것도 완벽하지 않음. 도메인 특화 AI는 주방장의 식칼임. 하나의 일을 위해 설계됐고, 그 일에서는 압도적인 것임.
GPT-Rosalind: AI가 생화학자처럼 사고하기 시작했음
9. GPT-Rosalind는 OpenAI 최초의 목적 빌드(Purpose-Built) 도메인 모델임. 범용 GPT를 파인튜닝한 것이 아님. 약물 발견, 유전체학, 단백질 추론, 실험 계획에 최적화된 아키텍처를 새로 설계한 것임 (OpenAI Blog).
10. 숫자가 야심을 뒷받침함. Rosalind는 바이오 AI 추론 분야 선도 벤치마크인 BixBench에서 1위를 차지했음. 분자 상호작용 이해와 임상시험 설계에서 모든 범용 모델을 압도했음 (MarkTechPost).
신뢰 접근 파트너
11. OpenAI는 Rosalind를 공개 출시하지 않았음. 대신 4개 기업과 신뢰 접근 프로그램(Trusted Access Program)을 가동했음. Amgen(신약 개발), Moderna(mRNA 치료제), Allen Institute(오픈 연구), Thermo Fisher Scientific(실험 장비)임 (Axios).
12. 포지셔닝이 명확함. “과학자를 대체하지 않고, 가장 시간이 많이 드는 분석 작업을 가속한다”는 것임. AI가 직업을 뺏는다는 이야기가 아님. AI가 전문가를 증폭시킨다는 이야기임.
13. 비과학자에게 왜 중요한가. 패턴이 반복될 것이기 때문임. 생화학 전용 모델을 만들었다면, 법률 분석, 재무 모델링, 공급망 최적화 전용 모델이 나오는 것은 시간 문제임.
Claude Design: 두 문장으로 프로토타입을 만들게 됨
14. Anthropic의 Claude Design은 버티컬 동전의 반대편임. Rosalind가 과학자를 겨냥했다면, Claude Design은 디자이너와 프로덕트 팀을 겨냥한 것임 (Anthropic Blog).
15. 효율 개선 폭이 상당함. 교육 플랫폼 Brilliant는 경쟁 도구에서 20회 이상 필요했던 프롬프트가 Claude Design에서 2회로 줄었다고 보고했음. Datadog은 1주일 걸리던 브리프-목업-리뷰 사이클을 단일 대화로 압축했음 (TechCrunch, VentureBeat).
차별점은 무엇인가
16. Claude Design은 이미지 생성기가 아님. 디자인 시스템을 이해하는 것임. 간격, 타이포그래피 계층, 컴포넌트 라이브러리를 파악하고 브랜드 디자인 토큰을 자동 적용함. PPTX, Canva, HTML로 내보내기가 가능함.
17. 가장 주목할 기능은 Claude Code 핸드오프임. 디자인이 승인되면 Claude Design이 구현을 위해 Claude Code에 직접 전달하는 것임. “어떻게 보여야 하는가”와 “작동하는 코드” 사이의 간극이 한 번의 대화로 줄어든 것임.
18. 비유하면 디자인 에이전시가 프로덕션 코드까지 써주는 것임. 비용은 일부에 불과하고 대화 속도로 작동함.
Codex: 개발자의 완전한 스택이 됨
19. OpenAI의 Codex 업데이트는 덜 화려했지만, 가장 큰 사용자 기반에 영향을 미치는 것임. 주간 활성 개발자가 300만 명임 (OpenAI Blog, gHacks).
20. 90개 이상의 플러그인이 추가되면서 Codex는 코드 어시스턴트에서 완전한 개발 환경으로 진화했음. 데이터베이스 쿼리, API 테스팅, CI/CD 파이프라인 설정까지 5개 도구를 오가며 하던 작업이 단일 인터페이스 안에 들어온 것임.
macOS 컴퓨터 사용
21. 핵심 기능은 macOS 데스크톱 제어임. Codex가 애플리케이션을 탐색하고, 버튼을 클릭하고, 폼을 채우고, 화면을 읽을 수 있게 됨. 이론이 아님. 이미 출시된 기능임 (MacRumors).
22. 개발자에게는 테스트 스위트 실행, 배포 로그 확인, 빌드 에러 수정을 터미널 없이 할 수 있게 된다는 뜻임. 비개발자에게는 AI가 텍스트가 아닌 화면을 통해 컴퓨터를 사용하는 법을 배우고 있다는 신호임.
인프라 경쟁: Agents SDK + Agent Cloud
23. 제품은 인프라만큼만 좋을 수 있음. 두 개의 발표가 이 문제를 정면으로 다뤘음.
FIG 2
수평 엔진: Opus 4.6 → 4.7 벤치마크 도약
SOURCE: Anthropic Blog, 2026년 4월
24. OpenAI의 Agents SDK v2는 7개 프로바이더의 네이티브 샌드박스 환경을 도입했음. 신뢰할 수 없는 코드 실행을 격리해야 하는 기업 배포의 핵심 요건임 (OpenAI Blog, GeekNews).
25. 쉽게 말하면 반도체 공장의 클린룸과 같은 것임. 먼지 나는 차고에서는 신뢰할 수 있는 칩을 만들 수 없음. 마찬가지로 격리 보장 없이 AI 에이전트를 프로덕션에 배포할 수 없음.
Cloudflare Agent Cloud
26. Cloudflare와 OpenAI가 공동 출시한 Agent Cloud는 단일 API로 70개 이상 모델, 12개 이상 프로바이더에 접근할 수 있는 AI 에이전트 프로덕션 런타임임 (SiliconANGLE, Cloudflare).
27. 핵심 혁신은 Dynamic Workers임. 에이전트별로 격리된 런타임 환경을 생성해서 하나의 에이전트 장애가 다른 에이전트로 번지지 않게 하는 것임. 기업이 도메인 특화 에이전트를 대규모로 배포할 수 있게 해주는 마지막 퍼즐임.
28. Oscar Health는 이미 이 플랫폼을 사용해 임상 기록 워크플로우를 자동화하고 있음. 범용 인프라 위에 도메인 특화 에이전트를 구축하고, 민감한 헬스케어 데이터를 엔터프라이즈급 격리로 처리하는 사례임.
수평 엔진: Opus 4.7이 말하는 전략
29. 버티컬 제품이 헤드라인을 잡는 동안, Anthropic은 그 제품들을 구동하는 엔진을 조용히 출시했음. Opus 4.7은 Claude Design 밑에 깔린 수평 기반이고, 벤치마크가 전략을 드러내는 것임 (Anthropic Blog, GeekNews).
| 벤치마크 | Opus 4.6 | Opus 4.7 | 변화 |
|---|---|---|---|
| SWE-bench Verified | 80.8% | 87.6% | +6.8pp |
| CursorBench | 58% | 70% | +12pp |
| Finance Agent | — | 64.4% | 신규 |
| 비전 해상도 | 780px | 2,576px | 3.3배 |
30. SWE-bench 80.8%에서 87.6%로의 도약(+6.8pp)은 소프트웨어 엔지니어링 벤치마크 최상위에 해당함. 실제 IDE 코딩 작업을 측정하는 CursorBench는 58%에서 70%로 올랐음.
31. 두 가지 디테일이 눈에 띔. Finance Agent 벤치마크 64.4%는 Anthropic이 수평 모델 안에서 도메인 특화 역량을 테스트하고 있다는 신호임. 비전 해상도 3.3배 향상(2,576px)은 Claude Design이 복잡한 레이아웃을 실제로 보고 이해할 수 있게 만든 기반임.
32. 가격은 변하지 않았음. 입력 $5, 출력 $25(백만 토큰당). Anthropic은 가격이 아닌 달러당 성능으로 경쟁하고 있는 것임.
기업 AI 전략에 던지는 질문
33. 한 주에 5개가 쏟아진 것은 우연이 아님. 시장 신호임. “어떤 모델이 가장 똑똑한가?” 시대가 끝나고 “어떤 AI가 우리 업종을 아는가?” 시대가 시작되고 있는 것임.
의사결정자에게
34. “AI를 도입해야 하는가?”는 이미 지난 질문임. 지금 질문은 “어떤 도메인 특화 AI가 우리 워크플로우에 맞는가?”임. 인프라는 준비됐음(Agents SDK + Agent Cloud). 버티컬 제품도 출시됐음(Rosalind, Claude Design, Codex). 수평 엔진도 충분히 강력함(Opus 4.7).
35. 가트너 전망대로 2027년까지 기업 생성형 AI 모델의 50% 이상이 도메인 특화형이 될 것임. 2023년에는 약 1%에 불과했음 (AIMultiple). 내부 역량을 키울 창이 닫히고 있는 것임.
한국 기업이 지금 해야 할 것
36. 중소벤처기업부가 2026년 1분기에 스마트 제조혁신 Multi AI Agent R&D 지원 사업을 시작했음. 제조 품질관리, 공급망 최적화, 예측 정비에 도메인 특화 에이전트를 적용하는 방향으로, 버티컬 AI 트렌드와 정확히 맞물리는 것임.
37. 한국 기업이 직면한 구조적 과제가 있음. 글로벌 버티컬 AI 제품 대부분이 영어로 먼저 출시되고, 한국어 지원은 6~12개월 뒤처지는 것임. 지금 Agents SDK 샌드박스와 Agent Cloud 인프라를 활용해 도메인 특화 파인튜닝 역량을 구축하는 기업이 구조적 우위를 확보하게 됨.
38. 삼성SDS 인사이트 리포트도 버티컬 AI 에이전트의 국내 모멘텀을 확인하고 있음. 도메인 특화 AI는 실리콘밸리 실험이 아님. 한국 제조업의 필수 과제가 된 것임 (Samsung SDS).
Build vs Buy 프레임워크
39. 모든 기업이 자체 버티컬 AI를 구축할 필요는 없음. 의사결정 프레임워크를 정리하면 이렇게 됨.
| 시나리오 | 권장 전략 |
|---|---|
| 독점 데이터 + 규제 해자 보유 | 도메인 특화 모델 자체 구축 (내부 데이터 파인튜닝) |
| 표준 워크플로우 + 속도 우선 | 버티컬 SaaS 구매 (Rosalind, Claude Design) |
| 에이전트 오케스트레이션 필요 | 인프라 레이어 도입 (Agents SDK + Agent Cloud) |
| 하이브리드 (대부분의 기업) | 버티컬 제품 구매 + 자사 인프라 위 맞춤 에이전트 구축 |
40. 버티컬 제품이 존재하는 영역에서는 사고, 독점 데이터로 해자를 만들 수 있는 영역에서는 직접 짓는 하이브리드 전략이 2027~2028년 주류가 될 전망임.
한줄 코멘트. AI 경쟁은 “가장 큰 모델”이 아님. “해당 도메인을 가장 깊이 이해하는 모델”이 승자가 되는 것임. 5일간 5개 출시가 그 변곡점을 찍었음.
직장인 시사점. “AI를 쓸 수 있는가?”에서 “AI가 내 업무를 이해하는가?”로 질문이 바뀌고 있음. 지금 자신의 업무 영역에 적용 가능한 버티컬 AI 도구를 탐색해볼 시점임. 2028년에 경쟁력을 갖는 직장인은 범용 프롬프트 엔지니어가 아니라 도메인 특화 AI 파워유저가 될 것임.
INSIGHT
AI 경쟁은 '가장 큰 모델'에서 '해당 도메인을 가장 깊이 아는 모델'로 전환됐음. 5일간 5개 출시가 그 변곡점임.
ACTION
자사 워크플로우에 맞는 버티컬 AI를 점검할 시점임. 가트너 전망: 2027년까지 기업 AI의 50% 이상이 도메인 특화형으로 전환.
자주 묻는 질문 (FAQ)
Q. 도메인 특화 AI 모델은 범용 모델과 무엇이 다른가요?
A. 도메인 특화 AI 모델은 생명과학, 디자인, 소프트웨어 엔지니어링 등 특정 산업이나 직무에 최적화된 모델입니다. 범용 모델이 모든 주제를 평균 수준으로 처리하는 반면, 도메인 특화 모델은 해당 분야에서 높은 정확도, 낮은 환각률(70~85% 감소), 강화된 규제 준수 역량을 제공합니다.
Q. GPT-Rosalind는 누구나 사용할 수 있나요?
A. 아직 공개되지 않았습니다. OpenAI는 Amgen, Moderna, Allen Institute, Thermo Fisher Scientific 등 선별된 파트너와 신뢰 접근 프로그램(Trusted Access Program)을 통해 출시했습니다. 공개 일정은 발표되지 않았으나, 기업 우선 단계적 출시 전략으로 보입니다.
Q. Claude Design은 Figma 같은 기존 디자인 도구를 대체하나요?
A. 직접적인 Figma 경쟁자는 아닙니다. Claude Design은 자연어 프롬프트로 디자인 프로토타입을 생성하고 디자인 시스템 토큰을 자동 적용합니다. Brilliant는 디자인 반복을 20회에서 2회로 줄였고, Datadog은 1주일 사이클을 단일 대화로 압축했습니다. PPTX, Canva, HTML 내보내기와 Claude Code 핸드오프를 지원합니다.
Q. 한국 기업은 도메인 특화 AI 전환에 어떻게 대비해야 하나요?
A. 세 가지 행동을 권장합니다. 자사 산업에 적용 가능한 버티컬 AI 제품(Rosalind, Claude Design, Codex) 평가, Agents SDK 샌드박스와 Agent Cloud 인프라를 활용한 내부 파인튜닝 역량 구축, 스마트 제조혁신 Multi AI Agent R&D 같은 정부 지원 프로그램 참여입니다.
Q. Opus 4.7과 신규 버티컬 제품의 가격은 어떻게 되나요?
A. Opus 4.7은 이전 버전과 동일하게 입력 백만 토큰당 $5, 출력 백만 토큰당 $25입니다. Claude Design은 Claude Pro 구독에 포함됩니다. GPT-Rosalind는 신뢰 접근 프로그램을 통해서만 가격이 공개됩니다. Codex는 OpenAI 기존 개발자 요금제에 포함됩니다.
관련 글: 엔비디아 아이징 양자 AI: AI가 양자컴퓨터의 운영체제가 되는 시대
참고 소스
– Introducing Claude Design — Anthropic Blog, 2026년 4월 17일
– Introducing GPT-Rosalind for life sciences research — OpenAI Blog, 2026년 4월 16일
– Introducing Claude Opus 4.7 — Anthropic Blog, 2026년 4월 16일
– Codex for (almost) everything — OpenAI Blog, 2026년 4월 16일
– The next evolution of the Agents SDK — OpenAI Blog, 2026년 4월 15일
– Enterprises power agentic workflows in Cloudflare Agent Cloud — OpenAI Blog, 2026년 4월 13일
– Anthropic Claude Opus 4.7 출시 — GeekNews, 2026년 4월 16일
– Agents SDK의 차세대 진화 — GeekNews, 2026년 4월 16일
– Specialized AI Models: Vertical AI & Horizontal AI — AIMultiple, 2026
– AI predictions 2026: vertical LLMs — Future Processing, 2026
– Cloudflare Agent Cloud 발표 — SiliconANGLE, 2026년 4월
– Claude Design challenges Figma — VentureBeat, 2026년 4월
– Anthropic launches Claude Design — TechCrunch, 2026년 4월
– OpenAI Launches GPT-Rosalind — MarkTechPost, 2026년 4월
– OpenAI, 생명과학 AI 모델 출시 — Axios, 2026년 4월
– Codex update 90+ plugins — gHacks, 2026년 4월
– Codex Mac 업데이트 — MacRumors, 2026년 4월
– 버티컬 AI 에이전트 — 삼성SDS, 2026
– 2025 AI 트렌드와 2026 전략 — SK AX, 2026
면책 조항: 이 글은 정보 제공 목적이며, 투자 조언이 아님. TheByteDive는 이 콘텐츠를 기반으로 한 투자 결정에 대해 책임지지 않음.
