TL;DR / Key Takeaways
돈 쓰나미가 찾아온 해
돈이 인공지능(AI)으로 조금씩 들어오던 것이 이제 폭으로 쏟아지기 시작했습니다. 기업 AI 투자액은 2023년 17억 달러에서 2025년 370억 달러로 증가했으며, 이는 실험적인 파일럿을 이사회에서 승인한 전략으로 전환시키는 20배의 도약입니다. 2023년에 "작은 개념 증명 하나"를 요구하던 CFO들은 2025년에는 모델 통합, 인프라 및 모든 업무 흐름에 영향을 미칠 수 있는 에이전트를 위해 9자리 수의 수표를 작성하는 데에 시간을 쏟았습니다.
벤처 자본도 같은 중력에 이끌렸다. 2025년 AI 스타트업은 전 세계 스타트업 자금의 거의 50%를 차지하며, 불과 4년 전에는 극소수의 시장 점유율에 불과했다. 한때 핀테크, 암호화폐, 소비자 앱에 균형 잡힌 투자를 하던 자금들은 조용히 “AI 우선”으로 브랜드를 다시 정립하고 기초 모델, 에이전트, 데이터 모드를 중심으로 신념을 재구성했다.
메가 라운드는 더 이상 이례적인 경우가 아니라 반쯤 신뢰할 수 있는 경쟁 우위를 가진 모든 것의 기본이 되었습니다. 미국 내에서 49개의 AI 스타트업이 1억 달러 이상의 자금 조달을 진행했으며, 이는 Harvey와 같은 법률 AI 기업에서부터 헬스케어, 금융, 제조업의 수직적 코파일럿에 이르는 다양한 기업들이 포함된 클럽입니다. 후기 단계 투자자들은 각각을 잠재적인 카테고리 독점으로 간주하며, 2025년의 SaaS보다는 2010년의 클라우드 소프트웨어처럼 보이는 성장 곡선에 대해 더 많은 비용을 지불했습니다.
모든 자본이 인재 시장에서 폭발했습니다. 수석 머신러닝 엔지니어와 인프라 전문가들은 FAANG 급여에서 대규모 주식, 서명 보너스, 원격 근무 맞춤형 조건을 갖춘 스타트업 제안으로 뛰어들었습니다. 전통적인 소프트웨어 역할은 압박을 느꼈고, 보상 범위는 단순히 API를 통합할 수 있는 사람이 아닌 대규모 언어 모델을 제작하거나 확장할 수 있는 사람들에게 치우쳤습니다.
평가가 열광에 뒤따랐다. 수익이 없는 AI 에이전트는 미래의 사용 기반 수익 약속에 따라 유니콘 가격으로 자금을 모았고, Cursor와 같이 실제 성과를 내는 기업이 연간 반복 수익(ARR) 5억 달러를 달성하면서 “AI 네이티브” 소프트웨어의 가치 기준을 새롭게 설정했다. 공개 시장은 들뜸과 공포 사이에서 oscillated, DeepSeek의 오픈소스 혁신과 같은 사건이 단 한 번의 거래 세션에서 Nvidia의 시가총액에서 수천억을 지우는 데 도움을 주며 이 새로운 AI 경제가 얼마나 취약할 수 있는지를 모두에게 상기시켰다.
실리콘 밸리에서 들린 총소리
2025년 1월 한 추운 거래일에 실리콘밸리는 충격파에 휘감겼습니다. 중국 스타트업 DeepSeek가 GitHub과 Hugging Face에 DeepSeek-R1을 공개했기 때문입니다. 이 모델은 여러 추론 기준에서 서구의 최첨단 시스템들과 동등하거나 더 나은 성능을 보였지만, 허용 범위가 넓은 라이센스로 완전히 다운로드 가능한 체크포인트로 출시되었습니다. 제한된 API와 사용 한도에 익숙한 커뮤니티는 R1이 제품 출시라기보다는 탈옥처럼 느껴졌습니다.
수 시간 이내에 엔비디아는 약 6000억 달러의 시장 가치를 잃었으며, 이는 미국 기업 역사상 가장 큰 하루 손실이다. 해설자들은 즉시 이를 인과관계로 설명했다. 고품질의 오픈 모델이 일반 GPU나 심지어 CPU에서도 실행될 수 있다면, 엔비디아의 최고급 가속기에 대한 하이퍼스케일 수요는 갑자기 무한해 보이지 않게 되었다. 거래자들은 미묘함을 기다리지 않고, AI가 더 이상 단일 칩 공급업체의 자동 수익 증가를 의미하지 않는 미래를 반영하여 가격을 조정했다.
그 이야기는 상황을 지나치게 단순화했다. 엔비디아의 급락은 더 넓은 기술 변동성, 수년간의 GPU 슈퍼사이클 이후의 이익 실현, 과잉 구축된 데이터 센터 용량에 대한 불안감과도 관련이 있다. 그러나 DeepSeek-R1은 깔끔한 이야기를 제공하고 적을 설정했다: 오픈 소스가 독점 AI 및 이를 지원하는 하드웨어 스택에 대한 실질적인 위협이라는 것이다.
전략적으로 R1은 OpenAI, Google, Anthropic, Meta와 같은 미국의 거대 기업만이 최첨단 추론 모델을 운영할 수 있다는 가정을 깨뜨렸습니다. DeepSeek는 중국 데이터 파이프라인, 자체 개발한 훈련 기법, 철저한 추론 조정을 통해 효율적이고 공격적으로 최적화된 스택이 트릴리언 매개변수의 팽창 없이 격차를 메울 수 있음을 보여주었습니다. 이는 단순히 폐쇄형 모델에 도전한 것이 아니라, 전체 클라우드 우선, API 임대 AI 비즈니스 모델에 도전장을 내민 것입니다.
개발자들이 빠르게 움직였습니다. 몇 주 만에 GitHub에는 다음과 같은 항목들이 가득 차게 되었습니다: - R1 기반 코딩 어시스턴트 - 노트북과 휴대폰용 온디바이스 채팅 앱 - 내부 코드와 문서에 연결된 셀프 호스팅 기업용 코파일럿
“로컬 AI의 해”는 예측이 아닌 실제 배송의 현실로 바뀌었으며, 팀들은 데이터를 온프레미스에 유지하면서 토큰당 요금을 피하고 여전히 최첨단 성능에 근접한 결과를 얻을 수 있다는 사실을 깨달았습니다.
지정학적으로, DeepSeek-R1은 스푸트니크 순간처럼 도착했다. 중국의 반도체 야망에 이미 불안해하던 미국 정책 입안자들은 이제 누구나—스타트업, 대학, 경쟁 국가—포크하고 전문화할 수 있는 오픈 모델에서 템포를 설정하는 중국 실험실에 직면하게 되었다. 베이징으로서는 소프트 파워의 승리를 거두었으며, 하드웨어 금지와 수출 통제를 통해서만이 아니라 어디서나 실행되는 코드로 글로벌 AI 스택을 형성할 수 있음을 입증했다.
에이전트 상승: AI가 몸을 갖다
2025년 초, 에이전트들은 지침을 기다리는 것을 멈추고 스스로 행동하기 시작했습니다. OpenAI의 Operator가 처음 등장했는데, 이는 클라우드 기반의 작업자로서 자체 브라우저를 열고 웹 앱을 클릭하고 양식을 작성하며 데이터를 스크랩하고 도구들을 연결하여 "수백만 가지의 다양한 작업"을 처리할 수 있었습니다. 3월에는 Manus가 General AI Agent를 선보였고, 이는 기업의 워크플로우 내에서 CRM 업데이트부터 재무 보고서까지 모든 것을 조율할 수 있는 단일 작업자를 제안했습니다.
개발자들은 갑자기 프롬프트에 대한 생각을 줄이고 업무 위임에 더 집중해야 했습니다. 초기 사용자들은 모델에 "이메일 초안 작성"을 요청하는 대신, Operator를 인박스로 향하게 하고 일주일 간의 메시지를 분류하고, 회의를 일정에 추가하며, 액션 아이템을 Jira에 넣도록 지시했습니다. Manus 고객들은 에이전트를 내부 시스템에 연결하여 청구서를 밤사이 정산하거나 지속적으로 판매 파이프라인을 모니터링할 수 있도록 하였습니다.
안드레이 카르파티는 2월에 이 새로운 작업 흐름에 “바이브 코딩”이라는 이름을 붙였습니다. 엔지니어들은 모든 기능과 엣지 케이스를 구체적으로 명시하는 대신, 기능의 “바이브”를 설명했습니다. 즉, 그것이 어떻게 느껴져야 하고, 어떻게 작동해야 하는지를 설명하며 AI 에이전트가 코드, 테스트 및 문서를 반복적으로 개발하도록 했습니다. 이 용어는 빠르게 확산되어 자체 위키피디아 항목을 얻었고, 한 줄씩 코딩하는 방식에서 대화형 아키텍처로의 전환을 확고히 했습니다.
바이브 코딩은 인간-인공지능 협력의 더 넓은 변화를 반영했습니다. 팀들은 다음과 같은 것들을 설계하기 시작했습니다: - 고수준 사양 및 제약 조건 - 가드레일, 테스트 스위트 및 모니터 - 에이전트가 변경 제안을 하고 인간이 승인하거나 방향을 전환하는 피드백 루프
장기간에 걸쳐 복잡한 작업들이 진정한 시험 무대가 되었다. 운영자들은 지원 로그를 뒤지며 원인 분석 초안을 작성하거나, 전체 마이크로서비스를 재구성하거나, 광고 제작, A/B 테스트 및 분석 대시보드에 걸친 다단계 마케팅 캠페인을 실행하기 위해 몇 시간 동안 활동을 지속했다. 이러한 작업들은 단일 프롬프트가 아닌 프로젝트였다.
예상대로 하이프가 현실을 초월했다. 데모에서는 완벽한 핸즈프리 워크플로우가 보여졌지만, 2025년 초의 사용자들은 취약한 도구 통합, 긴 체인에서 발생하는 무응답 실패, 그리고 존재하지 않는 UI 요소를 환각하는 에이전트에 직면하게 되었다. 보안팀은 루트 자격 증명을 가진 그 어떤 것에도 브라우저 수준의 접근 권한을 부여하는 것을 주저했으며, 많은 "완전 자율" 배포는 조용히 감독 모드로 되돌려졌다.
그럼에도 불구하고 그 방향은 불가역적으로 보였다. 운영자와 매너스의 에이전트는 다음 플랫폼 전환이 단순한 스마트 챗봇이 아니라, 스스로 이동할 수 있는 신체 같은 무엇을 갖춘 AI라는 것을 명확히 했다: 브라우저, API, 그리고 본인이 자유롭게 활용할 수 있는 인프라. 이러한 변화의 광범위한 지정학적 및 인프라적 이해관계를 추적하는 사람들에게, AI '스푸트니크 순간', 딥시크, 그리고 분산형 AI | 그레이스케일은 에이전트, 오픈 모델, 그리고 분산 컴퓨팅이 어떻게 충돌할 수 있는지를 시각화했다.
타이탄의 전쟁: 위대한 모델 전쟁
시계가 겨우 2월에 접어든 순간 연구소들은 본격적으로 가동되기 시작했습니다. 구글은 Gemma 3로 시작했는데, 이는 놀랍도록 유능한 오픈 소스 라인으로, 노트북 친화적인 규모에서 데이터 센터 클래스까지 확장할 수 있었습니다. 그 후 거의 즉시 Gemini 2.5를 출시했는데, 이는 "무한한 맥락"이 데모의 gimmick처럼 느껴지기보다는 제품 기능으로 자리 잡도록 만든 첫 모델이었습니다. 봄이 다가오면서 앤트로픽은 Claude 4 가족으로 응답했고, 메타는 Llama 4 "Herd"를 선보이며 2025년을 토큰, 파라미터, 그리고 GitHub 스타로 측정되는 군비 경쟁으로 전환했습니다.
구글은 맥락을 차별화 요소로 삼았습니다. 제미니 2.5의 주목할 만한 특징은 수백만 개의 토큰을 사용하는 창(window)으로, 전체 코드베이스, 기업 위키, 수년간의 이메일 아카이브를 단일 세션에서 모두 소화할 수 있다는 점입니다. 준수 및 추적성에 집착하는 기업은 이제 모든 것을 실제로 읽고 기억 속에 유지할 수 있는 모델을 갖게 되었습니다.
메타는 라마 4 허드에서 반대 방향으로 나아가며 무리의 힘이 대규모 단일 모델보다 낫다는 베팅을 했습니다. 하나의 거대한 프론티어 모델 대신, 허드는 코드에 최적화된 것, 검색에 최적화된 것, 멀티모달 추론에 최적화된 여러 개의 라마를 조정하여 협력하는 패키지를 구성했습니다. 개발자들은 단일 일반 모델이 올바른 행동을 추측하길 기도하는 대신 전문화된 작업자를 조합할 수 있었습니다.
앤트로픽은 조용히 또 다른 전장을 장악했습니다: 키보드와 터미널. 클로드 4와 그 변형들, 특히 클로드 코드와 이후의 클로드 코드 웹 버전은 사실상 “코딩의 왕”이 되어 IDE, 브라우저 기반 편집기, 그리고 Cursor와 Windsurf와 같은 능동적인 코딩 도구를 지원하게 되었습니다. 기준 성능보다 중요한 것은 실제 경험이었습니다: 더 빠르게 통합된 풀 리퀘스트, 줄어든 심야의 스택 트레이스, 그리고 실제로 컴파일되는 AI 작성 패치들이었습니다.
전문화가 올해를 정의했습니다. 만능 LLM 대신, 팀들은 다음과 같은 스택을 선택했습니다: - 깊은 리팩터링 및 다중 파일 추론을 위한 Claude 4 - 로그, 티켓, 문서의 긴 맥락 분석을 위한 Gemini - 맞춤형, 온프레미스 및 개인 정보 보호에 민감한 워크플로우를 위한 Llama 4 Herd
오픈 소스 분야에서, 알리바바의 Qwen3는 DeepSeek의 순간이 일회성이 아님을 입증했습니다. Qwen3 모델은 성능, 라이센스 유연성, 하드웨어 효율성의 최적의 조합을 이룰 수 있어, 미국 클라우드 의존성을 우려하는 지역에서 필수 요소가 되었습니다. 자가 호스팅 플랫폼은 작은 스타트업부터 국가 지원 클라우드에 이르기까지 Qwen3를 토큰으로 최전선 모델을 임대하는 것에 대한 “영원히 충분한 좋은 대안”으로 표준화했습니다.
초지능 군비 경쟁이 시작되다
슈퍼인텔리전스는 2025년에 공상과학 용어에서 벗어나 기업 재무제표의 항목이 되었습니다. 그 중심에는 스타게이트가 있습니다. 이는 주로 OpenAI에 전념하는 AI 인프라 구축을 위한 5천억 달러 규모의 제안으로, 약 4년에 걸쳐 진행될 예정입니다. 이 비용은 국가 고속도로 시스템과 우주 프로그램의 비용에 필적하지만, 이번에는 구체가 데이터 센터, 전력 계약, 그리고 칩 공급에 쓰입니다.
스타게이트는 OpenAI를 모델 회사에서 준 유틸리티로 효과적으로 전환시킵니다. 보고서에 따르면 멀티 기가와트 캠퍼스, 맞춤형 네트워킹, 그리고 Nvidia급 가속기와 그 이후의 것들과의 긴밀한 통합이 이루어지고 있습니다. 베팅: 만약 AGI가 실제라면, 컴퓨팅 그리드를 контрол하는 자가 미래를 지배하게 됩니다.
마크 저커버그는 메타의 AI 야망을 극대화하기로 결정했다. 그는 초인적인 시스템을 명확히 목표로 하는 메타 슈퍼인텔리전스 랩스를 출범시키며 조직 개편과 브랜드 리뉴얼을 단행했다. 리쿠르터들은 엘리트 연구원과 엔지니어를 위해 9자리 총 보상 패키지를 제안하기 시작했으며, 이는 OpenAI, Google DeepMind, Anthropic에서 직접 인재를 모집하기 위해 주식 비중이 높은 제안으로 구성되었다.
인재 전쟁이 공공연하고 치열해졌다. 유명 인사들이 저자 목록에서 조용히 사라지고, 갑자기 메타의 채용 목록에 나타났다. 보상 안 정보가 X와 블라인드에 유출되었으며, 보고에 따르면 일부 "저명한" 채용자에게는 5천만 달러 이상의 주식 보상과 수백만 달러의 급여가 제공되었다.
마이크로소프트는 이미 OpenAI의 가장 큰 지지자로서 더 이상 GPU를 단순히 임대하는 것만은 아니라는 사실을 숨기지 않았습니다. 11월에는 회사 내부에 MAI 슈퍼인텔리전스 팀을 조직하여 마이크로소프트의 자체 스택에서 초지능 시스템을 추구하도록 위임된 전담 그룹을 세웠습니다. 이 조치는 레드먼드가 OpenAI에 대한 과도한 의존성을 줄이고 Azure, Windows, Microsoft 365 내에 최첨단 연구를 깊숙이 내재화하려는 의도를 나타냅니다.
스타게이트, 메타 슈퍼인텔리전스 연구소, 그리고 MAI는 전략적인 방향 전환을 의미합니다. 이제 최전선은 GPT-5나 Claude 4.5 같은 화려한 모델을 누가 먼저 출시하느냐가 아닙니다. 이 경쟁은 이제 대륙 규모의 인프라를 금융 지원하고 운영할 수 있는 능력, 전력과 칩 공급을 확보할 수 있는 능력, 그리고 AGI급 시스템을 조정할 수 있는 소수의 인재를 모을 수 있는 능력에 중점을 두고 있습니다.
모델이 애플리케이션이 되었다. 초지능이 플랫폼이 되었다. 그리고 2025년은 기술의 주요 기업들이 플랫폼 가격을 지불하기 시작한 시점이다.
당신의 AI 코딩 어시스턴트는 이제 필수입니다.
의무라는 표현은 더 이상 과장이 아니며, 정책이 되었습니다. 2025년 중반까지 AI 원주율 IDE Cursor는 5억 달러의 ARR을 조용히 넘겼으며, 이는 몇 년 전만 해도 거의 존재하지 않았던 코드 편집기로서는 과감해 보이는 수치입니다.
개발자들은 한걸음에 움직였다. 설문조사에 따르면 84%의 개발자가 워크플로우에서 AI 도구를 사용하거나 사용할 계획이며, 모든 개발자의 약 절반이 매일 AI 코딩 어시스턴트를 실행하고 있다.
커서의 등장은 “AI 우선 IDE”를 호기심에서 기본으로 바꾸었습니다. 리팩토링, 다중 파일 편집, 저장소 규모의 컨텍스트를 긴밀하게 통합하여 전통적인 자동 완성을 다이얼업처럼 느끼게 했습니다.
새로운 헤비급 참가자들이 그 변화를 입증했습니다. OpenAI는 5월에 Codex Agent를 출시했습니다. 이는 항상 작동하는 코딩 동반자로서 다음과 같은 기능을 갖추고 있습니다: - 사양에서 그린필드 프로젝트 생성 - 테스트 실행 및 루프에서 디버깅 - 사람이 읽을 수 있는 차이를 가진 풀 리퀘스트 열기
아마존은 7월에 키로를 출시했습니다. 키로는 AWS에 직접 연결된 기업 중심의 코딩 에이전트입니다. 키로는 단순히 코드를 제안하는 것이 아니라, IAM 정책, VPC 구성, 내부 API 및 기업 준수 규칙을 이해한 후 이를 충족하는 인프라 및 애플리케이션 코드를 생성했습니다.
기업 IT 부서는 AI 어시스턴스를 허용할지 여부를 묻는 것을 멈추고 어떤 스택을 표준화할지를 묻기 시작했습니다. 마이크로소프트는 조용히 그 논쟁에서 승리했습니다: Microsoft 365 Copilot이 이사회, 인사, 재무, 영업 부서에 도입되었고, 2025년 말까지 포춘 500대 기업의 90%가 이를 도입했습니다.
코파일럿의 보편성은 개발자들에게도 중요했습니다. 코드 리뷰는 Outlook에서 미리 요약된 형태로 도착했고, Teams 스레드에는 자동 생성된 기술 브리프가 포함되었으며, 제품 관리자는 코파일럿이 이미 정리하고 구조화한 사양을 붙여넣었습니다.
AI 코딩 보조 도구는 더 넓은 지정학적 및 경쟁적 흐름에도 영향을 받았다. 일부 분석가들이 "AI의 스푸트니크 순간"으로 표현한 중국의 DeepSeek-R1은 전 세계적인 긴급성을 가속화했다; 더 깊이 있는 내용은 DeepSeek: AI 시대의 스푸트니크 순간?를 참조하십시오.
2025년 말까지 AI 코딩 어시스턴트를 사용하지 않는 것은 장인정신보다는 태만처럼 보였다. 이를 금지하려고 했던 팀들은 불편한 현실을 발견했다: 속도, 일관성, 심지어 문서 품질까지 이제 모든 엔지니어 옆에는 피곤함 없이 맥락을 이해하는 봇이 앉아 있다고 가정하게 되었다.
변호사와 입법자들이 경기장에 들어선다
규제 당국은 더 이상 관망하지 않고 규칙 작성을 시작했습니다. 2025년 발효된 EU AI 법안은 AI를 위한 세계 최초의 엔드투엔드 법적 프레임워크가 되어 시스템을 위험 수준에 따라 분류하고 건강, 금융, 주요 인프라와 같은 분야에서 "고위험" 배치에 대해 엄격한 의무를 부과했습니다. 기반 모델은 이제 GDPR과 같은 이전의 개인정보 보호법보다 훨씬 더 강력한 투명성, 안전성, 문서화 요건에 직면하고 있습니다.
브뤼셀은 혼자 행동하지 않았다; 법원도 재정적 압박에 동참했다. 앤트로픽은 훈련 데이터의 저작권 침해 혐의로 저자 연합과 15억 달러의 합의에 동의했으며, 이는 향후 모든 AI 저작권 분쟁의 기준 사례로 즉각 자리잡았다. 이 배상금은 "지금 긁어모으고, 나중에 소송을 제기하라"는 전략이 성장 해킹에서 재무 위험으로 전환되었음을 시사했다.
모든 대형 언어 모델 제공업체는 갑자기 토큰 처리량과 함께 법적 노출을 모델링해야 했습니다. 법적 소송과 위협의 범위는 다음과 같습니다: - 훈련 데이터에 포함된 저작권이 있는 책, 뉴스, 코드 - 특정 작품과의 출력 유사성 - 하위 사용자에 의한 오용, 명예 훼손 및 개인 정보 침해
그 압력은 공급업체들이 라이선스가 있는 데이터셋, 합성 데이터, 그리고 엄격한 콘텐츠 필터로 향하도록 하지만, 동시에 어려운 질문을 제기합니다: 복잡하고 저작권이 있는 웹 없이 최전선 모델들이 경쟁력을 유지할 수 있을까요?
이 혼란 속에 새로운 AI 네이티브 로펌의 시대가 등장했습니다. 하비는 계약 검토, 소송 준비 및 규제 분석을 위한 특화된 법률 코파일러를 구축하기 위해 30억 달러 규모의 시리즈 D 자금을 조달했습니다. 대형 로펌들은 하비와 같은 시스템을 통해 수천 시간의 탐색 및 실사 작업을 조용히 처리하며, 법률 업무를 AI가 더 이상 실험적이지 않고 필수적인 인프라가 되는 또 다른 분야로 바꾸고 있습니다.
GPT-5 시대가 드디어 시작됩니다.
8월은 마침내 2년간의 루머가 약속했던 것을 전달했습니다: GPT-5. OpenAI는 이를 모델이라기보다 지능을 위한 운영 체제처럼 표현했습니다. 기본적으로 다중 모드 지원, 지속적인 기억, 그리고 첫날부터 연결된 에이전트를 갖추고 있습니다. 기업들은 조용히 파일럿을 프로덕션으로 전환하며 GPT-5가 프롬프트 엔지니어링의 부담을 줄이고, 이전의 GPT-4.1 시대 워크플로우가 원시적이라는 느낌을 주는 것을 경험했습니다.
네 달 후, GPT-5.2는 “모든 것을 해결하는” 릴리스로 등장했습니다. OpenAI는 추론을 강화하고 지연 시간을 줄였으며, 코드와 구조화된 데이터에 대한 도구 사용을 극적으로 개선했습니다. 많은 기업들에게 5.2는 5.0이 아닌 진짜 마이그레이션 포인트가 되었고, 공급업체들은 SaaS 대시보드에 “GPT-5.2 내장” 배지를 붙이기 위해 경쟁했습니다.
텍스트 모델들이 헤드라인을 장식하는 동안, 생성 미디어는 열광적으로 발전했습니다. OpenAI의 Sora 2는 기묘한 비디오에서 동기화된 비디오와 오디오 생성으로 확장되어, 단일 프롬프트를 스토리보드, 러프 컷, 그리고 임시 사운드트랙으로 변환했습니다. 구글은 소비자 GPU와 고급 스마트폰에서 효율적으로 작동하는 컴팩트하지만 놀라운 성능의 이미지 생성기 Nano Banana Pro로 대응했습니다.
구글도 모델 전쟁에서 빠지지 않았습니다. 제미니 3는 GPT-5에 대한 마운틴뷰의 응답으로 등장했으며, 워크스페이스, 안드로이드, 그리고 크롬에 철저하게 연결된 최상급 일반 모델입니다. 구글 내부 시연에서 제미니 3는 단순히 문서를 요약하는 것에 그치지 않고, 슬라이드 덱을 재작성하고, 스프레드시트 모델을 리팩토링하며, 실시간 A/B 변형이 포함된 이메일 캠페인을 자동으로 생성했습니다.
창의 산업이 가장 먼저 충격을 느꼈습니다. 비디오 스튜디오는 Sora 2를 사용하여 사전 시각화, 애니메틱스, 현지화를 진행했으며, 일부 광고 대행사는 제작 일정을 몇 주에서 며칠로 단축했습니다. 독립 제작자들은 GPT-5.2, Sora 2, Nano Banana Pro를 결합하여 한 사람의 "마이크로 스튜디오"를 구성하고, 전체 캠페인을 기획하고, 스크립트를 작성하며, 스토리보드를 제작하고, 렌더링했습니다.
기업들도 빠르게 변했습니다. GPT-5.2와 Gemini 3는 다음과 같은 분야에서 기본 브레인 역할을 하게 되었습니다: - 전체 사례 수명 주기를 처리하는 고객 지원 에이전트 - 정책, 코드 및 문서를 작성하는 내부 코파일럿 - 데이터 웨어하우스를 질의하고 이사회 준비가 완료된 프레젠테이션을 생성하는 분석 봇
기존의 "챗봇" 프로젝트는 조용히 사라졌습니다. 그 자리에 CIO들은 준수 검토에서 제품 설계까지 모든 것을 위해 소수의 최전선 모델인 GPT-5.2, 제미니 3, 클로드 4.x로 표준화했습니다. 이는 2025년이 일반 목적의 AI가 파일럿을 끝내고 회사를 운영하기 시작한 해임을 확고히 합니다.
대규모 통합: 메가 거래가 AI를 재형성하다
현금이 풍부한 기존 기업들이 2025년 말에 AI의 자유 시장을 땅따먹기로 바꾸는 데에 발벗고 나섰습니다. NVIDIA는 Groq의 자산을 200억 달러에 인수하며 이 열풍의 시작을 알렸고, 이로 인해 스타트업의 초저지연 LPU 기술이 이미 지배적인 GPU 스택에 통합되었습니다. Meta는 빠르게 뒤따라 Manus를 인수하겠다고 발표하며, 이는 General AI Agent의 뒤에 있는 화제의 스타트업으로 Llama 생태계와 기업 추진력에 자동화를 직접적으로 연결하기 위해서입니다.
전략적인 자금이 M&A 못지않게 적극적으로 흐르고 있다. 디즈니는 OpenAI에 10억 달러를 투자하며 소라의 비디오 생성 기술을 향후 애니메이션, VFX 및 테마파크 경험의 근본으로 삼겠다는 명확한 목표를 세웠다. 이 움직임은 할리우드가 AI를 부수적 도구가 아닌 콘텐츠 파이프라인의 핵심 인프라로 보고 있음을 시사한다.
동맹이 블록에 가까운 형태로 굳어졌다. 마이크로소프트, NVIDIA, 그리고 앤트로픽은 클라우드, 실리콘, 그리고 안전성을 강조한 모델을 통합하여 최첨단 기능과 규제의 외관을 원하는 기업을 위한 단일 솔루션 스택으로 삼는 삼자 전략적 파트너십을 공식화했다. IBM은 앤트로픽과의 기업 계약을 심화시켰고, 마이크로소프트의 MAI 슈퍼인텔리전스 팀은 레드몬드의 AI 야망을 위한 정치적 중심축으로 조용히 자리잡았다.
평가가 식기를 거부한 가운데, 규제 당국이 접근하고 공공 시장이 불안정한 상태에서도 Databricks는 1억 4천만 달러의 평가로 후반 단계 Series L에서 40억 달러를 모금하며 하이퍼스케일러와 그 외 모든 업체 사이에 자리잡은 중립적인 데이터 및 AI 플랫폼으로서의 역할을 확고히 했습니다. Perplexity는 “답변 엔진”이 구글의 검색 및 광고 수익을 기존 업체들이 재조정할 시간보다 더 빠르게 빼앗을 것이라는 약속으로 200억 달러의 평가에 도달했습니다.
헤드라인 숫자 뒤에는 이러한 메가딜들이 AI 스택의 어느 계층을 누가 제어하는지를 확고히 하고 있는 모습이 담겨 있습니다. NVIDIA의 Groq 인수는 DeepSeek 스타일의 오픈 모델이 GPU 수요에 위협을 가하고 있을 때, 추론 하드웨어에 대한 지배력을 더욱 강화했습니다. 이는 DeepSeek의 스푸트니크 순간에 대한 헤드라인을 넘어에서 자세히 다루어진 긴장감입니다. Meta의 Manus 인수, Disney의 Sora 투자, 그리고 Microsoft-NVIDIA-Anthropic 축 모두 같은 방향을 가리키고 있습니다: 독립적인 기업 수가 줄어들고, 진입 장벽이 높아지며, AI 시장이 갑자기 구식 대기업 테크와 더욱 유사해졌습니다.
과대광고를 넘어서: 2026년 우리의 미래는 어디인가
2025년에는 AI가 IDE, 브라우저, 콜센터, 데이터 센터 등 어디에나 존재하게 됩니다. DeepSeek-R1과 Qwen3과 같은 로컬 및 오픈소스 모델이 "충분히 좋은" 것을 "전략적 헤지"로 변화시켜 기업들이 하이퍼 스케일러 가격에 대한 지렛대를 확보하게 되었습니다. 동시에, 에이전틱 워크플로우는 해커톤 시연에서 실제 생산으로 넘어갔으며, OpenAI Operator, Amazon Kiro, Manus가 소프트웨어가 이제 문서를 읽고, 버튼을 클릭하며, 코드를 배포할 수 있음을 보여주었습니다.
모델 전략이 조용히 바뀌었습니다. 모든 일을 하는 하나의 메가 모델 대신, 기업들은 이제 전문화된 시스템을 쌓아 올립니다: o3와 같은 추론 모델, 경량화된 Gemma 3 또는 장치 내 작업을 위한 Llama 4 Herd 인스턴스, 그리고 Sora 2 또는 Veo 3과 같은 비디오 엔진입니다. MCP와 유사한 기준은 이러한 모델들을 더 큰 에이전트 시스템 내에서 플러그형 구성 요소로 변환시켰습니다.
2026년에는 “전통적인” IDE가 기본적으로 사라질 가능성이 높습니다. 커서가 5억 달러 ARR에 도달하고, 윈드서프의 인수와 클로드 코드 포 더 웹이 AI가 내비게이션, 보일러플레이트, 리팩터링을 소유하면서 사람들은 의도를 명시하는 에디터를 나타냅니다. 예상되는 변화는 다음과 같습니다: - 클라우드와 함께 제공되는 AI 네이티브 IDE - 키 입력이 아닌 저장소를 감시하는 에디터에 구애받지 않는 “코딩 데몬” - 모든 머지를 통제하는 컴플라이언스 우선 기업 에이전트
인간과만 대화하는 에이전트는 이미 구식으로 보입니다. 구글의 초기 A2A 작업, 안트로픽의 에이전트 기술, 그리고 자피어의 MCP 서버는 모두 도구들이 인간의 코드 없이 API, SLA, 및 결제를 협상하는 에이전트 간 프로토콜을 암시합니다. 기계들은 점점 더 다른 기계들과 직접 인증하고 계약하며 조정할 것입니다.
인간의 역할은 "코더"에서 AI 아키텍트로 변화합니다. 당신은 제약을 설계하고, 시스템을 분해하며, 테스트를 정의합니다; 자율 에이전트가 구현하고, 통합하며, 반복합니다. 부족한 기술은 EU AI 법과 같은 규제 하에서 행동을 형성하는 것이지, 프레임워크 내부를 암기하는 것이 아닙니다.
10년 간의 AI 채택을 12개월로 압축함으로써 2025년은 AI를 기본 스택에 고정시켰습니다: 칩(스타게이트, NVIDIA–앤트로픽 거래)에서 생산성 스위트(MS 365 코파일럿이 포춘 500의 90% 사용)에 이르기까지 개발 도구에 이르기까지. 2026년은 이것이 버블인지 여부에 대한 답변을 주지 않으며, 로그오프하지 않는 에이전트 주위에서 소프트웨어의 얼마나 많은 부분이 재구성될지를 답합니다.
자주 묻는 질문들
2025년에 가장 영향력 있는 AI 사건은 무엇이었나요?
많은 논란이 있지만, 오픈 소스 DeepSeek-R1 모델의 출시가 Nvidia의 시가총액에서 단 하루 만에 6000억 달러라는 역사적인 하락과 연결되었으며, 이는 업계의 '스푸트니크 순간'을 나타냅니다.
2025년에는 기업 AI에 얼마나 많은 돈이 투자되었나요?
2025년 기업 AI 투자액이 370억 달러로 증가하였으며, 이는 2023년의 17억 달러에서 대폭 증가한 수치입니다. 또한 AI 스타트업은 전 세계 벤처 자금의 거의 50%를 차지했습니다.
스타게이트 프로젝트란 무엇인가요?
스타게이트 프로젝트는 2025년에 발표된 5천억 달러 규모의 대규모 이니셔티브로, 향후 4년 동안 OpenAI를 위한 새로운 전용 AI 인프라를 구축하는 것을 목표로 하고 있습니다.
2025년에 어떤 주요 AI 모델이 출시되었습니까?
2025년에는 OpenAI의 GPT-5, 구글의 Gemini 3, 메타의 Llama 4 'Herd', Anthropic의 Claude 4 가족, 그리고 오픈소스인 DeepSeek-R1과 Qwen3를 포함한 여러 혁신적인 모델이 출시되었습니다.