기술·AI — 2026년 6월 3일
달의 뉴스레터
마이크로소프트가 OpenAI의 탯줄을 끊었다. 그 소식이 전해지는 날, 젠슨 황은 타이베이에서 “컴퓨트가 곧 수익”이라고 외쳤고, 서울의 스타트업은 2nm 칩으로 그 무대에 오르겠다는 계약서에 도장을 찍었다.
마이크로소프트, 7년 만에 OpenAI의 탯줄을 끊다
6월 2일 샌프란시스코 포트 메이슨 센터. 마이크로소프트가 Build 2026 개발자 콘퍼런스에서 두 개의 폭탄을 꺼냈다. 첫 번째는 MAI-Code-1-Flash — 마이크로소프트가 자체 개발한 코딩 모델이다. SWE-Bench Pro에서 51% 성능을 기록했고, 어려운 과제에서 경쟁 모델 대비 60% 적은 토큰을 쓴다. 이미 GitHub Copilot 모델 선택 메뉴에 올라와 있다. 두 번째는 더 의미심장하다. 코드명 Project Polaris — 혼합 전문가(MoE) 아키텍처 기반의 마이크로소프트 자체 추론 모델로, 2026년 8월부터 GitHub Copilot 기본 모델인 GPT-4 Turbo를 교체한다.
왜 지금인가. 올해 4월, 마이크로소프트와 OpenAI의 7년 독점 파트너십이 끝났다. 계약 종료가 먼저였고, Build 2026은 그 이후 마이크로소프트의 첫 대형 공개 무대였다. 타이밍은 우연이 아니다. GitHub Copilot의 월 사용자 수가 1,500만 명을 넘는 지금, 이 고객들을 위한 모델을 외부 파트너에게 계속 의존할 이유가 없어졌다. AI 코딩 도구 시장은 2031년까지 연 26% 성장해 300억 달러 규모가 될 것으로 예측된다. 마이크로소프트 입장에서 이 시장의 마진을 OpenAI와 나눌 이유는 점점 줄어든다.
실제로 무슨 말인가. “저렴한 Copilot”이라는 포지셔닝이 핵심이다. 구글은 AI I/O에서 월 100달러짜리 AI 개발자 구독을 발표했고, Anthropic의 Claude Code는 기업 시장에서 앞서 달리고 있다. 마이크로소프트는 토큰 효율(60% 절감)을 무기로 “더 싸게”를 내걸었다. 성능 경쟁보다 비용 경쟁으로 판을 짜겠다는 것이다. 구글 CEO 순다르 피차이가 최근 팟캐스트에서 “에이전트 코딩에서 우리는 현재 다소 뒤처져 있다”고 직접 인정한 것과 맞물리면, 코딩 AI 시장의 지형이 선명해진다. Anthropic과 OpenAI가 선점한 기업 시장에, 구글과 마이크로소프트가 가격으로 밀고 들어오는 구도.
달의 의심. MAI-Code-1-Flash의 SWE-Bench Pro 51%는 Claude Opus 4.8의 64.3%나 GPT-5.5의 58.6%에 못 미친다. “60% 토큰 절감”이라는 효율 주장은 어떤 비교 기준을 썼는지가 공개되지 않았다. Project Polaris의 2028년 샘플링 목표는 아직 실체가 없는 약속이다. 마이크로소프트가 모델 자체를 만들겠다는 의지는 진짜지만, 그 모델이 Claude Code나 Codex를 실제로 위협할 수 있는 수준인지는 아직 미지수다. “OpenAI 탈출”이라는 내러티브가 실제 모델 품질의 점프를 의미하지는 않는다.
어디로 가는가. Project Polaris가 8월에 예정대로 배포되면, GitHub Copilot 구독자 1,500만 명의 기본 경험이 처음으로 마이크로소프트 자체 모델에 의해 돌아간다. 이것이 실제 작동한다면 — 즉, 개발자들이 체감하는 품질이 유지된다면 — AI 코딩 시장에서 “누구의 모델을 쓰느냐”는 질문이 “누구의 플랫폼에 있느냐”만큼 중요해진다. 달이 무게를 두는 방향: 모델 품질보다 생태계(GitHub 이슈 → Azure 에이전트 → PR 자동 생성)의 통합이 진짜 경쟁력이 될 것이다.
출처: ChatForest | 2026-06-02, CNBC | 2026-06-01
젠슨 황의 타이베이 선언: “컴퓨트는 수익이다”
6월 1일 밤(한국시간), 타이베이 난강 전시관. NVIDIA CEO 젠슨 황이 COMPUTEX 2026 기조연설에서 외쳤다. “AI is now a profit generator. AI is now a GDP generator.” 월가는 즉각 반응했다. NVIDIA 주가 6% 급등. 데이터센터 운영사 Oracle 9.9%, Nebius 14.5%, CoreWeave 14%. 두 가지 제품이 선언의 중심이었다. 첫 번째는 Vera Rubin — AI 팩토리용 차세대 플랫폼으로, 기존 대비 10배 높은 에너지 효율과 10배 낮은 토큰당 비용을 목표로 전면 생산에 들어갔다. 두 번째는 RTX Spark — 1 페타플롭의 AI 성능을 슬림 노트북에 담겠다는 개인용 에이전트 PC 칩이다. MediaTek, Microsoft Windows와 협력하고, NVIDIA 소프트웨어 스택을 100% 지원한다.
왜 지금인가. “기가와트급 AI 인프라 한 채의 비용이 1,000억 달러에 달할 것”이라고 황은 경고했다. 이 규모의 투자가 정당화되려면 AI가 실제로 수익을 만들어야 한다. 2026년은 그 증명의 해다. JPMorgan은 AI 투자를 “실험적 R&D”에서 “핵심 인프라”로 재분류하며 198억 달러 기술 예산을 책정했다. Microsoft는 일본에 4년간 100억 달러를 약속했다. COMPUTEX에는 33개국 1,500개 기업이 모였다. 황이 말한 “compute is revenue”는 구호가 아니라 이 거대한 투자를 정당화해야 하는 당사자들의 신앙고백이다.
실제로 무슨 말인가. Vera Rubin의 “10배 효율”은 에이전트 워크로드에 최적화된 수치다. 황은 명시적으로 말했다. “Vera Rubin은 단지 AI를 실행하기 위해 만든 게 아니라, 에이전트를 실행하기 위해 만들었다.” 에이전트 = 수시간·수일에 걸쳐 자율적으로 계획하고 행동하는 AI. 기존 GPU는 단발성 추론에 최적화됐다. 장기 실행 에이전트는 다른 아키텍처가 필요하다. RTX Spark는 그 반대 방향 — 클라우드 없이 로컬에서 에이전트를 실행하겠다는 것이다. “클라우드 AI를 선택사항으로 만든다”는 것이 Gemma 4에 이어 NVIDIA도 추구하는 방향이다.
달의 의심. “10배 효율”은 검증된 공개 벤치마크가 아직 없다. Vera Rubin의 전면 생산 선언이 실제 출하량과 일치하는지, CoWoS 패키징 병목이 여전히 발목을 잡을 가능성은 얼마인지 — TSMC 2026년 CoWoS 라인은 NVIDIA 60%, Broadcom·AMD 26%가 이미 선점한 상태다. RTX Spark는 Apple Silicon과 Qualcomm Snapdragon X에 정면으로 도전하는 PC 시장 진입인데, 생태계(소프트웨어, 배터리, 폼팩터)가 준비됐는지는 별개 문제다. “컴퓨트는 수익이다”가 현실이 되려면, AI가 실제로 기업의 매출을 만들어주는 증거가 더 필요하다.
어디로 가는가. 황은 2026년 하반기에 “아직 누구에게도 말하지 않은 신제품”이 있다고 예고했다. Grace Blackwell, Vera Rubin에 이은 세 번째 발표. 에이전트 AI 인프라 경쟁은 하드웨어 단계를 넘어 소프트웨어 스택(NVIDIA Agent Toolkit, Nemotron 3 Ultra 550억 파라미터 MoE 모델)으로 확장되고 있다. 달이 무게를 두는 방향: NVIDIA는 이제 GPU 회사가 아니라 에이전트 인프라 회사로 정의되고 있다. 그 전환이 완성되는 시점에 하드웨어 경쟁의 의미가 바뀐다.
출처: NVIDIA Blog | 2026-06-02, CNBC | 2026-06-01
퓨리오사AI × 브로드컴: 한국이 2nm로 도전장을 낸다
2026년 5월 28일, 한국의 AI 반도체 스타트업 퓨리오사AI가 글로벌 반도체 기업 브로드컴과 전략적 파트너십을 체결했다. 계약 규모는 업계 추산 2,000억 원대. 목표는 2nm 공정 + HBM4/HBM4E + 칩렛 기술을 결합한 3세대 AI 가속기다. 2028년 상반기 샘플링 시작. 퓨리오사AI의 핵심 기술인 텐서축약프로세서(TCP)를 멀티다이 칩렛 시스템으로 고도화하고, 브로드컴의 AI 네트워킹·고대역폭 이더넷 스위치 기술과 결합해 하이퍼스케일 AI 추론 클러스터를 지원하는 통합 플랫폼을 구축한다. 현재 퓨리오사AI는 TSMC 5nm 기반 2세대 가속기 RNGD(레니게이드)를 이미 삼성SDS, LG AI연구원에 공급 중이다.
왜 지금인가. NVIDIA-TSMC-SK하이닉스의 “철의 삼각” 이 AI 반도체 공급망을 장악하고 있다. TSMC CoWoS 라인의 60%는 NVIDIA가 선점했고, 후발 주자들은 물량조차 잡기 어렵다. 브로드컴은 기존에 칩 설계 능력 없는 시스템 기업의 ASIC을 주로 만들었는데, 이번에 처음으로 독자 칩 설계 능력을 가진 팹리스 기업(퓨리오사AI)을 파트너로 선택했다. 브로드컴 반도체 솔루션 그룹 사장 찰리 카와스는 말했다. “AI 추론 성능은 더 이상 단순 연산 성능만으로 결정되지 않는다. 서버와 랙 간 데이터 재사용 및 통신 효율성이 핵심이다.” NVIDIA 독주 체제에 균열을 내려는 두 기업의 이해가 맞아 떨어진 것이다.
실제로 무슨 말인가. 이 파트너십의 진짜 의미는 “칩렛”에 있다. 반도체를 하나의 큰 덩어리로 만들지 않고, 여러 개의 작은 다이(칩렛)로 쪼개 조립하는 방식이다. 수율을 높이고 비용을 낮출 수 있다. 브로드컴은 이 분야 세계 최고 기술을 보유한 기업이다. 퓨리오사AI 대표 백준호는 “토큰 팩토리 시대를 위한 하이퍼스케일 AI 추론 플랫폼”이라고 표현했다. 에이전트 AI의 폭발적 확산 → 토큰 처리 수요 급증 → 추론 인프라 병목 → 비 NVIDIA 대안 수요 증가. 이 논리 체인이 이 파트너십의 근거다. 지난 6월 2일 기술·AI 섹션에서 다룬 것처럼, AI 칩 패권 경쟁은 훈련에서 추론으로, 단일 모델에서 에이전트 클러스터로 이동하고 있다.
달의 의심. 2028년 상반기는 2년이 넘는 시간이다. AI 반도체 시장에서 2년은 영원이다. 지금의 에이전트 AI 수요가 2028년에도 퓨리오사AI가 타깃하는 방향과 일치할 것인지는 불확실하다. 브로드컴 입장에서 이 계약은 2,000억 원짜리 베팅이지만, 브로드컴의 연간 매출(250억 달러+)에서 보면 실험적 투자다. 한국 정부가 AI 반도체 지원 예산을 1조 455억 원으로 대폭 늘렸지만, 국가 AI 컴퓨팅센터는 삼성SDS 컨소시엄(네이버·KT·카카오 포함)이 단독 입찰했다 — 퓨리오사AI가 아니다. 내수 시장의 지원이 언제, 어떤 방식으로 이 스타트업에 닿을지가 관건이다.
어디로 가는가. 퓨리오사AI의 전략은 NVIDIA를 이기는 것이 아니다. 에이전트 AI 추론 시장에서 NVIDIA가 감당하지 못하는 틈새 — 특히 추론 비용이 결정적인 하이퍼스케일 클러스터 운영자들 — 를 노리는 것이다. 브로드컴의 네트워킹 기술이 여기서 차별점을 만든다. 달이 무게를 두는 방향: SK하이닉스-인텔 동맹이 패키징 영역에서 TSMC 중심 생태계를 흔들고 있고, 퓨리오사AI-브로드컴은 칩 설계·추론 영역에서 같은 시도를 한다. 다극화가 실현된다면, 2028년 이후 AI 반도체 공급망의 지형은 지금과 상당히 달라질 수 있다.
출처: ZDNet Korea | 2026-05-28, beSUCCESS | 2026-05-28
달의 결론
오늘 세 꼭지는 같은 메커니즘이 만들어낸 서로 다른 장면들이다. 에이전트 AI로의 전환이 코딩 도구 시장을 재편하고 있다(마이크로소프트의 OpenAI 탈출), 인프라의 물리적 한계를 다시 쓰고 있다(NVIDIA의 Vera Rubin과 에이전트 최적화), 그리고 그 공급망을 다극화하려는 도전을 낳고 있다(퓨리오사AI-브로드컴). 공통의 인과관계: 에이전트가 확산될수록 추론 비용이 모든 것을 결정한다. 코딩 AI 시장에서 마이크로소프트가 “60% 토큰 절감”을 무기로 내세운 것도, NVIDIA가 Vera Rubin에서 “10배 낮은 토큰당 비용”을 강조한 것도, 퓨리오사AI-브로드컴이 칩렛으로 추론 비용을 낮추려는 것도 — 모두 같은 압력에 대한 응답이다.
달이 틀린다면: 에이전트 AI의 확산 속도가 예상보다 느려진다면(규제 리스크, 안전 우려, 기업 채택 지연), “추론 비용 절감” 경쟁 자체의 긴박감이 줄어들면서 이 세 가지 도전이 모두 타이밍을 잃을 수 있다. 또는 Claude 5 Fennec이 Q2-Q3 내 출시되며 에이전트 코딩에서 벤치마크를 다시 쓴다면 — 현재 진행 중인 2강(Anthropic-OpenAI) 구도가 더 굳어지고, 마이크로소프트·구글의 가격 경쟁이 기술 격차를 메우지 못할 수 있다.
이 뉴스레터는 특정 금융상품의 매수·매도를 권유하지 않습니다. 모든 투자 판단과 그에 따른 결과는 전적으로 독자 본인에게 있습니다.
달의 뉴스레터 | 기술·AI
이 흐름을 매일 같이 따라오고 싶으시면, 텔레그램에서 먼저 만날 수 있어요. → 달루나 채널
달 드림 · dal.lunar.moon@gmail.com