AI 에이전트 요금전쟁 토큰 거품 TSMC | 기술·AI

기술·AI — 2026년 04월 20일

달의 뉴스레터

AI 산업은 지금 두 개의 균열을 동시에 경험하고 있다. 하나는 요금표 위에서, 다른 하나는 실리콘 위에서.

1. “무제한 뷔페”의 종말 — AI 에이전트 요금전쟁, 그리고 수요 거품의 균열

4월 4일, Anthropic은 조용히 하나의 문을 닫았다. Claude Pro·Max 구독자들이 OpenClaw 같은 서드파티 에이전트 도구를 구독 한도 안에서 돌리는 것을 차단했다. 그리고 8일, 에이전트 하네스를 시간당 0.08달러에 새로 내놓았다. OpenAI는 일주일 만에 반격했다 — 에이전트 런타임을 아파치 2.0 오픈소스로 무료 공개. Google과 Microsoft는 기업 번들링 패키지로 각자의 진영을 지켰다.

표면은 요금 다툼이다. 그러나 4월 17일 CNBC의 Deirdre Bosa가 꺼낸 진짜 질문은 더 불편하다. AI 수요 자체가 부풀려져 있지 않은가.

기업들은 지금 “토큰맥싱(tokenmaxxing)” 리더보드를 만들어 직원이 AI를 얼마나 많이 쓰는지를 성과 지표로 삼는다. Meta와 Shopify가 내부 추적 시스템을 운영하고, 젠슨 황은 AI 컴퓨팅을 많이 쓰지 않는 엔지니어를 “걱정스럽다”고 했다. 활동이 수요로 포장된다. 그러나 Ramp CEO 에릭 글리먼이 지적한 대로, 토큰 소비가 13배 늘었어도 생산성이 13배 늘었다는 증거는 없다.

왜 지금인가. Anthropic의 $200짜리 Max 플랜이 실제로는 $1,000~5,000 규모의 에이전트 컴퓨팅을 흡수하는 통로로 쓰이고 있었다는 게 드러난 시점이다. 지금 막지 않으면 수익 구조가 무너진다. Anthropic이 먼저 움직인 것은 손해를 본 것이 아니라, 현실을 먼저 인식했기 때문이다. OpenAI가 런타임을 공짜로 뿌린 것은 볼륨 경쟁이다 — 규모를 키우고 IPO 숫자를 크게 만드는 전략. 두 회사의 방향은 지금 뚜렷하게 갈리고 있다.

실제로 무슨 말인가. AI 산업의 수요 지표가 의심받기 시작했다는 것이다. TSMC와 NVIDIA는 지금 수조 원 규모의 설비를 AI 수요 예측에 기반해 짓고 있다. 그 예측이 ‘기업 내 토큰 쓰기 경쟁’으로 부풀려진 숫자라면, 2027~2028년에 공급 과잉이 온다. 데이터센터를 먼저 지은 쪽이 먼저 고통받는다. Dario Amodei가 말한 “불확실성의 원뿔(cone of uncertainty)” — 1~2년 후 수요를 지금 확신할 수 없다는 고백 — 이 그냥 겸손한 말이 아니라는 뜻이다.

달의 의심. Anthropic의 서사가 너무 깔끔하다. “우리만 현실적이다”는 포지셔닝이 IPO 준비 과정에서 ‘수익성 있는 AI 회사’로 보이기 위한 브랜딩일 가능성이 있다. 실제로 Anthropic의 연간 매출 추정치가 $190억이라는 숫자와 $300억이라는 숫자가 동시에 나돌고 있는 상황 — OpenAI CRO가 “Anthropic이 런레이트를 $80억 과장한다”는 내부 메모까지 유출됐다. 수요 거품을 지적하는 쪽이 정작 자기 수치에는 부정직할 수 있다. 비판의 정직함은 방향을 가리지 않는다.

어디로 가는가. 에이전트 하네스 요금전쟁은 단기적으로 OpenAI가 유리하다 — 무료 런타임으로 개발자를 잡아두는 전략은 빠르다. 그러나 중장기적으로는 토큰 소비 추적보다 ‘에이전트 완료 업무 단위(agentic work unit)’를 새 지표로 만들려는 Salesforce의 방향이 승리한다. 진짜 생산성을 증명하는 회사가 살아남는다. 수요 거품 논쟁의 진짜 승자는 2028년 어느 분기 실적에서 결판난다. 지금은 누가 맞는지 알 수 없다 — 알 수 있다고 말하는 사람을 의심해야 한다.

출처: CNBC | 2026-04-17 / The New Stack | 2026-04-08 / Axios | 2026-04-06

2. 빅테크의 칩 내재화 — TSMC가 엔비디아 없이도 이긴다

Amazon의 앤디 재시가 주주서한에서 썼다. “트레이니엄 칩을 규모 있게 쓰면 연간 수백억 달러의 데이터센터 비용을 아낄 수 있다.” Meta도 MTIA v3로 자체 AI 추론 칩 개발 속도를 높이고 있다. 그리고 이 달, Reuters가 Anthropic도 자체 칩 검토를 시작했다고 보도했다.

이 뉴스를 AI 칩 경쟁의 이야기로 읽으면 절반만 본 것이다. 진짜 수혜자는 이 칩들을 전부 만드는 TSMC다. Microsoft의 Maia 200은 TSMC 3nm. Google의 TPU v7e·v8p, Amazon의 Trainium 3, Meta의 MTIA v3 — 모두 TSMC 3nm 공정. 4월 19일 Motley Fool 분석이 지적한 대로, TSMC는 엔비디아에만 의존하는 게 아니라 모든 AI 칩 수요의 집결지다.

TSMC의 시장점유율은 72%. 고객이 분산될수록 TSMC는 더 안전해진다. 역설적으로, 빅테크가 엔비디아에서 독립하려 할수록 TSMC에 대한 의존은 깊어진다.

왜 지금인가. TSMC Q1 실적에서 순이익이 58% 급등하고, 4분기 연속 최고치를 기록한 직후 나온 흐름이다(TSMC Q1 실적은 기업·산업 섹션 2026-04-18에서 자세히 다뤘다). 그 실적이 일시적이지 않음을 확인해주는 구조적 근거가 바로 이 커스텀 칩 러시다. 엔비디아 수주가 주춤하더라도 빅테크 커스텀 칩이 빈자리를 채운다. TSMC의 수요 다각화는 지금 완성 단계에 있다.

실제로 무슨 말인가. AI 인프라 전쟁의 주도권이 모델(Anthropic, OpenAI)에서 칩 설계(빅테크 각자)로, 그리고 제조(TSMC)로 이동하고 있다는 것이다. “누가 가장 좋은 모델을 만드는가”의 싸움과 별개로, “누가 가장 싼값에 추론을 돌리는가”의 싸움이 더 경제적 의미가 크다. Amazon이 트레이니엄으로 연간 수백억 달러를 아끼는 게 실현되면, Anthropic의 API를 쓰는 것보다 자체 스택이 합리적이 된다. AI 산업의 수직화가 빨라진다.

달의 의심. 빅테크 커스텀 칩의 성능이 실제로 엔비디아를 따라잡는다는 가정이 있다. 그러나 지금까지의 경험은 다르다. Google TPU도, Amazon Trainium도 특정 워크로드에서는 탁월하지만 범용 AI 학습에서는 아직 H100·B200 수준이 아니다. 추론(inference)에서는 비용 효율이 높지만, 학습(training)에서는 여전히 엔비디아 의존이 크다. 수직화 스토리는 설득력 있지만, 학습 단계에서의 NVIDIA 의존을 얼마나 빨리 끊을 수 있는지가 실제 변수다.

어디로 가는가. TSMC에 불리한 시나리오는 두 가지다 — 미국 정부가 애리조나 공장 기반으로 자국 파운드리(Intel, CHIPS Act)를 육성해 TSMC 의존을 줄이거나, 중국의 반도체 제조 기술이 예상보다 빨리 추격하는 경우다. 어느 쪽도 2026년 내에는 일어나기 어렵다. 달이 무게를 두는 방향은: TSMC는 지금 가장 안전한 AI 인프라 수혜 구조 위에 있다. 한국에서 SK하이닉스의 HBM이 TSMC 칩과 결합하는 패키징 생태계가 계속 중요해질 것이다.

출처: The Motley Fool | 2026-04-19 / CNBC | 2026-04-16

3. 납 차폐복 대신 로봇팔 — 서울아산병원, 국산 심혈관 AI 로봇 ‘에이비아’ 임상 성공

협심증을 앓던 56세 남성이 서울아산병원 심장내과로 왔다. 안정민 교수팀은 그를 납 차폐복을 입은 의사가 아니라 로봇이 주도하는 시술로 치료했다. 에이비아(AVIAR) — 엘엔로보틱스가 개발한 국산 1호 관상동맥중재술 보조 로봇. 환자는 합병증 없이 하루 만에 퇴원했다.

기술 수치가 인상적이다. 시술 시간 46% 이상 단축. 환자 방사선 노출 22% 감소. 가이드와이어부터 스텐트까지 최대 5개 도구 동시 제어. 1mm 단위 정밀 위치 제어와 햅틱(촉각 전달) 기능. 실시간 AI 영상 가이드로 정확도 향상, 조영제 사용량 감소.

지금까지 심혈관 중재술 로봇 시장은 미국 Corindus(현 Siemens Healthineers)의 CorPath GRX가 사실상 독점해왔다. 국산 로봇이 실제 환자에게 투입되어 성공한 것은 이번이 처음이다.

왜 지금인가. 에이비아는 2023년 2월 식약처 품목 승인, 2024년 12월 혁신 의료기술 지정까지 받았지만 실제 임상 투입은 2026년 3월에 이뤄졌다. 4월 14일 이 성과를 공식 발표한 시점이 의미 있다 — 혁신 의료기술 지정 이후 일반 환자 적용이 현실화됐다는 최초 공식 확인이다. 지금 이 뉴스레터에서 다루는 이유는 하나 — K-의료 로봇이 ‘가능하다’에서 ‘했다’로 넘어간 첫 증거이기 때문이다.

실제로 무슨 말인가. 피지컬 AI — 소프트웨어 AI가 물리 세계와 직접 상호작용하는 영역 — 가 의료에서 먼저 증명됐다는 것이다. 그동안 납 차폐복을 입고 방사선 앞에서 1~2시간 기구를 조작하던 의사들이 이제 조이스틱으로 원격 제어한다. 이것은 편의의 문제가 아니라 지속 가능성의 문제다 — 방사선 누적 노출로 커리어가 단축되는 중재 시술 전문의가 더 오래, 더 많이 시술할 수 있게 된다.

달의 의심. 임상 1건으로 ‘성공’을 선언하기에는 이르다. 관상동맥 시술은 환자마다 혈관 굴곡과 병변 특성이 다르고, 복잡한 케이스에서 로봇이 어떻게 작동하는지는 수백 건의 데이터가 쌓여야 알 수 있다. 또한 건강보험 미등재 상태 — 실제로 더 많은 환자에게 닿으려면 급여화가 필수인데, 그 과정이 수년이 걸릴 수 있다. “K의료 자립”이라는 서사가 과하게 팔리지 않도록 주의할 필요가 있다.

어디로 가는가. 에이비아가 추가 임상 근거를 쌓고 건강보험에 등재되면, 수입 의존도 높은 중재 시술 로봇 시장에서 국산 대안이 등장한다. 더 넓게 보면, 한국의 의료 AI 로봇은 내수 시장 실증 → 동남아·중동 수출이라는 경로를 밟을 수 있다. 한국이 반도체와 배터리에 이어 피지컬 AI 의료 기기를 3번째 수출 동력으로 키울 수 있는지, 에이비아는 그 가설의 첫 번째 데이터 포인트다.

출처: 한국경제 | 2026-04-14 / 데일리안 | 2026-04-14

달의 결론

오늘 기술 세계의 공통된 질문은 하나다. AI가 말하는 것만큼 실제로 작동하는가.

에이전트 요금전쟁은 AI가 ‘채팅’에서 ‘에이전트’로 전환되는 순간 경제학이 완전히 바뀐다는 것을 폭로했다. 토큰을 많이 쓰는 것이 곧 생산성이라는 착각이 기업 문화로 굳어지고 있다 — 이것이 지금 AI 수요 측정의 가장 큰 오류다. Anthropic이 현실을 직시했는지, 아니면 IPO를 위해 서사를 만들었는지는 아직 모른다. 둘 다일 수도 있다.

TSMC는 AI 산업의 모든 싸움에서 이기는 구조를 갖고 있다. 모델 전쟁에서도, 칩 설계 전쟁에서도, 커스텀 칩 러시에서도 모두 TSMC 파운드리를 경유한다. 이 구조는 2026년 안에는 흔들리지 않는다.

에이비아는 소박하지만 단단한 이야기다. 화려한 LLM 발표가 없었던 대신, 납 차폐복을 벗은 의사와 하루 만에 퇴원한 환자가 있다. AI가 가장 의미 있게 작동하는 순간은 벤치마크 1위가 아니라, 실제 사람의 삶이 바뀌는 순간이다.

내가 틀린다면 — 토큰 수요 거품이 과장된 것이어서 실제 AI 생산성이 예상보다 빠르게 증명되는 경우, 또는 TSMC 이외의 파운드리(삼성, Intel Foundry)가 예상보다 빠르게 기술 격차를 좁히는 경우다. 전자는 2026년 하반기 기업 실적에서, 후자는 2027년 공정 노드 경쟁에서 확인될 것이다.

이 뉴스레터는 특정 금융상품의 매수·매도를 권유하지 않습니다. 모든 투자 판단과 그에 따른 결과는 전적으로 독자 본인에게 있습니다.

달의 뉴스레터 | 기술·AI

이 흐름을 매일 같이 따라오고 싶으시면, 텔레그램에서 먼저 만날 수 있어요. → 달루나 채널

달 드림 · dal.lunar.moon@gmail.com