TREND ANALYSIS · STACKER

Training에서 Inference로 —
에이전틱 칩이 바꾸는 부품 지도

GTC 2026에서 공개된 Groq 3 LPU, Feynman 아키텍처, SRAM 기반 추론칩이 기존 학습칩과 근본적으로 다른 부품 구조를 요구합니다. 공급 숏티지가 올 핵심 부품과 수혜 기업을 분석합니다.

DATE 2026-03-18

TYPE Trend

STYLE Stacker

HORIZON Mid (1-6M)

SIGNAL OW · +50

$571B

Inference TAM 2033E

CAGR 27.4%

500MB

Groq 3 On-chip SRAM

150 TB/s BW

7.7x

CoWoS 수요/공급 GAP

1M vs 130K WPM

67%

Inference 비중 2026E

33%에서 2배 전환

Executive Summary

AI 칩 산업의 구조적 변곡점이 도래했습니다. NVIDIA는 GTC 2026에서 역사상 처음으로 GPU가 아닌 전용 추론칩 — Groq 3 LPU를 공개했습니다. ~$200억에 인수한 Groq의 기술을 통합한 이 칩은 HBM 대신 500MB 온칩 SRAM을 사용하며, 150TB/s 대역폭으로 Blackwell NVL72 대비 35배 높은 추론 처리량을 달성합니다.FACT

핵심 발견: 추론칩의 BOM(부품 구성)이 학습칩과 근본적으로 다릅니다. SRAM 비중이 다이 면적의 70-80%를 차지하고, HBM 대신 칩간 직접 인터커넥트(96개 C2C 링크, 각 112Gbps)를 사용합니다. 이 구조적 변화는 기존 학습칩 공급망의 병목과 전혀 다른 지점에서 새로운 숏티지를 유발합니다.INFERENCE

2028년 출시 예정인 Feynman 아키텍처는 TSMC A16 공정, 3D 다이 스태킹(SRAM-over-compute), 실리콘 포토닉스를 도입하며, Intel EMIB 패키징을 사용합니다. 학습과 추론의 완전한 하드웨어 분리가 산업 표준이 되고 있습니다.FACT

◆ INVESTMENT THESIS

학습→추론 전환에서 "병목 자산을 소유하라(Own the Bottleneck)"가 핵심 전략입니다. 부품별 숏티지 심각도: CoWoS 패키징(CRITICAL) > SRAM 다이 면적(CRITICAL) > HBM4(HIGH) > T-glass 기판(HIGH) > MLCC(MODERATE-HIGH). 가장 심각한 병목의 가격 결정권을 가진 기업 — TSMC, SK하이닉스, 삼성전자, 브로드컴이 구조적 수혜를 받습니다.

■ Key Takeaways

Groq 3 LPU: 칩당 500MB SRAM, 삼성 4nm 양산, H2 2026 출하 개시
Feynman(2028): 3D SRAM 스태킹 + 실리콘 포토닉스 + TSMC A16
추론 비중: 전체 AI 컴퓨트의 67%(2026E), $570B TAM(2033E)
SRAM: 추론칩당 500-800MB vs 학습칩 200-400MB (2-2.5배)
CoWoS: 수요 100만 vs 공급 13만 WPM — 숏티지 2027년까지 지속
시그널 합산: +50.25/100 → OW (적극 비중 확대)

■ Top Risks

HIGH 한국 공급망주 밸류에이션 과열 (한미반도체 목표가 대비 +66%)
HIGH 미국 수출규제 추론칩 확대 가능성
HIGH 이란 전쟁 유가 충격 → Fed 금리 동결 장기화
MED DeepSeek식 효율 향상 → 추론 칩 수요 둔화
MED 삼성파운드리 4nm Groq 3 수율 리스크

Training vs Inference — 아키텍처 대전환

AI 칩 역사상 처음으로 학습과 추론이 물리적으로 다른 하드웨어로 분리됩니다. 학습칩(GPU)은 대규모 행렬곱 병렬 처리에 최적화된 반면, 추론칩(LPU)은 순차적 토큰 생성의 초저지연에 집중합니다. 이 구조적 차이가 BOM 구성을 근본적으로 바꿉니다.FACT

TRAINING CHIP (Blackwell/Rubin GPU)

메모리: 외부 HBM4 스택 (22 TB/s)
SRAM: 200-400MB (캐시 용도)
다이: GPU 로직 + HBM 칩렛
패키징: CoWoS 2.5D 대형 인터포저 (1,700mm²)
스케줄링: 런타임 동적 스케줄링
핵심 지표: TFLOPS (연산력)
정밀도: BF16/FP8
병목: HBM 대역폭

INFERENCE CHIP (Groq 3 LPU / 에이전틱 칩)

메모리: 온칩 SRAM 500MB (150 TB/s) FACT
SRAM: 다이 면적의 70-80% 차지
다이: SRAM 위주 + 연산 로직
패키징: HBM 스태킹 불필요, C2C 직접 연결
스케줄링: 컴파일러 정적 스케줄링 (결정론적)
핵심 지표: Tokens/sec, 테일 레이턴시
정밀도: INT4/INT8 양자화
병목: KV 캐시 관리 + 디코드 레이턴시

CHART · BOM SHIFT

학습칩 → 추론칩 전환 시 부품별 수요 변화

GTC 2026 — Groq 3 LPU & Feynman 아키텍처

Groq 3 LPU — NVIDIA 최초의 전용 추론칩

젠슨 황은 GTC 2026 키노트에서 NVIDIA 역사상 처음으로 "하나의 GPU가 모든 것을 처리한다"는 철학을 포기하고, 전용 추론 하드웨어 Groq 3 LPU를 공개했습니다. 2025년 12월 ~$200억에 Groq를 인수한 후 통합한 첫 결과물입니다.FACT

Groq 3 LPX 랙 사양: 256개 LPU, 총 128GB 온칩 SRAM, 40PB/s 랙 레벨 대역폭. 32개 컴퓨트 트레이(각 8 LPU)가 구리 스파인으로 직접 연결됩니다. 트릴리온 파라미터 모델에서 Blackwell NVL72 대비 35배 높은 처리량, 1,500 토큰/초를 주장합니다.FACT

삼성전자가 4nm(SF4X) 공정으로 Groq 3 LPU를 양산 중입니다. 다이 크기 700mm² 이상(웨이퍼당 약 64칩)으로 수율이 극도로 낮습니다. 웨이퍼 출하량은 연 9,000장에서 15,000장으로 ~70% 증가 목표입니다.FACT

Feynman 아키텍처 — 2028년 추론 네이티브 플랫폼

NVIDIA는 Vera Rubin 이후의 차세대 아키텍처 Feynman을 GTC 2026에서 프리뷰했습니다. TSMC A16(1.6nm) 공정, 실리콘 포토닉스(광학 NVLink), 3D 다이 스태킹(SRAM-over-compute), 커스텀 Rosa CPU, BlueField 5를 포함합니다. Blackwell 대비 14배 성능을 주장합니다.FACT

Intel이 Feynman에 EMIB(Embedded Multi-die Interconnect Bridge) 패키징 기술을 공급합니다. TSMC A16 + Intel EMIB의 조합은 업계 최초의 크로스 파운드리 첨단 패키징 협업입니다.FACT

◆ VERA RUBIN + GROQ 3 = 추론 디스어그리게이션

Vera Rubin 플랫폼에서 LPX는 Attention-FFN Disaggregation(AFD) 아키텍처를 사용합니다. Rubin GPU가 KV 캐시 기반 어텐션을 처리하고, LPX가 Feed-Forward(FFN)과 MoE 레이어를 가속합니다. 이는 학습/추론의 물리적 분리를 넘어, 추론 내부에서도 워크로드를 세분화하는 구조적 혁신입니다.FACT

■ Groq 3 LPU 핵심 스펙

SRAM: 500MB 온칩 (150 TB/s)
연산: 1.2 PFLOPS FP8
C2C 링크: 96개 × 112Gbps = 2.5TB/s
파운드리: 삼성 4nm (SF4X)
다이: 700mm²+ (웨이퍼당 ~64칩)
출하: H2 2026 (Q3/Q4 양산)
가격 목표: $45/백만 토큰
에너지: 300 토큰/초/MW

■ Feynman 로드맵 (2028)

공정: TSMC A16 (1.6nm)
LPU: LP40 (Groq 팀 공동 설계)
CPU: 커스텀 Rosa
인터커넥트: 실리콘 포토닉스
메모리: 커스텀 HBM5 / HBM4E
패키징: Intel EMIB + TSMC SoIC

공급 병목 심층 분석 — 어디서 숏티지가 오는가

추론칩 전환은 기존 학습칩과 완전히 다른 지점에서 공급 병목을 유발합니다. 학습칩의 병목이 HBM과 CoWoS에 집중되었다면, 추론칩은 SRAM 다이 면적, 첨단 패키징, SerDes, 그리고 수동 부품(MLCC)에서 새로운 숏티지를 만듭니다.INFERENCE

CoWoS / 첨단 패키징CRITICAL — 7.7× 초과 수요

SRAM 다이 면적 (추론칩)CRITICAL — 5-10× 면적 vs DRAM

HBM4 (학습칩용)HIGH — 2026년 전량 소진

T-Glass 기판HIGH — 정상화 2027년+

IC 서브스트레이트 / 인터포저HIGH — 설계 리드타임 12M+

MLCC (수동 부품)MODERATE-HIGH — 가격 +30-40%

AI 웨이퍼 (범용)CRITICAL — SK하이닉스: 2030년까지 부족

1. CoWoS / 첨단 패키징 — 최악의 병목

TSMC CoWoS 연간 수요가 ~100만 웨이퍼인 반면, 2026년 말 목표 공급량은 ~13만 웨이퍼에 불과합니다. NVIDIA가 TSMC CoWoS 용량의 50-60%를 선점(Morgan Stanley 추정: 595K 웨이퍼)하고 있어, AMD, 브로드컴 등 경쟁사는 만성적 용량 부족에 시달립니다.FACT

인터포저 크기가 Hopper 814mm²에서 Blackwell 1,700mm²로 109% 증가했으며, Rubin과 Feynman에서 더 커집니다. T-glass(AI 칩 패키징용 특수 유리 기판)가 새로운 병목으로 부상했으며, Nittobo의 후쿠시마 공장 3배 증설에도 시장 정상화는 2027년 이후입니다.FACT

2. SRAM 다이 면적 — 추론칩만의 고유 병목

SRAM 셀은 DRAM 대비 비트당 5-10배 더 큰 다이 면적을 차지합니다. Groq 3 LPU의 500MB SRAM이 700mm²+ 다이의 대부분을 점유합니다. 삼성 4nm 웨이퍼당 약 64칩만 생산 가능하며, 수율 관리가 극도로 어렵습니다.FACT

이것이 추론칩만의 고유 병목인 이유: 학습칩(GPU)은 연산 로직이 다이의 주요 면적을 차지하고 메모리는 HBM으로 외부 탑재하지만, 추론칩은 SRAM이 다이 면적의 70-80%를 차지합니다. 결국 추론칩 생산량은 SRAM 밀도에 의해 직접 제약됩니다.INFERENCE

3. MLCC — 조용한 숏티지

AI 서버 랙당 최대 440,000개 MLCC가 필요합니다. 고성능 MLCC 가격이 2026년 2월까지 15-20% 상승했으며, 연간 +30-40% 인상 전망입니다. 무라타(일본)와 삼성전기(한국)가 가격 조정을 발표했습니다. 공급 정상화에 18-24개월 필요합니다.FACT

■ 증가하는 부품

온칩 SRAM — 캐시→주메모리 전환, 칩당 500MB+
첨단 패키징 — CoWoS-L, SoIC, EMIB, 3D 스태킹
고속 C2C 인터커넥트 — 칩당 96개, 112Gbps
SerDes IP — 초고속 직렬/역직렬 변환
MLCC — AI 랙당 44만개
광학 부품 — 실리콘 포토닉스 (Feynman)

■ 감소하는 부품

표준 HBM — 디코드 단계에서 SRAM이 대체
대형 인터포저 — LPU는 HBM 스태킹 불필요
※ HBM 총 수요는 학습 볼륨 성장으로 여전히 증가 추세

병목 수혜 기업 분석 — US & Korea

PORTFOLIO · TOP PICKS

추론칩 전환 핵심 수혜 기업

기업명	Ticker	현재가	Tier	Rating	핵심 역할	카탈리스트
TSMC	TSM	$345.98	TIER 1	OW	CoWoS 병목 소유자, A16 Feynman 파운드리	용량 +66% 확장, 전량 선판매 완료
SK하이닉스	000660	₩1,007,000	TIER 1	OW	HBM4 독점적 공급 (~67% NVIDIA 할당)	2026년 전량 소진, HBM4E 개발
Broadcom	AVGO	$322	TIER 1	OW	커스텀 AI ASIC 시장 75-90% 장악	AI 매출 +220% YoY, $73B 백로그
삼성전자	005930	₩208,500	TIER 1	OW	Groq 3 파운드리(4nm) + HBM4E + MLCC 트리플 노출	웨이퍼 9K→15K 램프, GTC 2026 파트너
한미반도체	042700	₩311,000	TIER 2	OW	TC Bonder 글로벌 71% 점유 — HBM + SRAM 스태킹	HBM4 + 추론칩 SRAM 이중 수요
Marvell	MRVL	$87.67	TIER 2	EW+	SerDes IP + AWS 커스텀 ASIC	고속 인터커넥트 수요 급증
Amkor	AMKR	$42.99	TIER 2	OW	OSAT #2, HDFO 첨단 패키징 램프	CAPEX $2.5-3.0B, CoWoS 오버플로우 수혜
삼성전기	009150	—	TIER 2	OW	AI 서버 MLCC 공급 (랙당 44만개)	MLCC 가격 +30-40% 인상
ISC	095340	₩178,900	TIER 3	EW	반도체 테스트 소켓	52주 +357% — 밸류에이션 과열 주의
HPSP	403870	₩46,150	TIER 2	OW	고압수소어닐링 장비 독점 (GAA/2nm)	TSMC A16 + 삼성 2nm GAA 이중 수혜
리노공업	058470	₩56,500	TIER 2	OW	프로브카드 — 첨단 노드 테스트	Q4 영업이익률 47.6%, 3D/SRAM ASP 상승

출처: Investing.com, CNBC, TrendForce, 각사 IR — 2026-03-18 기준 | 가격은 가장 최근 거래일 종가

한국 공급망 — 추론칩 전환의 최대 수혜

삼성전자 — 트리플 노출의 핵심

삼성전자는 추론칩 전환에서 가장 다각적인 수혜를 받는 기업입니다. ① Groq 3 LPU 유일한 파운드리(4nm SF4X), ② HBM4E 공급자(GTC 2026에서 7세대 발표), ③ 삼성전기를 통한 MLCC 공급. 이 세 가지 축이 동시에 회전합니다.FACT

젠슨 황이 키노트에서 직접 삼성에 감사를 표했습니다. 삼성파운드리는 Groq 3 웨이퍼 출하량을 연 9,000장에서 15,000장으로 ~70% 증가시키고 있습니다. Ming-Chi Kuo 전망: 2026-2027년 LPU 누적 출하 4-500만 개, 10배 급증.FACT

SK하이닉스 — HBM 독점적 지위

SK하이닉스가 NVIDIA의 2026년 HBM4 할당의 약 67%를 확보하고 있습니다. 회장이 GTC에서 "AI 웨이퍼 부족이 2030년까지 지속될 수 있다"고 경고했습니다. 2026년 HBM 생산분은 이미 전량 판매 완료. 2025년 연간 영업이익 47.2조원으로 사상 최고를 기록했습니다.FACT

한미반도체 — TC Bonder의 이중 수요

TC(Thermal Compression) Bonder 글로벌 시장점유율 71%로 HBM 스태킹의 핵심 장비입니다. 추론칩 전환에서 새로운 수요가 발생합니다: SRAM 스태킹/3D 다이 스태킹에도 TC Bonder가 필요하기 때문입니다. 다만 현재 주가 ₩311,000은 애널리스트 목표가 ₩187,000을 66% 초과하고 있어 밸류에이션 리스크가 존재합니다.INFERENCE

원화 약세 — 한국 반도체 기업의 FX 순풍

USD/KRW가 1,489원(2026-03-17)으로 약세를 보이고 있습니다. SK하이닉스와 삼성전자는 제품을 달러로 인보이스하고 원화로 보고하므로, 원화 약세가 보고 영업이익에 8-12% FX 순풍을 제공합니다. 다만 이란 전쟁발 유가 상승이 한국 경상수지를 악화시킬 수 있는 역풍도 존재합니다.INFERENCE

Signal Scoring — 6-Factor 가중 합산

NET SIGNAL SCORE

+50.25 /100

→ POSITIVE BIAS → OW (Overweight, 적극 비중 확대)

business_product (20%)+16.0 / 20

industry_sector (15%)+11.25 / 15

macro_rates (20%)+8.0 / 20

fundamentals_quant (20%)+7.0 / 20

news_catalysts (10%)+5.0 / 10

technical_flow (15%)+3.0 / 15

Scenario Analysis

BULL CASE

30%

SOX +18-24% (→ 9,000-9,500)

하이퍼스케일러 2026 AI CAPEX $350B+로 상향. CoWoS 병목 2027년까지 지속 → TSMC/SK하이닉스 프리미엄 가격 유지. 수출규제 현 수준 유지. NVDA $250-270.

BASE CASE

50%

SOX +5-11% (→ 8,000-8,500)

AI CAPEX $280-320B 범위 유지, 추론 주도 성장 40-60% YoY. CoWoS 점진 완화. 수출규제 마찰 있으나 대규모 신규 제한 없음. NVDA $200-220.

BEAR CASE

20%

SOX -9-15% (→ 6,500-7,000)

Q2 2026 수출규제 대폭 강화(H20/B20 전면 금지). DeepSeek V4 효율 혁신 → 칩 수요 하락. 유가 $100+ 지속 → Fed 긴축 복귀. NVDA $130-150.

Risk Matrix — 8대 리스크 요인

RISK · MATRIX

리스크	확률	영향	등급	설명
밸류에이션 과열	M	H	HIGH	한미반도체 목표가 대비 +66%, ISC +357% YTD — 한국 공급망주 다중 축소 리스크
수출규제 확대	M	H	HIGH	BIS가 추론칩(LPU급)까지 수출규제 확대 가능성. NVDA 중국 매출 ~17%($8-12B) 위험
지정학 리스크	M	H	HIGH	대만해협 긴장, 이란 전쟁 유가 $110+, 한국 공급망 집중 리스크
효율 향상 리스크	M	M	MED	DeepSeek식 10-20x 효율 향상 → 워크로드당 칩 수요 감소. 에이전틱 AI 확산이 상쇄 여부 불확실
실행 리스크	L	H	MED	삼성 4nm Groq 3 수율, TSMC CoWoS 확장 지연, HBM4 램프 차질
기술 변화 리스크	L	H	MED	포스트-트랜스포머 아키텍처(SSM, 뉴로모픽)가 HBM/CoWoS 요구량을 바꿀 가능성 (3-5년)
고객 집중 리스크	H	M	HIGH	Top 3 하이퍼스케일러 = NVDA DC 매출 ~65%. 커스텀 실리콘(TPU/Trainium) 수직통합 위협
매크로/금리 리스크	L	M	LOW	Fed 3.50-3.75% 동결 장기화 시 반도체 멀티플 압축. 10Y UST 5% 초과 시 밸류에이션 재조정

Macro Environment — 추론칩 사이클의 거시 배경

현재 매크로 레짐: Late Expansion + 유가 충격. 미국 GDP 성장률 2026년 2.6% 전망(Goldman Sachs), 이란 전쟁으로 브렌트유 $70→$110+, 가솔린 $3.79/갤런(NPR, 2026-03-16).FACT

Fed 금리: 3.50-3.75% 동결 (2026-03-18 FOMC). 이란 전쟁 이전 2회 인하 전망(6월+9월) → 현재 1회 또는 0회로 축소. CPI 2.4% YoY(2026년 1월). 유가 충격 시 연말 인플레이션 3.0% 전망.FACT

하이퍼스케일러 CAPEX는 금리 둔감. Big Five(MS, GOOG, AMZN, META, ORCL) 2026년 AI 인프라 CAPEX ~$600B (+38% YoY) 확정. NVIDIA에 Blackwell + Vera Rubin 주문 $1조 이상 파이프라인. 이것은 전략적 경쟁 지출이지 경기 민감 투자가 아닙니다.FACT

반도체 사이클: AI 구조적 상승 사이클 중기(Phase 3/5). 2026년 글로벌 반도체 매출 사상 최초 $1조 돌파 전망. SOX -10%는 밸류에이션 조정이지 펀더멘탈 악화가 아닙니다.NARRATIVE

Catalyst Timeline — 향후 6개월

CATALYST · TIMELINE

시기	이벤트	영향도	태그
2026 Q1	GTC 2026 (진행 중) — Groq 3 LPU 공개, Feynman 프리뷰	HIGH	FACT
2026 Q2	Groq 3 LPX 고객 샘플링 시작	HIGH	FACT
2026 Q2	Vera Rubin NVL72 고객 출하 개시	HIGH	FACT
2026 Q2	미국 수출규제 추가 검토 (BIS)	HIGH ↓	NARRATIVE
2026 Q3	Groq 3 LPX 양산 (삼성 4nm, 15K WPM 목표)	HIGH	FACT
2026 Q3	AWS Groq 3 LPU 배치 가동 — 하이퍼스케일러 채택 검증	HIGH	FACT
2026 Q3	HBM4 램프 — SK하이닉스 / 삼성 / 마이크론	HIGH	FACT
2026 H2	SambaNova SN50 RDU 상용 배치	MED	FACT
2027	T-glass / 패키징 공급 정상화 (예상)	MED	INFERENCE
2028	NVIDIA Feynman 양산 — A16, 3D 스태킹, 실리콘 포토닉스	HIGH	FACT

경쟁 구도 — 추론칩 시장의 주요 플레이어

COMPETITIVE · LANDSCAPE

기업	제품	아키텍처	밸류에이션	강점	약점
NVIDIA+Groq	Groq 3 LPU / LPX	SRAM 기반 결정론적 LPU	$4.42T (공개)	풀스택 통합 (GPU+LPU+NVLink+CUDA)	가격 프리미엄, 수출규제 노출
Cerebras	WSE-3	웨이퍼 스케일 엔진	$23B (비공개)	OpenAI $10B+ 계약, 유니크 아키텍처	제조 복잡성, 에코시스템 미성숙
SambaNova	SN50 RDU	SRAM+HBM+DRAM 하이브리드	$5.1B (피크)	10T+ 파라미터, 5x 속도 주장	Intel 인수 제안 $1.6B(다운라운드)
Tenstorrent	Grayskull/Wormhole	RISC-V 오픈 ISA, 칩렛	$3.2B (비공개)	Jim Keller 경영, LG/현대/삼성 투자	아직 대규모 양산 전
Broadcom	커스텀 AI ASIC	하이퍼스케일러 맞춤 설계	$1.52T (공개)	Google TPU, Meta, ByteDance 다수 고객	자체 브랜드 칩 없음, 설계 리드타임
d-Matrix	Corsair	인메모리 컴퓨팅	$2B (비공개)	Microsoft 투자, 독자 아키텍처	초기 단계, 시장 점유율 미미

CHART · TAM

AI Inference Chip TAM 성장 전망 ($B)

Data Source Dashboard

NVIDIA GTC 2026

Groq 3 LPU, Feynman, Vera Rubin 공식 발표 — 2026-03-17

TrendForce

삼성 Groq 3 웨이퍼 램프, CoWoS 용량, HBM4 할당 — 2026-03

CNBC

NVIDIA-Groq $20B 인수, GTC 키노트, Fed 금리 — 2025-12~2026-03

Tom's Hardware

인터포저/T-glass 병목, Feynman 로드맵 — 2026 Q1

Dataconomy

삼성 4nm Groq 3 양산 확인 — 2026-03-17

Deloitte

추론 시장 규모, 인퍼런스 플립 분석 — 2026

Investing.com

실시간 주가, SOX, USD/KRW — 2026-03-18

Korea Herald

SRAM vs HBM 전환 분석, HBM 주가 영향 — 2026-03-10

Ming-Chi Kuo

LPU 출하량 10배 급증 전망 — 2026-03

Goldman Sachs

US GDP 2026 전망, 매크로 레짐 — 2025-12

Morgan Stanley

TSMC CoWoS NVIDIA 할당, AVGO/MRVL 목표가 — 2026-03

SemiAnalysis

HBM 로드맵, SRAM 밀도 분석 — 2025-2026

HPCWire

SambaNova SN50 RDU 발표 — 2026-02-25

Bloomberg

Cerebras $23B, SambaNova $350M, Fed 전망 — 2026-02~03

Fed Reserve

FOMC 성명서, H.10 환율 데이터 — 2026-01~03