GTC 2026에서 공개된 Groq 3 LPU, Feynman 아키텍처, SRAM 기반 추론칩이 기존 학습칩과 근본적으로 다른 부품 구조를 요구합니다. 공급 숏티지가 올 핵심 부품과 수혜 기업을 분석합니다.
AI 칩 산업의 구조적 변곡점이 도래했습니다. NVIDIA는 GTC 2026에서 역사상 처음으로 GPU가 아닌 전용 추론칩 — Groq 3 LPU를 공개했습니다. ~$200억에 인수한 Groq의 기술을 통합한 이 칩은 HBM 대신 500MB 온칩 SRAM을 사용하며, 150TB/s 대역폭으로 Blackwell NVL72 대비 35배 높은 추론 처리량을 달성합니다.FACT
핵심 발견: 추론칩의 BOM(부품 구성)이 학습칩과 근본적으로 다릅니다. SRAM 비중이 다이 면적의 70-80%를 차지하고, HBM 대신 칩간 직접 인터커넥트(96개 C2C 링크, 각 112Gbps)를 사용합니다. 이 구조적 변화는 기존 학습칩 공급망의 병목과 전혀 다른 지점에서 새로운 숏티지를 유발합니다.INFERENCE
2028년 출시 예정인 Feynman 아키텍처는 TSMC A16 공정, 3D 다이 스태킹(SRAM-over-compute), 실리콘 포토닉스를 도입하며, Intel EMIB 패키징을 사용합니다. 학습과 추론의 완전한 하드웨어 분리가 산업 표준이 되고 있습니다.FACT
AI 칩 역사상 처음으로 학습과 추론이 물리적으로 다른 하드웨어로 분리됩니다. 학습칩(GPU)은 대규모 행렬곱 병렬 처리에 최적화된 반면, 추론칩(LPU)은 순차적 토큰 생성의 초저지연에 집중합니다. 이 구조적 차이가 BOM 구성을 근본적으로 바꿉니다.FACT
젠슨 황은 GTC 2026 키노트에서 NVIDIA 역사상 처음으로 "하나의 GPU가 모든 것을 처리한다"는 철학을 포기하고, 전용 추론 하드웨어 Groq 3 LPU를 공개했습니다. 2025년 12월 ~$200억에 Groq를 인수한 후 통합한 첫 결과물입니다.FACT
Groq 3 LPX 랙 사양: 256개 LPU, 총 128GB 온칩 SRAM, 40PB/s 랙 레벨 대역폭. 32개 컴퓨트 트레이(각 8 LPU)가 구리 스파인으로 직접 연결됩니다. 트릴리온 파라미터 모델에서 Blackwell NVL72 대비 35배 높은 처리량, 1,500 토큰/초를 주장합니다.FACT
삼성전자가 4nm(SF4X) 공정으로 Groq 3 LPU를 양산 중입니다. 다이 크기 700mm² 이상(웨이퍼당 약 64칩)으로 수율이 극도로 낮습니다. 웨이퍼 출하량은 연 9,000장에서 15,000장으로 ~70% 증가 목표입니다.FACT
NVIDIA는 Vera Rubin 이후의 차세대 아키텍처 Feynman을 GTC 2026에서 프리뷰했습니다. TSMC A16(1.6nm) 공정, 실리콘 포토닉스(광학 NVLink), 3D 다이 스태킹(SRAM-over-compute), 커스텀 Rosa CPU, BlueField 5를 포함합니다. Blackwell 대비 14배 성능을 주장합니다.FACT
Intel이 Feynman에 EMIB(Embedded Multi-die Interconnect Bridge) 패키징 기술을 공급합니다. TSMC A16 + Intel EMIB의 조합은 업계 최초의 크로스 파운드리 첨단 패키징 협업입니다.FACT
추론칩 전환은 기존 학습칩과 완전히 다른 지점에서 공급 병목을 유발합니다. 학습칩의 병목이 HBM과 CoWoS에 집중되었다면, 추론칩은 SRAM 다이 면적, 첨단 패키징, SerDes, 그리고 수동 부품(MLCC)에서 새로운 숏티지를 만듭니다.INFERENCE
TSMC CoWoS 연간 수요가 ~100만 웨이퍼인 반면, 2026년 말 목표 공급량은 ~13만 웨이퍼에 불과합니다. NVIDIA가 TSMC CoWoS 용량의 50-60%를 선점(Morgan Stanley 추정: 595K 웨이퍼)하고 있어, AMD, 브로드컴 등 경쟁사는 만성적 용량 부족에 시달립니다.FACT
인터포저 크기가 Hopper 814mm²에서 Blackwell 1,700mm²로 109% 증가했으며, Rubin과 Feynman에서 더 커집니다. T-glass(AI 칩 패키징용 특수 유리 기판)가 새로운 병목으로 부상했으며, Nittobo의 후쿠시마 공장 3배 증설에도 시장 정상화는 2027년 이후입니다.FACT
SRAM 셀은 DRAM 대비 비트당 5-10배 더 큰 다이 면적을 차지합니다. Groq 3 LPU의 500MB SRAM이 700mm²+ 다이의 대부분을 점유합니다. 삼성 4nm 웨이퍼당 약 64칩만 생산 가능하며, 수율 관리가 극도로 어렵습니다.FACT
이것이 추론칩만의 고유 병목인 이유: 학습칩(GPU)은 연산 로직이 다이의 주요 면적을 차지하고 메모리는 HBM으로 외부 탑재하지만, 추론칩은 SRAM이 다이 면적의 70-80%를 차지합니다. 결국 추론칩 생산량은 SRAM 밀도에 의해 직접 제약됩니다.INFERENCE
AI 서버 랙당 최대 440,000개 MLCC가 필요합니다. 고성능 MLCC 가격이 2026년 2월까지 15-20% 상승했으며, 연간 +30-40% 인상 전망입니다. 무라타(일본)와 삼성전기(한국)가 가격 조정을 발표했습니다. 공급 정상화에 18-24개월 필요합니다.FACT
| 기업명 | Ticker | 현재가 | Tier | Rating | 핵심 역할 | 카탈리스트 |
|---|---|---|---|---|---|---|
| TSMC | TSM | $345.98 | TIER 1 | OW | CoWoS 병목 소유자, A16 Feynman 파운드리 | 용량 +66% 확장, 전량 선판매 완료 |
| SK하이닉스 | 000660 | ₩1,007,000 | TIER 1 | OW | HBM4 독점적 공급 (~67% NVIDIA 할당) | 2026년 전량 소진, HBM4E 개발 |
| Broadcom | AVGO | $322 | TIER 1 | OW | 커스텀 AI ASIC 시장 75-90% 장악 | AI 매출 +220% YoY, $73B 백로그 |
| 삼성전자 | 005930 | ₩208,500 | TIER 1 | OW | Groq 3 파운드리(4nm) + HBM4E + MLCC 트리플 노출 | 웨이퍼 9K→15K 램프, GTC 2026 파트너 |
| 한미반도체 | 042700 | ₩311,000 | TIER 2 | OW | TC Bonder 글로벌 71% 점유 — HBM + SRAM 스태킹 | HBM4 + 추론칩 SRAM 이중 수요 |
| Marvell | MRVL | $87.67 | TIER 2 | EW+ | SerDes IP + AWS 커스텀 ASIC | 고속 인터커넥트 수요 급증 |
| Amkor | AMKR | $42.99 | TIER 2 | OW | OSAT #2, HDFO 첨단 패키징 램프 | CAPEX $2.5-3.0B, CoWoS 오버플로우 수혜 |
| 삼성전기 | 009150 | — | TIER 2 | OW | AI 서버 MLCC 공급 (랙당 44만개) | MLCC 가격 +30-40% 인상 |
| ISC | 095340 | ₩178,900 | TIER 3 | EW | 반도체 테스트 소켓 | 52주 +357% — 밸류에이션 과열 주의 |
| HPSP | 403870 | ₩46,150 | TIER 2 | OW | 고압수소어닐링 장비 독점 (GAA/2nm) | TSMC A16 + 삼성 2nm GAA 이중 수혜 |
| 리노공업 | 058470 | ₩56,500 | TIER 2 | OW | 프로브카드 — 첨단 노드 테스트 | Q4 영업이익률 47.6%, 3D/SRAM ASP 상승 |
출처: Investing.com, CNBC, TrendForce, 각사 IR — 2026-03-18 기준 | 가격은 가장 최근 거래일 종가
삼성전자는 추론칩 전환에서 가장 다각적인 수혜를 받는 기업입니다. ① Groq 3 LPU 유일한 파운드리(4nm SF4X), ② HBM4E 공급자(GTC 2026에서 7세대 발표), ③ 삼성전기를 통한 MLCC 공급. 이 세 가지 축이 동시에 회전합니다.FACT
젠슨 황이 키노트에서 직접 삼성에 감사를 표했습니다. 삼성파운드리는 Groq 3 웨이퍼 출하량을 연 9,000장에서 15,000장으로 ~70% 증가시키고 있습니다. Ming-Chi Kuo 전망: 2026-2027년 LPU 누적 출하 4-500만 개, 10배 급증.FACT
SK하이닉스가 NVIDIA의 2026년 HBM4 할당의 약 67%를 확보하고 있습니다. 회장이 GTC에서 "AI 웨이퍼 부족이 2030년까지 지속될 수 있다"고 경고했습니다. 2026년 HBM 생산분은 이미 전량 판매 완료. 2025년 연간 영업이익 47.2조원으로 사상 최고를 기록했습니다.FACT
TC(Thermal Compression) Bonder 글로벌 시장점유율 71%로 HBM 스태킹의 핵심 장비입니다. 추론칩 전환에서 새로운 수요가 발생합니다: SRAM 스태킹/3D 다이 스태킹에도 TC Bonder가 필요하기 때문입니다. 다만 현재 주가 ₩311,000은 애널리스트 목표가 ₩187,000을 66% 초과하고 있어 밸류에이션 리스크가 존재합니다.INFERENCE
USD/KRW가 1,489원(2026-03-17)으로 약세를 보이고 있습니다. SK하이닉스와 삼성전자는 제품을 달러로 인보이스하고 원화로 보고하므로, 원화 약세가 보고 영업이익에 8-12% FX 순풍을 제공합니다. 다만 이란 전쟁발 유가 상승이 한국 경상수지를 악화시킬 수 있는 역풍도 존재합니다.INFERENCE
| 리스크 | 확률 | 영향 | 등급 | 설명 |
|---|---|---|---|---|
| 밸류에이션 과열 | M | H | HIGH | 한미반도체 목표가 대비 +66%, ISC +357% YTD — 한국 공급망주 다중 축소 리스크 |
| 수출규제 확대 | M | H | HIGH | BIS가 추론칩(LPU급)까지 수출규제 확대 가능성. NVDA 중국 매출 ~17%($8-12B) 위험 |
| 지정학 리스크 | M | H | HIGH | 대만해협 긴장, 이란 전쟁 유가 $110+, 한국 공급망 집중 리스크 |
| 효율 향상 리스크 | M | M | MED | DeepSeek식 10-20x 효율 향상 → 워크로드당 칩 수요 감소. 에이전틱 AI 확산이 상쇄 여부 불확실 |
| 실행 리스크 | L | H | MED | 삼성 4nm Groq 3 수율, TSMC CoWoS 확장 지연, HBM4 램프 차질 |
| 기술 변화 리스크 | L | H | MED | 포스트-트랜스포머 아키텍처(SSM, 뉴로모픽)가 HBM/CoWoS 요구량을 바꿀 가능성 (3-5년) |
| 고객 집중 리스크 | H | M | HIGH | Top 3 하이퍼스케일러 = NVDA DC 매출 ~65%. 커스텀 실리콘(TPU/Trainium) 수직통합 위협 |
| 매크로/금리 리스크 | L | M | LOW | Fed 3.50-3.75% 동결 장기화 시 반도체 멀티플 압축. 10Y UST 5% 초과 시 밸류에이션 재조정 |
현재 매크로 레짐: Late Expansion + 유가 충격. 미국 GDP 성장률 2026년 2.6% 전망(Goldman Sachs), 이란 전쟁으로 브렌트유 $70→$110+, 가솔린 $3.79/갤런(NPR, 2026-03-16).FACT
Fed 금리: 3.50-3.75% 동결 (2026-03-18 FOMC). 이란 전쟁 이전 2회 인하 전망(6월+9월) → 현재 1회 또는 0회로 축소. CPI 2.4% YoY(2026년 1월). 유가 충격 시 연말 인플레이션 3.0% 전망.FACT
하이퍼스케일러 CAPEX는 금리 둔감. Big Five(MS, GOOG, AMZN, META, ORCL) 2026년 AI 인프라 CAPEX ~$600B (+38% YoY) 확정. NVIDIA에 Blackwell + Vera Rubin 주문 $1조 이상 파이프라인. 이것은 전략적 경쟁 지출이지 경기 민감 투자가 아닙니다.FACT
반도체 사이클: AI 구조적 상승 사이클 중기(Phase 3/5). 2026년 글로벌 반도체 매출 사상 최초 $1조 돌파 전망. SOX -10%는 밸류에이션 조정이지 펀더멘탈 악화가 아닙니다.NARRATIVE
| 시기 | 이벤트 | 영향도 | 태그 |
|---|---|---|---|
| 2026 Q1 | GTC 2026 (진행 중) — Groq 3 LPU 공개, Feynman 프리뷰 | HIGH | FACT |
| 2026 Q2 | Groq 3 LPX 고객 샘플링 시작 | HIGH | FACT |
| 2026 Q2 | Vera Rubin NVL72 고객 출하 개시 | HIGH | FACT |
| 2026 Q2 | 미국 수출규제 추가 검토 (BIS) | HIGH ↓ | NARRATIVE |
| 2026 Q3 | Groq 3 LPX 양산 (삼성 4nm, 15K WPM 목표) | HIGH | FACT |
| 2026 Q3 | AWS Groq 3 LPU 배치 가동 — 하이퍼스케일러 채택 검증 | HIGH | FACT |
| 2026 Q3 | HBM4 램프 — SK하이닉스 / 삼성 / 마이크론 | HIGH | FACT |
| 2026 H2 | SambaNova SN50 RDU 상용 배치 | MED | FACT |
| 2027 | T-glass / 패키징 공급 정상화 (예상) | MED | INFERENCE |
| 2028 | NVIDIA Feynman 양산 — A16, 3D 스태킹, 실리콘 포토닉스 | HIGH | FACT |
| 기업 | 제품 | 아키텍처 | 밸류에이션 | 강점 | 약점 |
|---|---|---|---|---|---|
| NVIDIA+Groq | Groq 3 LPU / LPX | SRAM 기반 결정론적 LPU | $4.42T (공개) | 풀스택 통합 (GPU+LPU+NVLink+CUDA) | 가격 프리미엄, 수출규제 노출 |
| Cerebras | WSE-3 | 웨이퍼 스케일 엔진 | $23B (비공개) | OpenAI $10B+ 계약, 유니크 아키텍처 | 제조 복잡성, 에코시스템 미성숙 |
| SambaNova | SN50 RDU | SRAM+HBM+DRAM 하이브리드 | $5.1B (피크) | 10T+ 파라미터, 5x 속도 주장 | Intel 인수 제안 $1.6B(다운라운드) |
| Tenstorrent | Grayskull/Wormhole | RISC-V 오픈 ISA, 칩렛 | $3.2B (비공개) | Jim Keller 경영, LG/현대/삼성 투자 | 아직 대규모 양산 전 |
| Broadcom | 커스텀 AI ASIC | 하이퍼스케일러 맞춤 설계 | $1.52T (공개) | Google TPU, Meta, ByteDance 다수 고객 | 자체 브랜드 칩 없음, 설계 리드타임 |
| d-Matrix | Corsair | 인메모리 컴퓨팅 | $2B (비공개) | Microsoft 투자, 독자 아키텍처 | 초기 단계, 시장 점유율 미미 |