Training → Inference 패러다임 전환이 반도체 공급망의 BOM을 재편하고 있다. NVIDIA의 $20B Groq 인수, Samsung 4nm LPU 양산, CoWoS 공급 절벽, 그리고 한국 소부장 밸류체인의 수혜 구조를 분석한다.
AI 컴퓨팅 지출은 2026년을 기점으로 Training에서 Inference로 무게중심이 이동한다. FACT 글로벌 AI compute 중 Inference 비중은 2026E 기준 67%로, 단순히 모델을 학습시키는 것이 아니라 실시간으로 추론하는 워크로드가 인프라 투자를 주도하기 시작했다.
이 전환의 물리적 증거가 NVIDIA의 $20B Groq 인수다. FACT Jensen Huang은 GTC 2026 기조연설에서 Groq 3 LPU(500MB SRAM, 150TB/s 내부 대역폭, Samsung 4nm)를 2026 H2에 LPX 랙(256 LPU, 128GB 온칩 SRAM)으로 출시하겠다고 밝혔다. FACT
트레이닝 공급망이 HBM + CoWoS 패키징을 축으로 했다면, 인퍼런스 공급망은 대용량 온칩 SRAM + 삼성 파운드리 + 저전력 SerDes를 축으로 재편되고 있다. INFERENCE 이 BOM 전환은 SK하이닉스(HBM)에서 삼성파운드리(SRAM 내장 SoC)로의 수혜 이동을 의미한다.
| # | 컴포넌트 | 심각도 | 공급 현황 | 수요 압력 | 해소 시점 | 주요 수혜 |
|---|---|---|---|---|---|---|
| 1 | CoWoS 패키징 FACT |
CRITICAL | ~80K WPM (2026E) → 130K 목표 |
~1M WPM 수요 (7.7× 공급 초과) |
2027~2028E | TSMC, Amkor, ASE, SPIL |
| 2 | 고용량 SRAM 다이 INFERENCE |
CRITICAL | SRAM 5~10× 더 많은 다이 면적 소비 |
Groq LPX + 인퍼런스 ASIC 수요 급증 |
2027E (Samsung 증설) | Samsung Foundry, 한미반도체 |
| 3 | HBM4 메모리 FACT |
HIGH | SK Hynix 62% 시장점유 2026 전량 솔드아웃 |
Rubin 플랫폼 + GB300 트레이닝 수요 지속 |
2026 H2 일부 완화 | SK Hynix, 한미반도체 (Tiger TC Bonder) |
| 4 | T-Glass 기판 NARRATIVE |
HIGH | 양산 에코시스템 미성숙 볼륨 생산 2029~2030E |
차세대 시스템온웨이퍼 설계 필수 요소 |
2029~2030E | 대기업 R&D 단계; 아직 투자 기회 제한 |
| 5 | SerDes / Interposer INFERENCE |
HIGH | Broadcom/Marvell 과점; 설계 리드타임 12M+ |
인퍼런스 ASICs 연결 대역폭 폭증 |
2027E | Broadcom, Marvell, Intel (후 SambaNova) |
| 6 | OSAT 후공정 용량 FACT |
MEDIUM | Amkor 180~190K/ SPIL 60~80K 웨이퍼/년 |
TSMC CoWoS 외주 확대 (2026 H2) |
2026 H2 점진 완화 | Amkor, ASE/SPIL, 두산테스나 |
| 7 | 고급 테스트 소켓/장비 INFERENCE |
MEDIUM | 고온·고주파 테스트 특화 설비 부족 |
SRAM 집약 SoC 수율 관리 필요 |
2026~2027E | ISC, 리노공업, 두산테스나 |
| 구분 | 기업/카테고리 | BOM 변화 | 영향 | 근거 | 시그널 |
|---|---|---|---|---|---|
| 🏆 Winner | Samsung Foundry | SRAM-heavy SoC 파운드리 수요 급증. Groq 3 독점 공급 | +++ 강한 수혜 | 9K→15K WPM 램프, NVIDIA의 복귀 고객 | FACT |
| 🏆 Winner | TSMC Advanced Packaging | CoWoS 병목 → 가격 결정력 극대화; CPO(COUPE) 2026 양산 | +++ 구조적 강자 | CoWoS 60% NVIDIA 선점, $50B 패키징 투자 | FACT |
| 🏆 Winner | Broadcom / Marvell | 커스텀 ASIC XPU 수요 폭증. Hyperscaler 내재화 역설적 수혜 | +++ 높은 확신 | Broadcom AI 매출 +106% YoY, $73B 백로그; Marvell +39% QoQ | FACT |
| 🏆 Winner | SK Hynix | HBM3E 여전히 트레이닝 지배; HBM4 Rubin 플랫폼 70% 점유 예상 | ++ 지속 수혜 | 2026 솔드아웃, HBM 매출 ~$8B 연환산 | FACT |
| 🏆 Winner | 한미반도체 (042700) | HBM4 TC Bonder (Tiger) + SRAM 패키징 TC Bonder 수요 동시 수혜 | ++ 이중 수혜 | 글로벌 HBM TC Bonder 71% 점유; SRAM 적층 신수요 | INFERENCE |
| ⚠ Neutral+ | Amkor / ASE / SPIL | TSMC CoWoS 외주 확대 수혜; 독립 패키징 역량 상승 | + 점진 수혜 | 240~270K 웨이퍼/년 외주 확대 2026 H2 | FACT |
| ⚠ Loser | Pure HBM (Samsung Memory) | 인퍼런스 BOM은 HBM 수요 감소 → SRAM 대체 | -- 부분 압박 | Groq 3 LPU = HBM ZERO. 인퍼런스 시장에서 HBM 역할 축소 | INFERENCE |
| ⚠ Loser | Pure GPU Startups (Cerebras 부분) | NVIDIA+Groq 통합 플랫폼의 생태계 잠금 효과로 독립 플레이어 위협 | - 선택적 압박 | Cerebras는 IPO 준비 중, 독자 생존 vs. 인수 갈림길 | NARRATIVE |
| ⚠ Loser | 전통 DDR5 DRAM (범용) | AI 서버용 메모리 예산이 HBM → SRAM으로 이동 시 DDR5 소외 | - 간접 압박 | 인퍼런스 서버 DRAM 탑재량 감소 가능성 | INFERENCE |
한미반도체(042700)는 글로벌 HBM TC Bonder 시장의 71% 점유율을 보유하며, 2026년 SK하이닉스 HBM4용 Tiger 모델(정밀도 +20% 개선)을 공급하고 있다. FACT
인퍼런스 전환에서의 핵심 질문: SRAM 적층형 LPU에도 TC Bonder가 필요한가? INFERENCE 답은 '예'다. Groq 3 LPU의 500MB SRAM은 단일 다이에 내장되지만, 향후 용량 확장(Feynman 2028E 3D 다이 스태킹)은 TC Bonder 유사 장비(Thermocompression Bonding)를 필요로 한다. 또한 삼성 4nm 공정에서 Groq 3를 생산 시 웨이퍼 테스트, 패키징 과정에서 한국 소부장 장비 수요가 발생한다.
현재 수주는 HBM4에 집중되어 있으나, 삼성 파운드리의 Groq 3 램프(9K→15K WPM)가 한미반도체의 후공정 장비 추가 수주로 연결될 가능성이 높다. INFERENCE
리노공업은 2026년 예상 매출 4,506억원(+23% YoY), 영업이익 2,172억원(+25% YoY)으로 컨센서스를 상회하는 성장세가 전망된다. NARRATIVE 온디바이스 AI 확산과 2nm 공정 전환이 Probe Card 단가 상승을 이끄는 구조다. 인퍼런스 칩의 고집적화(SRAM 대면적, 고단 3D)는 웨이퍼 테스트 복잡도를 높여 Probe Card 수요 및 ASP를 동시에 끌어올린다.
ISC의 2026년 매출 2,932억원(+39% YoY), 영업이익 825억원(+45% YoY) 전망. NARRATIVE SRAM 집약 인퍼런스 칩의 수율 관리 필요성 증가 → 고온·고주파 테스트 소켓 수요 증가. 하이퍼스케일러의 커스텀 ASIC 다변화도 ISC의 소켓 교체 사이클을 가속한다.
HPSP는 HBM 고단화(16+ 스택) → 하이브리드 본딩 장비 수요 확대의 수혜자다. NARRATIVE 인퍼런스 전환으로 파운드리(삼성 4nm) 투자가 병행되며, 고압 수소 어닐링 장비 수요가 메모리·파운드리 양방향으로 확산된다. 2026년 파운드리+메모리 동시 투자 사이클이 구조적 성장을 지지한다.
두산테스나는 웨이퍼 테스트(패키징 전 불량 선별) 전문사로, CoWoS 외주 확대 및 삼성 파운드리 Groq 3 램프에 따른 테스트 물량 증가 수혜가 기대된다. INFERENCE 특히 OSAT(Amkor/ASE) 외주 확대가 국내 테스트 업체의 물량 이전으로 연결될 수 있다.
| 플레이어 | 아키텍처 | 핵심 강점 | 약점/리스크 | 2026 포지션 | 시그널 |
|---|---|---|---|---|---|
| NVIDIA + Groq US |
GPU + LPU 듀얼 Vera Rubin + Groq 3 |
생태계(CUDA) + 초저지연 LPU 통합; 92% GPU 시장 점유; $60B 현금 화력 | LPU 통합 실행 리스크; 반독점 심사; 삼성 파운드리 수율 의존성 | 압도적 1위. 인퍼런스-트레이닝 Full Stack 유일무이 | FACT |
| Broadcom US |
커스텀 XPU ASIC (Google TPU, Meta MTIA) |
하이퍼스케일러 전용 최적화; $73B AI 백로그; AI 매출 +106% YoY | 고객 집중도 (Google·Meta 의존); 범용 시장 접근 불가 | 실질적 2위. 하이퍼스케일러 내재화의 핵심 파트너 | FACT |
| Marvell US |
커스텀 ASIC + SerDes (AWS Trainium3) |
SerDes 기술 우위; AWS 파트너십 독점적; 데이터센터 매출 +39% QoQ | AWS 단일 고객 집중 리스크; Broadcom 대비 규모 열세 | 틈새 강자. AWS 생태계에서 방어적 포지션 | FACT |
| Cerebras US |
웨이퍼 스케일 엔진 WSE-3 (wafer-scale) |
초고속 인퍼런스; IBM/DoE 계약; 2025 매출 $1B+; Series H $1B@$23B 밸류 | 비용 구조 불투명; NVIDIA 생태계 대비 소프트웨어 열세; IPO 미완료 | 유망 도전자. 2026 IPO 준비 중. 인수 타겟 될 수도 | NARRATIVE |
| Intel (+ SambaNova) US |
Gaudi 4 + SN50 ASIC (Intel $1.6B 인수) |
SN50: 경쟁사 대비 5× 속도, TCO 3× 개선 주장; 엔터프라이즈 채널 | Intel 실행력 신뢰도 하락; Gaudi 3 실패 전력; 시장 점유 미미 | 와일드카드. SambaNova 통합이 성패를 가른다 | FACT |
| AMD US |
MI350/MI400 CDNA 아키텍처 |
ROCm 생태계 성장; 하이퍼스케일러 대체재로 부상; TSMC N3 확보 | CUDA 대비 소프트웨어 생태계 열세; 인퍼런스 특화 플랫폼 부재 | 유력 2티어. NVIDIA 대안 수요 수혜 | NARRATIVE |
AI 인퍼런스 전환의 최대 수혜자. Google TPU, Meta MTIA, Anthropic 등 하이퍼스케일러가 NVIDIA GPU 의존도를 줄이려 할수록 커스텀 ASIC의 설계·제조 파트너인 Broadcom에 수주가 집중된다. Q1 FY2026 AI 매출 +106% YoY, $73B AI 백로그, 향후 5번째·6번째 고객(OpenAI 유력) 추가가 가시적이다. FACT
CoWoS는 AI 반도체 공급망 전체의 불가역적 병목이다. 수요 1M WPM vs. 공급 130K WPM 목표(7.7× 갭)라는 구조적 공급 부족 속에서 TSMC는 절대적 가격 결정력을 보유한다. FACT 여기에 실리콘 포토닉스(COUPE) CPO 양산, N2 고급 노드 독점 위치까지 더하면 AI 인프라 투자 사이클에서 TSMC는 모든 경로의 수렴점이다. INFERENCE
인퍼런스로의 전환이 HBM 수요를 일부 잠식할 것이라는 우려와 달리, 트레이닝 클러스터(GB300, Vera Rubin)의 HBM4 수요는 2026년 내내 솔드아웃 상태를 유지한다. FACT SK하이닉스는 HBM4 Rubin 플랫폼 공급 점유율 70% 예상, HBM 연 매출 $8B 연환산, 2026 전량 솔드아웃이라는 3중 안전망을 보유한다. 인퍼런스에서 HBM 비중이 낮아지더라도 절대 수요 규모는 트레이닝 사이클이 충분히 보전한다. INFERENCE
HBM4 Tiger TC Bonder(정밀도 +20% 개선) + 삼성 Groq 3 LPU 램프에 따른 SRAM 패키징 장비 수요의 이중 수혜 구조. INFERENCE 글로벌 HBM TC Bonder 71% 점유는 단기 대체 불가능한 구조적 모트(Moat)다. FACT 2026년 SK하이닉스 HBM4 양산 가속 및 Feynman(2028) 3D 스태킹 로드맵이 장비 수요의 3~4년 가시성을 제공한다.
Broadcom과 동일한 커스텀 ASIC 테마이나 AWS 단일 고객 집중이라는 리스크와 SerDes 기술 우위라는 강점이 공존한다. 인퍼런스 칩의 대역폭 병목이 극심해질수록 SerDes IP의 전략적 가치가 상승한다. INFERENCE 데이터센터 매출 +39% QoQ(FY2026 Q3)라는 모멘텀이 확인된 상태. Broadcom 대비 20× 밸류에이션 할인이 기회이자 경고다. FACT
| 티커 | 시장 | 레이팅 | 티어 | 핵심 논거 | 주요 카탈리스트 | 핵심 리스크 |
|---|---|---|---|---|---|---|
| AVGO | US | OW | Tier 1 | $73B AI 백로그, 하이퍼스케일러 ASIC 독점 파트너십 | OpenAI ASIC 수주 공식화 | 고객 집중도 |
| TSM | US | OW | Tier 1 | CoWoS 병목 소유, N2/COUPE CPO 양산 독점 | CoWoS 증설 업데이트 | 지정학 리스크 |
| 000660 | KR | OW | Tier 1 | HBM4 Rubin 70% 점유, 2026 솔드아웃 | HBM4 공급 개시 확인 | Micron 추격 |
| 042700 | KR | OW | Tier 2 | TC Bonder 71% 점유 Moat + SRAM 신규 수요 | Groq 3 LPX 출하, SK하이닉스 수주 | 하이브리드 본딩 대체 |
| MRVL | US | EW+ | Tier 2 | SerDes 기술 우위 + AWS ASIC 파트너십 | AWS Trainium3 출시 타임라인 | AWS 집중도 |