HBF(High Bandwidth Flash)


Executive Summary

HBF(High Bandwidth Flash)는 HBM(High Bandwidth Memory, stacked DRAM)의 ‘대역폭(GB/s)·근접성(near-memory)’은 최대한 유지하면서, HBM이 구조적으로 늘리기 어려운 ‘용량(GB/TB)·비트당 비용(cost/bit)·비휘발성(persistence)’을 NAND(플래시) 기반으로 끌어올리려는 ‘AI 추론(inference) 중심의 신규 메모리 티어’로 정의된다. 최근 Sandisk[1]–SK hynix[2]가 OCP(Open Compute Project) 산하 전담 워크스트림(workstream)을 통해 HBF 표준화를 공식화했고(2026-02-25/26), Sandisk[1]는 1세대 HBF read bandwidth 1.6 TB/s, 16-die stack 기준 512GB 용량, HBM4에 근접한 footprint/power profile/stack height라는 구체 수치를 제시하며(2025-07), 2026년 하반기(first samples)→2027년 초(HBF 탑재 AI-inference 디바이스 샘플)의 상용화 단서를 제공했다(2025-08-06). [3]

투자 관점에서 핵심은 “HBM-only 확장”이 필연적으로 부딪히는 패키징/열/공급 제약(특히 CoWoS류 고급 패키징 병목·장기 예약)과 추론 워크로드의 ‘메모리 용량·TCO·전력 제약’을, 계층형 메모리(hierarchical memory: HBM + HBF)로 해결할 수 있는지 여부다. Samsung Electronics[4]이 2026-02-12 HBM4 양산·출하를 발표하면서도 전력/열 개선(전세대 대비 에너지 효율 +40%, 방열 성능 +30% 등)을 ‘핵심 과제’로 전면에 배치한 점은, HBM 성능이 진화해도 시스템 전력·열이 여전히 1차 제약임을 재확인한다. [5]

Bull/Base/Bear (투자 시나리오)

  • Bull (채택 가속): ① OCP 워크스트림 산출물(초안 spec/interop test/폼팩터 가이드)이 2026년 내 가시화되고, ② 2026H2 샘플이 주요 AI 플랫폼 PoC에서 “성능 저하 제한 + 비용/전력 우위”를 입증하며, ③ 패키징 병목(CoWoS/하이브리드 본딩 등)이 구조적으로 지속될 때. 수혜는 NAND 기반 HBF 원천기술·컨트롤러/캐시·3D 적층/본딩·검사/신뢰성 밸류체인(특히 HBM과 겹치면서도 추가로 생기는 ‘NAND 적층+로직/컨트롤러+검증’ 구간)으로 확장. [6]
  • Base (제한적 채택/니치): ① 표준은 나오되 “on-package(패키지형) 한정” 혹은 “특정 플랫폼 종속”으로 파편화되고, ② 지연시간(latency)·내구성(endurance)·소프트웨어 메모리 티어링 스택이 생각보다 복잡해, RAG/RAM 확장형 추론·대규모 컨텍스트 같은 일부 워크로드에서만 채택. (예: HBF는 ‘HBM 대비 더 높은 latency·더 큰 page size’가 있음을 자체적으로 인정하고 있으며, 대신 시스템 성능이 “여전히 comparable”하다고 주장.) [7]
  • Bear (지연/무산): ① OCP 표준이 늦어지거나 메이저 GPU/ASIC 벤더가 인터페이스·소프트웨어 지원을 미루고, ② HBM4/후속(HBM4E 등)가 용량·전력 효율을 예상보다 빨리 개선하며, ③ CXL 메모리 확장/풀링 또는 NVMe+GPU direct I/O가 “충분히 싸고 빨라서” 대체재가 되는 경우. 특히 OCP의 CXL Tiered Memory Expander 요구사항은 수십~수백 ns급 pin-to-pin latency(캐시 hit 30ns, 압축 블록 250ns 등)와 PCIe Gen6 x16 기준 ~50GB/s/dir급 대역폭 목표를 명시해 ‘DRAM 확장형’의 발전 여지를 보여준다. [8]

Definition and Scope

정의(1문단, 범위 고정): 본 리포트에서 HBF(High Bandwidth Flash)는 HBM(고대역폭 메모리, stacked DRAM)이 제공하는 “패키지 근접 대역폭(on-package bandwidth)”을 최대한 유지하면서도, HBM의 구조적 한계(스택당 용량, 비용/GB, 공급·패키징 병목)를 stacked NAND(3D NAND 적층, wafer bonding/TSV/유사 인터커넥트 + 로직/컨트롤러 보강)로 보완하여 “HBM과 SSD(NVMe) 사이의 메모리 티어(memory tier between HBM and SSD)”를 형성하려는 기술·제품군을 뜻한다. 과 SK hynix[2]는 HBF를 AI 추론 시대(inference era)를 겨냥한 신규 메모리 카테고리이자 HBM–SSD 사이의 새로운 메모리 레이어로 공식 설명한다. [9]

타깃 워크로드(가정 명시): 1차 타깃은 AI 추론(inference)으로 가정한다. 이는 양사가 “training → inference 중심 이동”을 전제로 HBF 표준화·제품을 전개한다고 공식 언급했기 때문이다(단, 장기적으로 training의 일부 단계/데이터셋 캐시로 확장 가능성은 별도 열어둠). [10]

폼팩터/인터페이스(열린 가정): 공개 자료 기준 HBF는 (a) HBM과 유사한 패키지형(on-package) 접근(“HBM4와 유사한 footprint/power profile/stack height”)과 (b) 모듈형/PCIe 계열 접근(예: Kioxia[11]의 PCIe 6.0 기반 ‘high-bandwidth flash memory module’ 프로토타입) 모두가 현실적 후보로 노출되어 있다. 따라서 본 리포트에서는 패키지형/모듈형/PCIe·CXL 연계 가능성을 열린 형태로 취급한다. [12]

경쟁/대체재(명시): HBM 확장(HBM3E/HBM4/후속), DDR5/DDR6, CXL 메모리 확장/풀링, NVMe/SSD(및 GPU Direct I/O), near-memory 계열(컴퓨팅 메모리/컴프레션/캐시/프리패치), 그리고 “HBM4급 성능을 더 싼 패키지로”라는 변형 표준(SPHBM류) 등. 특히 OCP의 CXL Tiered Memory Expander 요구사항은 ‘저비용 DRAM 확장’의 시스템 대안을 구체화한다. [13]

용어 혼용/표준화 여부(점검): “High Bandwidth Flash”는 일반 명사형 표현으로 과거에도 쓰일 수 있으나, 시장에서 투자 논지로 회자되는 HBF는 Sandisk[1]가 HBF™(상표)로 제시하고 SK hynix[2]가 공동 표준화를 추진하는 ‘신규 메모리 카테고리’를 가리키는 경우가 많다. 2025-08-06 MOU에서 “HBF 기술 스펙(specification) 표준화”를 명시했고, 2026-02-25/26에는 OCP 산하 워크스트림을 공식화해 “표준화 진행 중(미완)” 상태로 보는 게 합리적이다. [14]

Structural Rationale

HBM의 병목이 ‘왜 구조적으로 남는가’

  1. 용량 한계(스택·패키지 제약): HBM은 스택 적층을 통해 용량을 늘리지만, z-height·열·수율·패키징 난이도가 따라 올라간다. Micron Technology[15]은 HBM3E 기준 24GB(8-high)·36GB(12-high)와 >1.2 TB/s를 제시한다. [16] 반면 Sandisk[1] HBF 자료는 동일 GPU footprint에서 HBM-only 192GB 대비, HBF 혼합 3,120GB(≈3.12TB) 또는 HBF-only 4,096GB(≈4TB) 같은 “스케일 갭”을 강조한다. [17]
  2. 전력/열(thermal) 제약: HBM 세대가 올라가면서 I/O·대역폭이 증가하는 동시에 열이 시스템 한계로 부각된다. IEEE[18] IEDM 2023 SK hynix[2] 발표는 HBM 세대에서 대역폭 증가가 전력 증가를 동반하고, stacking으로 열 관리 난이도가 커지며, DRAM은 온도 상승 시 refresh 제약 등으로 효율이 하락할 수 있음을 설명한다. [19] 2026-02-12 Samsung Electronics[4]의 HBM4 양산 발표도 전력/열을 정면 이슈로 다루며, HBM3E 대비 에너지 효율 +40%, 열저항 +10%, 방열 +30% 등 개선치를 공개했다. [5]
  3. 공급 제약(패키징 병목·리드타임): HBM은 단순 DRAM 웨이퍼가 아니라 2.5D/3D 패키징(예: CoWoS)과 테스트/본딩 공정에 의해 출하가 제한된다. 2025-12-04 공개된 업계 병목 분석에서는 TSMC[20]의 “CoWoS capacity sold out through 2025 and into 2026”라는 CEO 발언을 인용하며, CoWoS가 2026년 중반까지 구조적 병목으로 남는다는 점을 강조한다. [21]

왜 ‘추론’에서 용량·전력·TCO가 더 중요해지나

  • Sandisk[1]는 2026-02-25 공식 발표에서 추론은 수백만 디바이스에서 ‘연속적으로 실행(continuously runs)’되고, 대역폭·용량을 동시에 요구하며, 전력 제약(power constrained)이 점점 커진다고 설명한다. [22]
  • “AI inference factory” 관점의 시스템 스펙 역시 전력/공간 제약을 보여준다. 예컨대 NVIDIA[23]의 DGX B200은 8 GPU 총 1,440GB HBM3E·64 TB/s HBM 대역폭을 제공하지만, 시스템 최대 전력 ~14.3kW임을 명시한다(즉, 메모리·인터커넥트가 커질수록 전력·냉각이 1차 KPI가 됨). [24]

“HBM-only 확장” vs “계층형(HBM + HBF)”

  • HBM-only: 대역폭/지연시간 최적이지만, (a) 스택당 용량 증가가 패키징·열·수율을 빠르게 악화시키고, (b) 공급 제약이 가장 먼저 걸린다. [25]
  • HBM + HBF: SK hynix[2]는 2025-10-26 자료에서 HBF는 HBM의 stacking 구조와 NAND의 고밀도·비용 효율을 결합하며, HBM과 함께 배치(co-deployment)해 시스템 용량을 확장하는 전략을 검토 중이라고 직접 언급한다. [26] 다만 HBF는 NAND 기반이므로, latency·page size·내구성/신뢰성·소프트웨어 티어링이 성패를 좌우한다(이에 대한 위험은 후술). [27]

Tech and Architecture Deep Dive

HBF 구현을 ‘모듈’로 분해

(1) NAND 스택 + 웨이퍼 본딩(wafer bonding) + 인터커넥트(예: TSV/hybrid bonding)

  • Sandisk[1]의 HBF는 BiCS 기반 NAND와 CBA(CMOS directly Bonded to Array) 웨이퍼 본딩을 핵심 기반으로 제시한다. [28]
  • 16-die stacking을 위해 die warpage/스트레스 저감·열전도 개선 같은 패키징 테크를 강조하며(“Advanced die stacking”), 이는 HBM이 직면한 스택 고도화 딜레마(열/수율)와 동일한 전장(frontier)임을 시사한다. [29]
  • 인터커넥트 관점에서, HBM은 TSV+micro-bump 구조가 일반적이며(IEEE[18] IEDM 2023 발표), 세대가 올라갈수록 hybrid bonding이 유력한 길로 제시된다. [19] HBF가 “HBM4에 가까운 형태”를 지향한다는 점은 결국 유사한 적층·본딩 생태계를 공유할 가능성이 높다. [30]

(2) 컨트롤러/캐시/프리패치로 latency 보완

  • NAND 기반 메모리는 DRAM 대비 본질적으로 latency가 크다. Sandisk[1]도 HBF가 HBM 대비 더 높은 latency와 더 큰 page size를 갖는다고 명시하면서도, “시스템 수준 성능은 still comparable”하다고 주장한다(LLM inference 시뮬레이션 기반). [31]
  • 모듈형 접근의 구체 사례로, Kioxia[11]는 2025-08-20 5TB·64GB/s의 high-bandwidth flash memory module 프로토타입을 발표하며, prefetch 기술을 컨트롤러에 구현하고 PCIe 6.0(8 lanes) 호스트 인터페이스 + 128Gbps PAM4 트랜시버 등을 통해 대역폭을 확보했다고 설명한다. 또한 전력 <40W를 제시해 “대역폭/전력” 트레이드오프를 정량으로 공개했다. [32]

(3) HBM과의 동시 탑재(계층형) 시 시스템 변화

  • SK hynix[2]는 2025-10-26에 HBM과 함께 배치해 시스템 메모리 용량 격차를 메우는 시나리오를 언급한다. [26]
  • Sandisk[1]는 “HBF는 AI inference를 위해 설계된 새 메모리 카테고리”이며 persistence와 thermal stability를 제공한다고 강조한다. 즉, 계층형 구조에서 HBF는 ‘대용량·저비용·비휘발성’의 “중간 계층”로 설계될 가능성이 크다. [33]

성능 지표 요약 테이블(공개 수치 중심, 범위/근거 포함)

프로토타입/데모 근거: Sandisk[1] HBF는 2025 Future Memory and Storage[42]에서 “Most Innovative Technology(제품: High Bandwidth Flash)”로 수상 기록이 남아 있으며, Sandisk[1]는 이를 공식 보도자료에서 인용한다. [43]

Standardization and Ecosystem

표준화(“될 놈이냐”)를 가르는 포인트

  • 2026-02-25/26 Sandisk[1]–SK hynix[2]는 OCP 산하 전담 워크스트림을 만들어 HBF 표준화를 추진한다고 공식 발표했다. [44]
  • 2025-08-06 양사는 MOU에서 “HBF specification을 표준화하고, 기술 요구사항(technology requirements)을 정의하며, 생태계 구축을 탐색”한다고 명시했다. [45]
  • 또한 Sandisk[1]는 Technical Advisory Board(자문위) 구성을 공개해, 단순 제품 출시가 아니라 “표준 기반 생태계(standards-driven ecosystem)”를 전제로 움직이고 있음을 시사한다. [45]

무엇을 “표준화”하려는가(공개 근거 + 합리적 범위)

공식 문구에서 직접 확인되는 범위는 (a) specification 자체, (b) 기술 요구사항 정의, (c) 생태계 조성이다. [46]

여기에 투자 분석 관점에서 “표준화가 실제로 필요해지는 항목”은 다음으로 정리된다(※ 아래는 공개 문구 + 데이터센터 표준화 관행에 따른 분석적 귀결이며, 세부 항목/수치가 공개되면 즉시 업데이트가 필요).

  • 폼팩터/기구(mechanical) 표준: HBF가 “HBM4와 유사한 footprint·stack height”를 지향한다면, 패키징 호환성·장착 규격이 PoC 확산에 핵심이 된다. [39]
  • 전기적 인터페이스/프로토콜: on-package형이면 HBM 유사 인터커넥트(혹은 변형)가, 모듈형이면 PCIe/CXL 계열의 전기/프로토콜 적합성이 쟁점이 된다. [47]
  • 검증/호환성(interop)·신뢰성(RAS) 가이드: NAND 기반이면서 “memory tier”로 쓰이려면 endurance/thermal 안정성/오류관리·리던던시가 필수. Sandisk[1]는 thermal stability, redundancy management를 강조한다. [48]

표준화 실패(파편화) 시나리오

  • 각자도생(플랫폼 종속): GPU/ASIC별 전용 방식으로 굳으면, 고객은 멀티벤더 조달이 어려워지고 채택이 ‘몇몇 생태계’에 한정된다(총주소시장(TAM) 축소). [49]
  • 검증 지연 → TCO 경쟁력 상실: 추론은 전력·지연시간 변동(jitter)에 민감하다. 표준 부재로 검증/운영 리스크가 커지면, CXL/NVMe+GPU direct 같은 대체재로 설계가 이동할 수 있다. [50]

Value Chain and Winner Map

아래 표는 “HBF가 성립할 때 가치가 어디에 쌓이는가”를 기업/밸류체인 단위로 정리한 것이다. (표의 “체크포인트”는 12~24개월 내 관찰 가능한 지표 위주)

NAND 수요/ASP/믹스 영향(정량적 ‘스케일 감’)

  • Sandisk[1] HBF Gen1이 512GB/stack을 목표로 하고, “HBM 대비 8~16x 용량”을 주장한다. [27]
  • 단순 산술로 “GPU당 추가 2~4TB급 중간 티어”를 HBF로 채우는 설계가 표준이 되면, 메모리 BOM에서 ‘NAND bit 비중’이 DRAM bit보다 빠르게 증가할 수 있다(이는 NAND 업황(비트 수요/고부가 믹스) 탄력의 잠재 촉매). 단, 이 전제는 (a) latency 허용 가능한 추론 워크로드 비중, (b) 컨트롤러/티어링 SW 성숙도, (c) 표준화 속도에 민감하다. [64]

Economics and TCO Model

아래는 “기관투자자 관점의 방향성 판단”을 위한 간이 TCO 모델이다. 핵심은 절대값보다 민감도(어떤 조건에서 결론이 뒤집히는가)다.

입력 가정(공개 수치 + 합리적 파라미터)

  • HBM 대역폭/용량: HBM3E 스택(placement) 기준 >1.2 TB/s, 36GB(12-high)(Micron 공개). [34]
  • HBF(패키지형) 대역폭/용량: Gen1 read 1.6 TB/s, 512GB/stack(16 die)(Sandisk 공개). [39]
  • HBF(모듈형) 대역폭/전력: 64GB/s, <40W(Kioxia 공개). [32]
  • HBM 가격 프리미엄(지표형): TrendForce는 “HBM3e 가격이 과거 서버 DDR5 대비 45배였으나 2026년 말 12배로 축소될 수 있다”고 언급(즉, 가격 격차는 사이클/공급에 따라 변동). [35]
  • NVMe/스토리지 경로의 병목 완화 가능성: NVIDIA[23]는 GPUDirect Storage가 CPU bounce buffer를 제거해 대역폭 향상·지연시간 감소·CPU 부하 감소를 제공한다고 명시(즉 “SSD라도 경로 최적화로 시스템 레벨 성능을 끌어올릴 수 있음”). [65]

비교 대상 3가지 구조

  • A) HBM-only 확장: 목표 용량을 HBM으로만 충당
  • B) 계층형(HBM + HBF): hot tier(HBM) + warm tier(HBF)로 모델/캐시를 분할
  • C) SSD/NVMe 또는 CXL 확장: cheap tier를 NVMe 또는 CXL 메모리 확장으로 해결

산식(간이)

  • 유효 추론 처리량(Throughput) ≈ min(Compute, Memory BW × 활용률, I/O BW × 활용률)
  • 전력당 성능(Watt-efficiency) = Throughput / Power
  • 비용당 성능(Cost-efficiency) = Throughput / (Capex + 3년 Opex)
  • 메모리 계층 비용 = (HBM_GB × /GBHBM)+(HBFGB×/GB_HBM) + (HBF_GB × /GB_HBF) + (NVMe_GB × $/GB_NVMe)
  • 핵심 민감도 변수:
    1. HBF latency가 시스템 throughput에 주는 페널티(“HBF는 HBM보다 latency↑/page size↑”를 이미 인정) [31]
    2. HBF /GBHBM대비얼마나낮아지는지(similarcost8 16x용량”주장사실이면/GB가 HBM 대비 얼마나 낮아지는지(“similar cost로 8~16x 용량” 주장 → 사실이면 /GB는 구조적으로 크게 낮음) [40]
    3. 채택 형태가 on-package인지(대역폭↑) vs PCIe 모듈인지(대역폭↓) [66]
    4. CXL 확장기의 latency/bandwidth가 워크로드 요구를 만족하는지(OCP 스펙의 목표치) [67]

정성적 결과(현 시점의 ‘가장 가능성 높은’ 결론)

  • A) HBM-only는 “성능”은 최강이지만, 용량 확장 비용·공급 제약·열이 기하급수적으로 악화된다(특히 inference에서 ‘TB급 모델 상주시’가 커질수록). [68]
  • B) HBM + HBF는 HBF가 “HBM급 대역폭에 가까운 중간 티어”로 기능할 때(패키지형) TCO 최적점이 생긴다. Sandisk 수치(1.6TB/s·512GB/stack)만 놓고 보면 “대역폭은 HBM3E급, 용량은 HBM 대비 압도적”인 조합을 지향한다. [69]
  • C) NVMe/CXL 확장은 비용/GB는 가장 유리하나, 경로·latency가 추론 SLA에 영향을 줄 수 있다. 다만 GPUDirect Storage, CXL 캐시/압축이 발전하면 “주요 모델/캐시 일부를 외부로 빼는 설계”가 점점 실용화될 수 있다. [50]

민감도(결론이 바뀌는 조건)

  • HBF latency 페널티가 큰 워크로드(작은 랜덤 접근 위주)에서는 B가 불리해지고, CXL(수백 ns급)이나 HBM 증설로 회귀할 가능성이 커진다. [70]
  • HBF가 실제로 ‘HBM과 유사 cost’가 아니라 더 비싸지거나, 패키징 비용이 과도하면 B의 경제성 우위가 약해진다(특히 on-package형은 패키징 CAPEX/수율이 중요). [71]
  • CoWoS/패키징 병목이 완화되고 HBM 공급이 충분해지면, 단기적으로는 HBM-only가 더 매력적일 수 있다. 반대로 병목이 지속될수록 계층형 설계의 가치가 커진다. [72]

Timeline, Risks, and Conclusion

Timeline & Catalysts (12–24개월 캘린더; 2026-03~2028-02 관점)

전제: HBF(High Bandwidth Flash)는 “HBM이 맡던 대역폭/병렬성 요구를 NAND 계열(Flash)에서 ‘패키징·인터포저·컨트롤러·프로토콜’로 끌어올려” 특정 워크로드(예: 대용량 모델의 체크포인트/리트리벌/오프로딩/스트리밍 데이터 파이프라인)에서 메모리 계층의 비용–성능 트레이드오프를 재정의하려는 시도로 가정합니다.
따라서 촉매는 “기술 데모 → 레퍼런스 디자인 → 고객 PoC → 양산 스펙 확정 → 공급망 확장” 순서로 나타나는 게 자연스럽습니다.

2026-03 ~ 2026-08 (H1~H2’26: 컨셉 검증 → 에코시스템 신호 확인)

  • C1. 공개 데모/프로토타입 업데이트
    • 컨퍼런스/기술 블로그/파트너 발표에서 “대역폭 수치 + 전력/W + 지연시간 + 내구성(TBW)”가 구체화되는지 확인
  • C2. 컨트롤러/프로토콜 방향성 정리
    • PCIe/NVMe 확장인지, 별도 링크/프로토콜인지, 또는 CXL 계층과의 관계(호환/대체/보완)가 명확해지는 시점
  • C3. 패키징 구조(2.5D/3D) 및 인터포저/브릿지 선택
    • 실리콘 인터포저 vs 브릿지 vs 유기 기판 기반 고밀도 배선 등 “비용 구조”가 드러나는 구간
  • C4. 공급망 파트너링의 첫 윤곽
    • NAND 공급사, 컨트롤러/PHY, 패키징(OSAT), 기판/인터포저, 테스트 장비/방법론 등 밸류체인 연합이 보이면 신뢰도 상승

2026-09 ~ 2027-02 (H2’26~H1’27: 레퍼런스 디자인/PoC 가시화)

  • C5. 레퍼런스 디자인(보드/모듈/서버) 공개
    • “어떤 슬롯/폼팩터에 꽂히는가?”가 핵심:
      • 표준 폼팩터(예: 카드/모듈)로 갈수록 TAM 확대 가능
      • 특수 폼팩터일수록 초기 채택은 쉬워도 확산은 느릴 수 있음
  • C6. 초기 고객 PoC(클라우드/AI 인프라) 신호
    • 고객사 실명 공개가 어려워도, “Top-3 CSP/AI 인프라 플레이어와 PoC 진행” 같은 간접 신호가 중요
  • C7. 성능–비용의 ‘말이 되는’ 구간 제시
    • HBM 대비 “/GB,/GB, /GB/s, W/GB/s”에서 어디에 위치하는지
    • 단순 대역폭 말고 실효 대역폭(워크로드 기준) 자료가 나오면 가산점

2027-03 ~ 2027-08 (H1~H2’27: 제품화/스펙 고정, 초기 양산 준비)

  • C8. 스펙 고정(빌오브머티리얼/수율의 현실화)
    • 이때부터는 “기술이 되는가”보다 “원가가 되는가(수율/공정)”가 핵심
  • C9. 테스트/리페어/번인(신뢰성) 체계 확립
    • NAND 기반이더라도 고대역·고병렬 패키지는 테스트 복잡도가 급증
    • “테스트 시간/비용”이 원가의 숨은 킬러가 될 수 있음
  • C10. 1세대 제품 포지셔닝 확정
    • (예) “HBM 대체”가 아니라 “HBM 보완(오프로딩/캐시 확장/쿨 티어)”로 포지션 잡을 가능성

2027-09 ~ 2028-02 (H2’27~H1’28: 초기 출하/채택의 분기점)

  • C11. 제한적 출하(리미티드 런) 또는 특정 고객향 런치
    • “출하” 자체보다 리오더/확장 주문이 더 중요
  • C12. 2세대 로드맵 제시(대역폭 확장, 전력 개선, 용량 확장)
    • 1세대 한계가 명확해질 시기라, 2세대 계획이 신뢰를 좌우
  • C13. 밸류체인 수혜/피해 구도 선명화
    • 채택 시 OSAT/기판/테스트 장비/컨트롤러/PHY에 주문이 실리기 시작
    • 반대로 NAND 공급은 “용량”보다 특정 다이/스택 구성의 공급 제약이 생길 수 있음

Risk Register (투자용)

리스크내용(핵심)발생 가능성영향도체크 포인트(관찰 지표)대응/완화(투자 관점)
기술 성능 미달이론 대역폭 대비 실효 대역폭/지연시간이 기대 미달워크로드 벤치마크(실서비스 유사), 지연시간 분포(p99) 공개 여부“HBM 대체” 가정 제거, 보완재 시나리오로 밸류에이션 재설정
전력/열/신뢰성고대역 I/O로 전력 급증·열 밀도 증가, 플래시 내구성(TBW) 이슈중~상W/GB/s, 열 설계(히트스프레더/액티브 쿨링), TBW·오류율열/전력 한계가 보이면 폼팩터/시장 축소 반영
원가/수율(패키징)인터포저/미세배선/3D 적층 수율로 COGS 폭증수율·테스트 시간, 패키징 파트너 확대/변경, 공정 단순화수율 리스크 큰 구간에서는 공급망(기판/OSAT/테스트) 위주로 접근
테스트/검증 비용고병렬 패키지로 테스트 시간이 길어져 원가·리드타임 상승중~상ATE 시간, 번인/리페어 공정, 고객 인증(Qual) 기간테스트 장비/방법론 업체 수혜 가능성 점검
표준/에코시스템 실패표준화/호환성 부족으로 특정 벤더 종속 → 채택 제한컨소시엄/표준 논의, 레퍼런스 디자인 공개, 파트너 수 증가표준 신호 약하면 TAM 보수적으로, 단일 고객 의존도 디스카운트
경쟁 기술의 압도적 개선HBM, CXL 메모리, NVMe SSD/스토리지 계층이 예상보다 빠르게 개선중~상HBM 세대 전환 속도, CXL Type-3 채택, SSD 대역폭/지연 개선“HBF 고유의 킬러워크로드”가 없으면 채택 논리 약화
공급 제약(특정 다이/공정)NAND는 plentiful해 보여도, HBF에 필요한 특정 다이/스택은 병목 가능특정 공정 노드, 스택 구성 수율, 공급사 다변화공급사 다변화 여부를 가장 빠른 리스크 필터로 사용
고객 집중/PoC 실패PoC가 한두 고객에서만 맴돌고 확산 실패중~상Top 고객의 리오더/확장, 2~3번째 고객 확보, 양산 일정초기엔 옵셔널리티로만 반영(가치 제한), 확산 확인 후 재평가
규제/수출통제AI 서버/메모리/인터커넥트 관련 규제 강화로 수요 왜곡수출통제 업데이트, 고객 지역 믹스 변화지역/고객 믹스 분산 기업 우선
커머셜 모델 불확실가격 책정(예: $/GB/s)·마진 구조가 불투명ASP 공개, BOM 추정 가능성, 유사 제품 대비 마진“마진이 난다”가 아니라 마진이 날 구조인지(수율/테스트/ASP)로 판단

결론: “HBM 다음이 HBF인가?” (조건부 답)

  • (A 조건이면) HBF 급성장: ① 2026H2 샘플이 예정대로 출하되고, ② 2027초 ‘HBF 탑재 AI-inference 디바이스 샘플’이 실제로 등장하며, ③ OCP 표준화가 인터페이스/검증/호환성까지 확장되고, ④ HBM 패키징 병목이 2026~2027에도 구조적으로 지속될 때. [77]
  • (B 조건이면) 제한적 니치: ① 표준화는 진행되지만 플랫폼별 구현이 달라 파편화되고, ② latency 페널티를 감당할 수 있는 특정 추론 워크로드(예: 대규모 모델 상주·RAG/캐시 구조 최적화)에서만 경제성이 입증될 때. [70]
  • (C 조건이면) 무산/지연: ① 수율/패키징 난제(16-die stacking, 본딩/검사)가 장기화되고, ② HBM4/후속이 용량·전력 효율을 예상보다 빠르게 끌어올리며, ③ CXL 확장/GPUDirect 기반 NVMe 경로가 “충분히 빠르고 싸게” 자리 잡을 때. [78]

투자자로서 지금 체크해야 할 10가지 질문

  1. OCP HBF 워크스트림의 첫 산출물(초안 spec/interop 계획)은 2026년 어느 시점에 나오는가? [22]
  2. 2026H2 “first samples”가 실제 실리콘/패키지 샘플인가, 아니면 기능 데모/에뮬레이션인가? [45]
  3. HBF Gen1의 1.6TB/s는 read-only인지, mixed workload에서도 유지되는지? [31]
  4. “HBM 대비 higher latency/large page size”가 TTFT/꼬리 지연(tail latency)·SLA에 미치는 영향은? [31]
  5. HBF가 주장하는 “HBM과 유사 cost”가 패키징 포함 system BOM 관점인지, 메모리 die 관점인지? [40]
  6. GPU/ASIC 벤더가 메모리 컨트롤러/런타임/컴파일러 레벨에서 HBF tier를 지원할 것인가? (지원 방식은?) [22]
  7. HBF의 endurance·RAS 요구사항은 데이터센터 운영(24/7 inference) 기준을 만족하는가? [48]
  8. CoWoS/고급 패키징 공급 제약이 2026~2027에 얼마나 완화되는가(혹은 더 악화되는가)? [72]
  9. CXL 확장(수십~수백 ns)과 비교해 HBF가 제공하는 “대역폭/용량/전력의 우위가 명확한 구간”은 어디인가? [79]
  10. HBF가 성공했을 때 밸류체인의 “승자”는 NAND 공급자인가, 패키징/본딩 장비인가, 컨트롤러/소프트웨어 스택인가—그리고 그 분배는 어떤 구조가 되는가? [80]

출처

[1] [4] [24] https://www.nvidia.com/en-us/data-center/dgx-b200/ https://www.nvidia.com/en-us/data-center/dgx-b200/ [2] [3] [6] [14] [18] [20] [40] [45] [46] [62] [71] [76] [77] https://www.sandisk.com/company/newsroom/press-releases/2025/2025-08-06-sandisk-to-collaborate-with-sk-hynix-to-drive-standardization-of-high-bandwidth-flash-memory-technology https://www.sandisk.com/company/newsroom/press-releases/2025/2025-08-06-sandisk-to-collaborate-with-sk-hynix-to-drive-standardization-of-high-bandwidth-flash-memory-technology [5] [36] [53] [75] [78] https://news.samsung.com/global/samsung-ships-industry-first-commercial-hbm4-with-ultimate-performance-for-ai-computing https://news.samsung.com/global/samsung-ships-industry-first-commercial-hbm4-with-ultimate-performance-for-ai-computing [7] [12] [17] [27] [28] [29] [30] [31] [39] [41] [48] [54] [55] [64] [69] [70] https://documents.sandisk.com/content/dam/asset-library/en_us/assets/public/sandisk/collateral/company/Sandisk-HBF-Fact-Sheet.pdf https://documents.sandisk.com/content/dam/asset-library/en_us/assets/public/sandisk/collateral/company/Sandisk-HBF-Fact-Sheet.pdf [8] [13] [67] [79] https://www.opencompute.org/documents/hyperscale-tiered-memory-expander-specification-for-compute-express-link-cxl-1-pdf https://www.opencompute.org/documents/hyperscale-tiered-memory-expander-specification-for-compute-express-link-cxl-1-pdf [9] [10] [22] [33] [44] [49] [57] [59] [61] [63] https://www.sandisk.com/company/newsroom/press-releases/2026/2026-02-25-sandisk-and-sk-hynix-begin-global-standardization-of-next-generation-memory-solution-high-bandwidth-flash-hbf https://www.sandisk.com/company/newsroom/press-releases/2026/2026-02-25-sandisk-and-sk-hynix-begin-global-standardization-of-next-generation-memory-solution-high-bandwidth-flash-hbf [11] [23] [35] https://www.trendforce.com/presscenter/news/20251218-12843.html https://www.trendforce.com/presscenter/news/20251218-12843.html [15] [58] https://www.reuters.com/markets/deals/applied-materials-buys-9-stake-advanced-packaging-firm-besi-2025-04-15/ https://www.reuters.com/markets/deals/applied-materials-buys-9-stake-advanced-packaging-firm-besi-2025-04-15/ [16] [34] [52] https://www.micron.com/products/memory/hbm/hbm3e https://www.micron.com/products/memory/hbm/hbm3e [19] https://iedm23.mapyourshow.com/mys_shared/iedm23/handouts/15-6_Tue_14482.pdf https://iedm23.mapyourshow.com/mys_shared/iedm23/handouts/15-6_Tue_14482.pdf [21] [25] [38] [68] [72] https://www.fusionww.com/insights/blog/inside-the-ai-bottleneck-cowos-hbm-and-2-3nm-capacity-constraints-through-2027 https://www.fusionww.com/insights/blog/inside-the-ai-bottleneck-cowos-hbm-and-2-3nm-capacity-constraints-through-2027 [26] [51] https://news.skhynix.com/sk-hynix-presents-next-generation-nand-storage-product-strategy-at-ocp-2025/ https://news.skhynix.com/sk-hynix-presents-next-generation-nand-storage-product-strategy-at-ocp-2025/ [32] [47] [66] Kioxia Achieves Successful Prototyping of 5TB Large-Capacity and 64GB/s High-Bandwidth Flash Memory Module | KIOXIA - Asia Pacific (English) https://apac.kioxia.com/en-apac/about/news/2025/20250820-1.html [37] https://news.skhynix.com/sk-hynix-ships-world-first-12-layer-hbm4-samples-to-customers/ https://news.skhynix.com/sk-hynix-ships-world-first-12-layer-hbm4-samples-to-customers/ [42] [56] [74] [80] https://www.appliedmaterials.com/content/dam/site/prod-tech/semi/doc/hybrid_bonding_scalev4.pdf.coredownload.inline.pdf https://www.appliedmaterials.com/content/dam/site/prod-tech/semi/doc/hybrid_bonding_scalev4.pdf.coredownload.inline.pdf [43] https://futurememorystorage.com/news/press-releases/download/114/FMS%202025%20Best%20of%20Show_FINAL.pdf https://futurememorystorage.com/news/press-releases/download/114/FMS%202025%20Best%20of%20Show_FINAL.pdf [50] [65] https://docs.nvidia.com/gpudirect-storage/pdf/design-guide.pdf https://docs.nvidia.com/gpudirect-storage/pdf/design-guide.pdf [60] https://www.evgroup.com/company/news/detail/ev-group-achieves-breakthrough-in-hybrid-bonding-overlay-control-for-chiplet-integration https://www.evgroup.com/company/news/detail/ev-group-achieves-breakthrough-in-hybrid-bonding-overlay-control-for-chiplet-integration [73] [News] SK hynix & Sandisk Kick Off Global Standardization … https://www.trendforce.com/news/2026/02/26/news-sk-hynix-sandisk-kick-off-global-standardization-of-hbf-market-set-to-surge-by-2030/?utm_source=chatgpt.com