21. 메모리 계층 구조 (Memory Hierarchy)
1) 한 문장 정의
메모리 계층 구조는 CPU·GPU가 필요로 하는 데이터를 ‘빠르고 비싼 것 → 느리고 싸고 큰 것’ 순서로 배치한 구조예요.
2) 비유로 쉽게 설명
집에서 물건을 꺼내 쓰는 상황을 떠올려보자!
🧠 1) 레지스터(Register) = 바지 주머니
- 손만 넣으면 바로 꺼낼 수 있음
- 가장 빠르고 가장 작음
🧠 2) 캐시(Cache) = 책상 서랍
- 꽤 빠르게 꺼낼 수 있음
- 용량은 조금 더 큼
- L1/L2/L3처럼 여러 층이 있음
🧠 3) DRAM = 방 안 책장
- 방에 가서 꺼내야 해서 조금 느림
- 대신 용량이 훨씬 큼
🧠 4) HBM = 책장이지만 바로 옆 방에 있음
- DRAM보다 훨씬 넓은 통로로 연결되어 빨리 가져올 수 있음
- AI 연산을 위해 특별히 만든 “초고속 책장”
🧠 5) SSD = 창고
- 훨씬 느리지만 저장 용량이 매우 큼
- 오래 보관할 수 있음
📌 즉, 데이터는 가까운 곳일수록 빠르고 비싸고 작다
📌 먼 곳일수록 느리고 싸고 크다
3) 실제 기업·제품 예시
CPU·GPU 속도 예시
- 레지스터 → 나노초(ns) 단위
- 캐시 → 수 ns
- DRAM → 수십~수백 ns
- HBM → DRAM보다 빠름(극단적 병렬 통로 덕분)
- SSD → 마이크로초(µs) 수준
- HDD → 밀리초(ms) 수준(엄청 느림)
실제 제품 안에서
- Apple M3 → L1/L2/L3 캐시 + LPDDR5X 메모리
- NVIDIA H100 → 대규모 캐시 + HBM3
- 스마트폰 → 캐시 + DRAM + UFS SSD
4) 시각적 이미지 설명
머릿속에 “층층 구조”를 떠올려보자:
┌────────┐ 가장 빠르고 작음
│Register│
└────────┘
┌────────┐
│ L1 │
│ Cache │
└────────┘
┌────────┐
│ L2 │
│ Cache │
└────────┘
┌────────┐
│ L3 │
│ Cache │
└────────┘
┌────────┐ 중간 속도, 큰 용량
│ DRAM │
└────────┘
┌────────┐ AI 고속용 특수 메모리
│ HBM │
└────────┘
┌────────┐ 가장 느리고 큼
│ SSD │
└────────┘
위에서 아래로 갈수록:
- 속도 ↓
- 용량 ↑
- 가격 ↓
- 전력 효율 ↓
5) 산업·시장 관점
AI 시대의 핵심은:
👉 “GPU의 연산 속도보다 데이터를 공급하는 속도가 더 중요해졌다.”
그래서 HBM의 가치가 폭발적으로 상승함.
✔ CPU 시대 → 캐시 + DRAM이 중요
✔ AI 시대 → GPU + HBM + 고대역폭 구조가 핵심
기업 관점:
- SK하이닉스·삼성 → HBM 시장 주도
- NVIDIA·AMD·Google TPU → HBM 없으면 성능 절반 이하
- TSMC·삼성 파운드리 → 인터포저·CoWoS 같은 구조 필수
- SSD 기업(삼성, SK, WD) → 저장 공간 확장
6) 초보자 체크 질문
다음 중 가장 빠르지만 용량이 가장 작은 메모리는 무엇일까?
- DRAM
- Register(레지스터)
- SSD
정답 번호만 말해줘!