HCI Infrastructure
컴퓨팅, 스토리지, 네트워킹을 하나로 통합한 인프라.
🎯 HCI란?
HCI (Hyper-Converged Infrastructure): 컴퓨팅, 스토리지, 네트워킹, 가상화를 단일 x86 노드에 통합하고, 소프트웨어로 관리하는 인프라 아키텍처
핵심 특징:
- 컴퓨팅 + 스토리지가 같은 노드에 통합
- 소프트웨어 정의 스토리지 (SDS)
- Scale-out 확장 방식
- 단일 관리 인터페이스
🏗️ 인프라 아키텍처 비교
전통적 3-Tier
서버, 네트워크, 스토리지가 분리된 구조임.
특징:
| 항목 | 설명 |
|---|---|
| 구성 | 서버 + FC/iSCSI 스위치 + SAN 스토리지 |
| 확장 | 계층별 개별 확장 (Scale-up) |
| 관리 | 각 벤더별 관리 도구 |
| 전문성 | 서버/스토리지/네트워크 전문가 필요 |
Converged Infrastructure (CI)
3-Tier 구성요소를 사전 검증/통합한 패키지임.
예시: VCE Vblock, FlexPod, HPE SimpliVity (초기)
특징:
- 구성요소는 여전히 분리
- 검증된 조합으로 패키징
- 단일 벤더 지원
Hyper-Converged Infrastructure (HCI)
컴퓨팅과 스토리지를 노드에 완전 통합한 구조임.
특징:
| 항목 | 설명 |
|---|---|
| 구성 | x86 노드 (서버 + 로컬 디스크) |
| 스토리지 | SDS가 로컬 디스크를 분산 풀로 통합 |
| 확장 | 노드 추가 (Scale-out) |
| 관리 | 단일 관리 인터페이스 |
3-Tier vs CI vs HCI 비교
| 항목 | 3-Tier | CI | HCI |
|---|---|---|---|
| 통합도 | 분리 | 패키징 | 완전 통합 |
| 스토리지 | 외장 SAN | 외장 SAN | 분산 SDS |
| 확장 방식 | Scale-up | Scale-up | Scale-out |
| 관리 복잡도 | 높음 | 중간 | 낮음 |
| 초기 비용 | 높음 | 중간 | 낮음~중간 |
| 유연성 | 높음 | 중간 | 중간 |
| 전문성 요구 | 높음 | 중간 | 낮음 |
| 적합 규모 | 대규모 | 중대규모 | 중소규모 |
📦 HCI 아키텍처 상세
노드 구성
일반적인 노드 스펙:
| 구성요소 | 사양 |
|---|---|
| CPU | 듀얼 소켓, Intel Xeon / AMD EPYC |
| Memory | 256GB ~ 1TB+ |
| Cache Tier | NVMe SSD (성능 계층) |
| Capacity Tier | SATA SSD 또는 HDD |
| Network | 10GbE / 25GbE (2~4포트) |
소프트웨어 정의 스토리지 (SDS)
각 노드의 로컬 디스크를 묶어 분산 스토리지 풀 생성함.
SDS 핵심 기능:
| 기능 | 설명 |
|---|---|
| Replication | 데이터 복제 (RF=2, RF=3) |
| Striping | 데이터 분산 저장 |
| Auto-tiering | SSD ↔ HDD 자동 계층화 |
| Deduplication | 중복 제거 |
| Compression | 데이터 압축 |
| Erasure Coding | 패리티 기반 보호 (공간 효율) |
데이터 보호 (Replication Factor)
| RF | 복제 수 | 장애 허용 | 사용 가능 용량 |
|---|---|---|---|
| RF=2 | 2 Copy | 노드 1대 | 50% |
| RF=3 | 3 Copy | 노드 2대 | 33% |
운영 환경에서는 RF=3 권장
데이터 지역성 (Data Locality)
VM이 실행되는 노드에 데이터를 우선 배치하여 네트워크 I/O 최소화.
🛠️ 주요 HCI 솔루션
Nutanix
HCI 시장 선두 주자임. 소프트웨어 중심.
| 구성요소 | 설명 |
|---|---|
| AOS | 분산 스토리지 (NDFS) |
| AHV | 자체 하이퍼바이저 (무료) |
| Prism | 관리 인터페이스 |
| 하드웨어 | 자체(NX) 또는 Dell/Lenovo/HPE 등 |
특징:
- 하이퍼바이저 선택 가능 (AHV, ESXi, Hyper-V)
- 라이선스: 소프트웨어 구독 모델
- 멀티 클라우드 지원 (NC2)
VMware vSAN
VMware 에코시스템과 통합됨.
| 구성요소 | 설명 |
|---|---|
| vSAN | ESXi 커널에 통합된 SDS |
| ESXi | VMware 하이퍼바이저 |
| vCenter | 관리 인터페이스 |
| 하드웨어 | vSAN Ready Node (Dell, HPE 등) |
특징:
- ESXi 전용 (VMware 환경 필수)
- vSphere 라이선스 + vSAN 라이선스
- VMware 에코시스템 완벽 통합
Dell VxRail
Dell + VMware 협업 어플라이언스임.
특징:
- vSAN 기반 + Dell 하드웨어
- 턴키 어플라이언스
- 자동화된 배포/업데이트
- Dell 단일 지원 창구
Microsoft Azure Stack HCI
Windows 환경 및 Azure 하이브리드 통합됨.
| 구성요소 | 설명 |
|---|---|
| S2D | Storage Spaces Direct (SDS) |
| Hyper-V | Windows 하이퍼바이저 |
| WAC | Windows Admin Center |
| Azure Arc | Azure 통합 관리 |
특징:
- Hyper-V 환경
- Azure 서비스 연동
- Windows 라이선스 기반
- 월정액 구독 모델
솔루션 비교
| 항목 | Nutanix | vSAN | VxRail | Azure Stack HCI |
|---|---|---|---|---|
| 하이퍼바이저 | AHV/ESXi/Hyper-V | ESXi | ESXi | Hyper-V |
| SDS | AOS (NDFS) | vSAN | vSAN | S2D |
| 하드웨어 | 멀티벤더 | 멀티벤더 | Dell 전용 | 멀티벤더 |
| 관리 | Prism | vCenter | vCenter + VxRail Mgr | WAC + Azure |
| 라이선스 | 노드/용량 기반 | CPU 기반 | 노드 기반 | 코어/구독 |
| 강점 | 유연성, 멀티클라우드 | VMware 통합 | 턴키, 단순 | Azure 하이브리드 |
📈 스케일링
Scale-out 방식
노드 추가로 컴퓨팅과 스토리지 동시 확장함.
확장 특징:
| 항목 | 설명 |
|---|---|
| 최소 노드 | 3노드 (일부 2노드 가능) |
| 최대 노드 | 솔루션별 상이 (16~64노드) |
| 확장 단위 | 1노드씩 추가 가능 |
| 다운타임 | 무중단 확장 |
| 리밸런싱 | 자동 데이터 분산 |
컴퓨팅 전용 노드
스토리지 없이 컴퓨팅만 확장하는 방식 (일부 솔루션 지원).
🌐 네트워크 구성
요구사항
| 항목 | 권장 사양 |
|---|---|
| 속도 | 10GbE (최소), 25GbE (권장) |
| 포트 수 | 노드당 2~4포트 |
| 스위치 | 이중화 구성 |
| 지연 | 낮은 latency 필수 |
네트워크 분리
트래픽 분리:
| 트래픽 유형 | 설명 |
|---|---|
| Management | 관리 트래픽 |
| vMotion | VM 라이브 마이그레이션 |
| Storage | SDS 복제, I/O 트래픽 |
| VM Network | VM 서비스 트래픽 |
📊 용량 산정
스토리지 오버헤드
| 항목 | 오버헤드 |
|---|---|
| RF=2 | 2x (50% 가용) |
| RF=3 | 3x (33% 가용) |
| 시스템 예약 | ~5-10% |
| Slack Space | ~10-25% (리밸런싱용) |
계산 예시:
필요 용량: 100TB (VM 데이터)
RF=3 적용: 100TB × 3 = 300TB
Slack 20%: 300TB ÷ 0.8 = 375TB
시스템 10%: 375TB ÷ 0.9 = 417TB
→ 약 420TB Raw 용량 필요
노드 수 계산
CPU/Memory 기준:
- 필요 vCPU: 200개
- 노드당 가용 vCPU: 40개 (오버헤드 고려)
- 필요 노드: 200 ÷ 40 = 5노드
Storage 기준:
- 필요 Raw: 420TB
- 노드당 용량: 100TB
- 필요 노드: 420 ÷ 100 = 4.2 → 5노드
N+1 여유: 5 + 1 = 6노드
→ 최종 6노드 구성
💰 TCO 비교
3-Tier vs HCI 비용 구조
비용 비교 (예시):
| 항목 | 3-Tier | HCI |
|---|---|---|
| 초기 하드웨어 | 높음 | 중간 |
| 초기 라이선스 | 중간 | 중간~높음 |
| 설치/구성 | 높음 (복잡) | 낮음 (단순) |
| 운영 인력 | 높음 | 낮음 |
| 전력/냉각 | 높음 | 중간 |
| 공간 | 많음 | 적음 |
| 확장 비용 | 단위 큼 | 단위 작음 |
HCI가 유리한 경우
| 상황 | 이유 |
|---|---|
| 중소규모 | 초기 비용 낮음, 단순 관리 |
| 신속한 구축 | 턴키 솔루션 |
| IT 인력 부족 | 통합 관리, 낮은 전문성 요구 |
| 예측 가능한 확장 | 노드 단위 점진적 확장 |
| ROBO | 원격 사이트, 소규모 |
| VDI | 예측 가능한 워크로드 |
3-Tier가 유리한 경우
| 상황 | 이유 |
|---|---|
| 대규모 DB | 전용 스토리지 성능 필요 |
| 특수 스토리지 요구 | 고성능 SAN, NVMe-oF |
| 독립적 확장 | 컴퓨팅만 또는 스토리지만 확장 |
| 기존 투자 보호 | SAN 인프라 보유 |
| 특정 워크로드 | 대용량 I/O, 특수 요구사항 |
✅ HCI 장단점
장점
| 장점 | 설명 |
|---|---|
| 단순화 | 컴퓨팅+스토리지 통합 관리 |
| 빠른 구축 | 수일 내 배포 가능 |
| Scale-out | 노드 추가로 유연한 확장 |
| 비용 예측 | 노드 단위 비용 산정 |
| 공간 절약 | 별도 SAN 불필요 |
| 운영 효율 | 단일 관리 인터페이스 |
단점
| 단점 | 설명 |
|---|---|
| 확장 제약 | 컴퓨팅/스토리지 동시 증가 |
| 성능 한계 | 대규모 DB에 부적합 |
| 벤더 종속 | 특정 솔루션 종속 가능 |
| 라이선스 비용 | 노드 증가 시 라이선스 증가 |
| 네트워크 의존 | 스토리지 트래픽이 네트워크 사용 |
| 소규모 비효율 | 3노드 최소 요구 |
🎯 적합한 워크로드
적합
| 워크로드 | 이유 |
|---|---|
| VDI | 예측 가능, 단순 확장 |
| ROBO | 소규모, 원격 관리 |
| Dev/Test | 빠른 프로비저닝 |
| 일반 업무 (ERP, 그룹웨어) | 범용 워크로드 |
| 소규모 DB | 중소규모 트랜잭션 |
부적합 (고려 필요)
| 워크로드 | 이유 |
|---|---|
| 대규모 OLTP DB | 높은 IOPS, 낮은 지연 요구 |
| 빅데이터/분석 | 대용량 순차 I/O |
| 고성능 컴퓨팅 (HPC) | 전용 스토리지 필요 |
| 특수 스토리지 요구 | 블록/파일/오브젝트 혼합 |
📋 도입 체크리스트
요구사항 분석
| 항목 | 확인 내용 |
|---|---|
| 워크로드 | VM 수, 리소스 요구량 |
| 용량 | 현재 + 3년 성장 예측 |
| 성능 | IOPS, 처리량, 지연 |
| 가용성 | RPO, RTO 요구사항 |
| 확장성 | 향후 확장 계획 |
솔루션 선택
| 항목 | 고려사항 |
|---|---|
| 하이퍼바이저 | 기존 환경 (VMware/Hyper-V) |
| 벤더 | 기존 관계, 지원 |
| 라이선스 | 비용 모델, TCO |
| 에코시스템 | 백업, DR, 모니터링 연동 |
인프라 준비
| 항목 | 요구사항 |
|---|---|
| 네트워크 | 10G/25G 스위치, 이중화 |
| 랙 공간 | 노드 수에 따른 U 공간 |
| 전력 | 노드당 전력 용량 |
| 냉각 | 발열량 고려 |
🔗 관련 포스트
- Hypervisor & VM - 가상화 기초
- Data Infrastructure Overview - 데이터 인프라 개요