Skip to main content

HCI Infrastructure

컴퓨팅, 스토리지, 네트워킹을 하나로 통합한 인프라.


🎯 HCI란?

HCI (Hyper-Converged Infrastructure): 컴퓨팅, 스토리지, 네트워킹, 가상화를 단일 x86 노드에 통합하고, 소프트웨어로 관리하는 인프라 아키텍처

핵심 특징:

  • 컴퓨팅 + 스토리지가 같은 노드에 통합
  • 소프트웨어 정의 스토리지 (SDS)
  • Scale-out 확장 방식
  • 단일 관리 인터페이스

🏗️ 인프라 아키텍처 비교

전통적 3-Tier

서버, 네트워크, 스토리지가 분리된 구조임.

특징:

항목설명
구성서버 + FC/iSCSI 스위치 + SAN 스토리지
확장계층별 개별 확장 (Scale-up)
관리각 벤더별 관리 도구
전문성서버/스토리지/네트워크 전문가 필요

Converged Infrastructure (CI)

3-Tier 구성요소를 사전 검증/통합한 패키지임.

예시: VCE Vblock, FlexPod, HPE SimpliVity (초기)

특징:

  • 구성요소는 여전히 분리
  • 검증된 조합으로 패키징
  • 단일 벤더 지원

Hyper-Converged Infrastructure (HCI)

컴퓨팅과 스토리지를 노드에 완전 통합한 구조임.

특징:

항목설명
구성x86 노드 (서버 + 로컬 디스크)
스토리지SDS가 로컬 디스크를 분산 풀로 통합
확장노드 추가 (Scale-out)
관리단일 관리 인터페이스

3-Tier vs CI vs HCI 비교

항목3-TierCIHCI
통합도분리패키징완전 통합
스토리지외장 SAN외장 SAN분산 SDS
확장 방식Scale-upScale-upScale-out
관리 복잡도높음중간낮음
초기 비용높음중간낮음~중간
유연성높음중간중간
전문성 요구높음중간낮음
적합 규모대규모중대규모중소규모

📦 HCI 아키텍처 상세

노드 구성

일반적인 노드 스펙:

구성요소사양
CPU듀얼 소켓, Intel Xeon / AMD EPYC
Memory256GB ~ 1TB+
Cache TierNVMe SSD (성능 계층)
Capacity TierSATA SSD 또는 HDD
Network10GbE / 25GbE (2~4포트)

소프트웨어 정의 스토리지 (SDS)

각 노드의 로컬 디스크를 묶어 분산 스토리지 풀 생성함.

SDS 핵심 기능:

기능설명
Replication데이터 복제 (RF=2, RF=3)
Striping데이터 분산 저장
Auto-tieringSSD ↔ HDD 자동 계층화
Deduplication중복 제거
Compression데이터 압축
Erasure Coding패리티 기반 보호 (공간 효율)

데이터 보호 (Replication Factor)

RF복제 수장애 허용사용 가능 용량
RF=22 Copy노드 1대50%
RF=33 Copy노드 2대33%

운영 환경에서는 RF=3 권장


데이터 지역성 (Data Locality)

VM이 실행되는 노드에 데이터를 우선 배치하여 네트워크 I/O 최소화.


🛠️ 주요 HCI 솔루션

Nutanix

HCI 시장 선두 주자임. 소프트웨어 중심.

구성요소설명
AOS분산 스토리지 (NDFS)
AHV자체 하이퍼바이저 (무료)
Prism관리 인터페이스
하드웨어자체(NX) 또는 Dell/Lenovo/HPE 등

특징:

  • 하이퍼바이저 선택 가능 (AHV, ESXi, Hyper-V)
  • 라이선스: 소프트웨어 구독 모델
  • 멀티 클라우드 지원 (NC2)

VMware vSAN

VMware 에코시스템과 통합됨.

구성요소설명
vSANESXi 커널에 통합된 SDS
ESXiVMware 하이퍼바이저
vCenter관리 인터페이스
하드웨어vSAN Ready Node (Dell, HPE 등)

특징:

  • ESXi 전용 (VMware 환경 필수)
  • vSphere 라이선스 + vSAN 라이선스
  • VMware 에코시스템 완벽 통합

Dell VxRail

Dell + VMware 협업 어플라이언스임.

특징:

  • vSAN 기반 + Dell 하드웨어
  • 턴키 어플라이언스
  • 자동화된 배포/업데이트
  • Dell 단일 지원 창구

Microsoft Azure Stack HCI

Windows 환경 및 Azure 하이브리드 통합됨.

구성요소설명
S2DStorage Spaces Direct (SDS)
Hyper-VWindows 하이퍼바이저
WACWindows Admin Center
Azure ArcAzure 통합 관리

특징:

  • Hyper-V 환경
  • Azure 서비스 연동
  • Windows 라이선스 기반
  • 월정액 구독 모델

솔루션 비교

항목NutanixvSANVxRailAzure Stack HCI
하이퍼바이저AHV/ESXi/Hyper-VESXiESXiHyper-V
SDSAOS (NDFS)vSANvSANS2D
하드웨어멀티벤더멀티벤더Dell 전용멀티벤더
관리PrismvCentervCenter + VxRail MgrWAC + Azure
라이선스노드/용량 기반CPU 기반노드 기반코어/구독
강점유연성, 멀티클라우드VMware 통합턴키, 단순Azure 하이브리드

📈 스케일링

Scale-out 방식

노드 추가로 컴퓨팅과 스토리지 동시 확장함.

확장 특징:

항목설명
최소 노드3노드 (일부 2노드 가능)
최대 노드솔루션별 상이 (16~64노드)
확장 단위1노드씩 추가 가능
다운타임무중단 확장
리밸런싱자동 데이터 분산

컴퓨팅 전용 노드

스토리지 없이 컴퓨팅만 확장하는 방식 (일부 솔루션 지원).


🌐 네트워크 구성

요구사항

항목권장 사양
속도10GbE (최소), 25GbE (권장)
포트 수노드당 2~4포트
스위치이중화 구성
지연낮은 latency 필수

네트워크 분리

트래픽 분리:

트래픽 유형설명
Management관리 트래픽
vMotionVM 라이브 마이그레이션
StorageSDS 복제, I/O 트래픽
VM NetworkVM 서비스 트래픽

📊 용량 산정

스토리지 오버헤드

항목오버헤드
RF=22x (50% 가용)
RF=33x (33% 가용)
시스템 예약~5-10%
Slack Space~10-25% (리밸런싱용)

계산 예시:

필요 용량: 100TB (VM 데이터)
RF=3 적용: 100TB × 3 = 300TB
Slack 20%: 300TB ÷ 0.8 = 375TB
시스템 10%: 375TB ÷ 0.9 = 417TB

→ 약 420TB Raw 용량 필요

노드 수 계산

CPU/Memory 기준:
- 필요 vCPU: 200개
- 노드당 가용 vCPU: 40개 (오버헤드 고려)
- 필요 노드: 200 ÷ 40 = 5노드

Storage 기준:
- 필요 Raw: 420TB
- 노드당 용량: 100TB
- 필요 노드: 420 ÷ 100 = 4.2 → 5노드

N+1 여유: 5 + 1 = 6노드

→ 최종 6노드 구성

💰 TCO 비교

3-Tier vs HCI 비용 구조

비용 비교 (예시):

항목3-TierHCI
초기 하드웨어높음중간
초기 라이선스중간중간~높음
설치/구성높음 (복잡)낮음 (단순)
운영 인력높음낮음
전력/냉각높음중간
공간많음적음
확장 비용단위 큼단위 작음

HCI가 유리한 경우

상황이유
중소규모초기 비용 낮음, 단순 관리
신속한 구축턴키 솔루션
IT 인력 부족통합 관리, 낮은 전문성 요구
예측 가능한 확장노드 단위 점진적 확장
ROBO원격 사이트, 소규모
VDI예측 가능한 워크로드

3-Tier가 유리한 경우

상황이유
대규모 DB전용 스토리지 성능 필요
특수 스토리지 요구고성능 SAN, NVMe-oF
독립적 확장컴퓨팅만 또는 스토리지만 확장
기존 투자 보호SAN 인프라 보유
특정 워크로드대용량 I/O, 특수 요구사항

✅ HCI 장단점

장점

장점설명
단순화컴퓨팅+스토리지 통합 관리
빠른 구축수일 내 배포 가능
Scale-out노드 추가로 유연한 확장
비용 예측노드 단위 비용 산정
공간 절약별도 SAN 불필요
운영 효율단일 관리 인터페이스

단점

단점설명
확장 제약컴퓨팅/스토리지 동시 증가
성능 한계대규모 DB에 부적합
벤더 종속특정 솔루션 종속 가능
라이선스 비용노드 증가 시 라이선스 증가
네트워크 의존스토리지 트래픽이 네트워크 사용
소규모 비효율3노드 최소 요구

🎯 적합한 워크로드

적합

워크로드이유
VDI예측 가능, 단순 확장
ROBO소규모, 원격 관리
Dev/Test빠른 프로비저닝
일반 업무 (ERP, 그룹웨어)범용 워크로드
소규모 DB중소규모 트랜잭션

부적합 (고려 필요)

워크로드이유
대규모 OLTP DB높은 IOPS, 낮은 지연 요구
빅데이터/분석대용량 순차 I/O
고성능 컴퓨팅 (HPC)전용 스토리지 필요
특수 스토리지 요구블록/파일/오브젝트 혼합

📋 도입 체크리스트

요구사항 분석

항목확인 내용
워크로드VM 수, 리소스 요구량
용량현재 + 3년 성장 예측
성능IOPS, 처리량, 지연
가용성RPO, RTO 요구사항
확장성향후 확장 계획

솔루션 선택

항목고려사항
하이퍼바이저기존 환경 (VMware/Hyper-V)
벤더기존 관계, 지원
라이선스비용 모델, TCO
에코시스템백업, DR, 모니터링 연동

인프라 준비

항목요구사항
네트워크10G/25G 스위치, 이중화
랙 공간노드 수에 따른 U 공간
전력노드당 전력 용량
냉각발열량 고려

🔗 관련 포스트


🔗 참고 자료