Skip to main content

요구사항 추적표

제안요청서 전체 요구사항 → 제안 대응 매핑


1. 공통 요구사항 (CMR)

코드요구사항명핵심 요구 내용제안 대응 방향평가 연결
CMR-01전략 및 수행방안① DIDC 환경 고려 추진전략 ② GPU 성능 검증 전략 ③ 가상자원(VM, Pod, GPU) 구성방안 ④ GeDAI 이전 기술지원 ⑤ 사용자 지침서① B300 클러스터 + PaaS 플랫폼 통합 전략 ② MLPerf 기반 성능 검증 방법론 제시 ③ K8s + GPU Operator + MIG 멀티테넌시 ④ GeDAI 컨테이너 마이그레이션 절차 ⑤ AI 모델 탑재/자원할당/장애조치 매뉴얼추진전략(4점)
CMR-02조사 및 분석① HW/SW/네트워크/보안/데이터 환경 조사 ② 선행 GeDAI 아키텍처 분석 ③ 성능측정 도구, 방법 제시 ④ 전력/발열/냉방 조사① 현장 방문 기반 AS-IS 분석 체크리스트 ② GeDAI 플랫폼 인프라 아키텍처 분석 ③ MLPerf Inference + TensorRT-LLM ④ DGX B300 전력/냉각 산정서공통(3점)
CMR-03상세 설계① GPU 인프라 물리/논리 설계 ② 서버/스토리지/네트워크/백업 설계 ③ 가상화 SW, 보안/관제 SW 설계 ④ 랙/케이블/분전반 설계 ⑤ DIDC 정책 준수물리/논리 아키텍처 구성도 ② 3-tier 네트워크(서비스/컴퓨팅/관리) 설계 ③ OpenShift + GPU Operator 설계 ④ 랙 배치도, 선번장, 케이블 매트릭스 ⑤ DIDC 명명규칙, 보안정책 반영공통(3점, 필수O)
CMR-04설치 및 구축① HW/SW 설치방안 ② 설치결과 검증 ③ SW 직접구매 통합관리 ④ 성능측정 기술지원 ⑤ GeDAI 데이터 이관 지원① 단계별 설치 WBS ② 항목별 체크리스트 ③ SW 직접구매 사업자 협업 프로세스 ④ MLPerf/자체 벤치마크 지원 ⑤ 컨테이너 이미지 마이그레이션공통(3점, 필수O)
CMR-05시험평가① 시험평가 계획/수행 ② GPU 성능 100% 활용 증명 (학습/추론 성능 수치 + 시연) ③ AI 모델 반입 계획 (보안검토 1개월+) ④ 자원할당 절차 검증 ⑤ 보안취약점 점검 ⑥ CC인증 유효기간 1년+① 시험평가 시나리오 기반 계획서 ② MLPerf Inference (Llama 2-70B) + 자체 AI 모델 시연 → 처리량/지연 수치 제시 ③ AI 모델 반입 일정 WBS 포함 (M+2~3) ④ K8s 기반 자원할당 시나리오 ⑤ 국방 취약점 지침 준수 점검 ⑥ 보안 SW CC인증 확인서 첨부시험평가(4점, 필수O) + 보안(2점, 필수O)
CMR-06기반운영환경 도입 공통① 반입 경로/동선 ② 자산등록 선행 ③ 보안취약점 제거 ④ 망분리 ⑤ 서버보안 정책 적용 ⑥ SIEM 연동 ⑦ 호환성 검증 ⑧ 관제/보안 SW 설치 ⑨ 불변 OS는 보안SW 설치 제외① 반입 경로도 + 보양 계획 ② DIDC 자산관리시스템 등록 절차 ③ DIDC 취약점 진단체계 Agent 설치 ④ 네트워크 영역 분리 설계 ⑤ 서버보안 정책 Config ⑥ 로그정의서, 로그포맷 제출 ⑦ 기존 장비 호환성 테스트 계획 ⑧ 관제/보안 SW 설치 대상 목록 ⑨ RHCOS(불변OS) 적용 노드 구분기반운영환경(4점, 필수O)
CMR-07DIDC 자원 Pool 최적화① 기존/신규 자원 Pool 통합 ② 재배치/재구성 ③ 케이블 재구성 ④ 상면 최적화 ⑤ AI 모델 전력화 기술지원① 기존 Pool 현황 분석 → 통합 설계 ② 랙 재배치 계획 ③ 케이블 재포설 계획 ④ 불용 자원 정리 ⑤ 안정화/하자보수 기간 기술지원 계획인프라 최적화(3점, 필수O)
CMR-08케이블/컨테인먼트/Rack① KS 인증 전원케이블 ② OM4 광케이블 ③ Cat6A UTP ④ 800G 구간: NVIDIA Ref Arch 규격 ⑤ 분전반 공사 시 전기안전관리자① 자재 규격 명세표 ② 컴퓨팅 네트워크: MPO 케이블 + NVIDIA 규격 Transceiver ③ 표준 Rack GPU용 Depth 변경 ④ 분전반 설계/전기안전관리자 선임 계획인프라 최적화(3점, 필수O)

2. 기반운영환경 도입 (ECR)

2.1 GPU 서버 & 관리서버

코드요구사항명수량핵심 스펙제안 대응주의사항
ECR-01GPU 서버10EANVIDIA B300 SXM 8-GPU (288GB HBM3e/GPU) / CPU 2P 96코어+ / RAM 2,048GB DDR5 / ConnectX-8 ×8 (800G VPI) / 서비스 NIC 200G ×2 / OOB 1/10G ×1 / NVMe 3.84TB ×4 / PSU 3200W+ Titanium 6+6 / OS: RHOCP, VMware, Rancher, Xen, KVM 지원DGX B300 시스템 제안 / NVIDIA Reference Architecture 준수 / ConnectX-8 VPI 모드(800G Ethernet) / 서비스 LEAF 200G 연결 / OOB 스위치 연결 / 이중화 구성⚠️ DGX B300 명시 — 대체 불가 / NIC 물리적 이중화 필수 / USB/LAN 물리적 차단 장치 / 신규 PaaS 풀 구성품 + Guest OS 포함
ECR-02클라우드 관리서버-CPU 2P 32코어+ / RAM 512GB+ / NIC 25G ×2 / NVMe 1.92TB ×2 / OS: Windows/Linux 지원K8s Master Node / Control Plane HA (3노드 권장)PaaS 풀 구성품 + Guest OS 포함

2.2 네트워크

코드요구사항명핵심 스펙제안 대응주의사항
ECR-03(서비스) SPINE400GE 24포트+ / L3 라우팅 / BGP, OSPF, VXLAN400G 데이터센터 스위치⚠️ BMT 성능 검증 필수
ECR-04(서비스) LEAF400GE 16포트+ / 25G 48포트+NAS: 200~400G 연결 / GPU서버: 200G 서비스 연결⚠️ BMT 성능 검증 필수 / SPINE과 400G+ 연결
ECR-05(관리) OOB1/10G 관리 스위치GPU서버/관리서버 IPMI/BMC 연결
ECR-06(컴퓨팅) SPINE800GE 64포트+ / 대규모 AI/HPC 패브릭 / 저지연 설계GPU Direct RDMA 지원 / NVIDIA Ref Arch 기반⚠️ 핵심 장비 / NVIDIA 검증 증빙 필수
ECR-07(컴퓨팅) LEAF800GE 64포트+ / 저지연 / 하위 400G 호환GPU서버 ConnectX-8과 800G 연결⚠️ DGX B300 공식 사양(ConnectX-8 VPI) 기반 / SPINE과 800G+ 연결

2.3 스토리지 / 가상화 / 보안

코드요구사항명핵심 스펙제안 대응주의사항
ECR-08고속 NASNAS 스토리지 / 서비스 LEAF와 200~400G 연결AI 학습 데이터 + 모델 저장용 / CSI 드라이버로 K8s PV 연동
ECR-09GPU 가상화 SW (PaaS)10EA (워커노드) / 31개 세부 요구 (아래 별도 표)OpenShift 또는 Rancher + GPU Operator⚠️ Istio, Knative, GitOps 명시 / 불변 OS(NIST 800-190) / 엔터프라이즈 Linux 필수 / 커뮤니티 OS 배제
ECR-10백업 라이선스증설기존 백업시스템 라이선스 추가
ECR-11관제 및 보안 SW신규 + 증설EMS, 서버보안, 계정관리, DB접근제어, DB암호화, APPM, SIEM, 바이러스방역 등⚠️ CC인증 유효기간 1년+
ECR-12표준 Rack 및 기반환경컨테인먼트, 랙, L2 스위치, 케이블 트레이, 분전반GPU용 Rack(Depth/PDU 변경 가능)

3. ECR-09 GPU 가상화 SW (PaaS) — 31개 세부 요구사항 추적

#요구사항OpenShift 대응Rancher 대응비고
1Containerd 기반 컨테이너 관리✅ CRI-O (OCI 호환)✅ ContainerdCRI-O도 OCI 표준
2HW 비종속 엔터프라이즈 PaaS
3다국어(영어, 한국어) 대시보드✅ (Rancher UI)
4표준 이미지 저장소✅ (내장 Registry)⚠️ Harbor 별도
5Operator 배포 자동화✅ (OperatorHub 내장)✅ (Helm/Operator)
624/365 기술지원 체계✅ Red Hat✅ SUSE
7엔터프라이즈 Linux 포함 (커뮤니티 배제)RHEL/RHCOSSLES/SLE Micro⚠️ Ubuntu, CentOS 불가
8자동설치 기능✅ (IPI/UPI)
9관리 시스템 이중화✅ (3 Master HA)
10무중단 노드 증설
11Auto Scale out/in✅ (HPA, CA)
12SDN Plug-In✅ (OVN-K, Calico)✅ (Canal, Calico, Cilium)
13DockerHub, Git 연계
14멀티 테넌시✅ (Project/Namespace)✅ (Namespace)
15Template 기능✅ (Template 내장)✅ (Fleet/Helm)
16이력관리 및 롤백✅ (Deployment)
17외부 스토리지 할당✅ (PV/PVC, CSI)
18컨테이너 이동 시 스토리지 자동연결✅ (PVC 리바인딩)
19Istio 기반 서비스 메시✅ (OpenShift Service Mesh)⚠️ Istio 수동 설치✅ OpenShift 유리
20Knative 서버리스✅ (OpenShift Serverless)⚠️ Knative 수동 설치✅ OpenShift 유리
21AI/ML GPU 연계✅ (GPU Operator)✅ (GPU Operator)
22Immutable Host OSRHCOSSLE Micro
23버전 업그레이드 Path 제공✅ (OCP Lifecycle)
24GitOps 자동배포✅ (OpenShift GitOps = ArgoCD)⚠️ Fleet 또는 ArgoCD 별도✅ OpenShift 유리
25멀티 클러스터 관리✅ (ACM)✅ (Rancher 핵심)
26컨테이너 네이티브 보안✅ (ACS = StackRox)⚠️ 별도 도입✅ OpenShift 유리
27컨테이너 네이티브 스토리지✅ (ODF = Ceph)⚠️ Longhorn
28이미지 재해복구✅ (OADP)⚠️ Velero
29컨테이너 전용 Host OS (NIST 800-190)RHCOS (불변, 공격표면 최소화)SLE Micro
30Bare Metal LoadBalancer✅ (MetalLB 내장)✅ (MetalLB)
31Node Auto Scale in/out✅ (Machine API)✅ (Cluster Autoscaler)

종합: OpenShift가 31개 요구 중 네이티브 충족 비율이 높음 (Istio, Knative, GitOps, 보안, Registry가 내장)


4. 사업관리 (PMR) 요구사항

코드요구사항명핵심평가 연결
PMR-01사업수행 일반사업수행계획서, WBS, 마일스톤사업관리(3점)
PMR-02품질관리분야별 품질관리, 산출물 관리품질관리(2점)
PMR-03형상관리형상관리 기준/절차, 요구사항 추적형상관리(2점)
PMR-04위험관리위험요소 식별 및 대응방안위험관리(3점)
PMR-05조직 및 인력관리PM 자격, 투입 인력인력(별도)
PMR-06진척관리WBS 진척, 지연 시 대응진척관리(2점)
PMR-07의사소통관리보고체계, 선행사업 업체 협력의사소통(2점)
PMR-08하도급관리하도급 관리방안
PMR-09보안관리군사자료 유출방지, 분야별 보안보안관리(2점)
PMR-10안전보건 관리안전보건 수준평가안전보건(2점)
PMR-11납품검수검수방안납품검수(3점)

5. 사업지원 (PSR) 요구사항

코드요구사항명핵심평가 연결
PSR-01교육훈련교육계획, 대상, 내용교육훈련(3점, 필수O)
PSR-02운영환경 조성관제환경, 상면 조성운영환경(3점, 필수O)
PSR-03안정화지원조기 안정화, HW/SW 기술지원안정화(4점, 필수O)
PSR-04하자보수기간/인력/방법, 제조사 수준 서비스하자보수(5점, 필수O)

6. 필수(O) 항목 체크리스트

기술평가에서 필수(O) 항목을 미충족하면 탈락 가능. 총 필수 항목:

분야필수 항목배점
사업수행조사 및 분석3
상세 설계3
HW/SW 설치 검증3
시험평가4
보안취약점 확인2
인프라 최적화/케이블3
기반운영환경 도입 구축4
도입 제품 우수성5
설치 일정 계획2
사업지원교육훈련3
운영환경 조성3
안정화지원4
하자보수5
합계44점

⚠️ 필수 항목 합계 44점 / 전체 75점(사업수행 29 + 사업관리 21 + 사업지원 15 중 필수만). 필수 항목에서 0점을 받으면 배점한도 85% 달성이 어려워 협상적격자 탈락 가능.