top of page

​퀀텀브릭스

퀀텀브릭스는 합리적인 가격으로 GPU 서버를 공급합니다.

퀀텀브릭스는 고객사 및 파트너의 AI 비지니스 가속화와 성장을 위해 혁신적인 원가관리 및 글로벌 리더들과의 견고한 파트너쉽을 통해 합리적인 가격으로 GPU 서버를 공급합니다.

가격표

대략적인 가격은 탑재수량별 GPU 서버 가격표를 참고 바랍니다.

견적 요청 하기

최단 24시간, 최대 48시간 이내 (영업일 기준) 견적서를 보내 드립니다.

​문의하기

실시간 문의하기에 메세지를 남겨주시면 빠르게 답변을 드립니다.

루빈 탑재 GPU 서버 가격 및 구매 가이드

NVIDIA 직접 설계 및 제조 DGX Rubin NVL8 구매 또는, HPE, Dell 등 서버에 Rubin 탑재 GPU 서버 구매, 2가지 중 선택할 수 있습니다.

Rubin GPU 8장이 탑재된 NVIDIA DGX Rubin NVL8 GPU 서버 이미지

NVIDIA 루빈

DGX Rubin NVL8은 NVIDIA가 직접 설계 및 제조한 AI 전용 GPU 서버입니다.

NVIDIA Rubin GPU 8장 탑재, 총 2.3TB GPU 메모리 탑재, 초거대 언어 모델 학습 및 추론에서 압도적인 성능을 제공합니다.

Rubin GPU 8장이 탑재된 NVIDIA HGX Rubin 메인 보드 전면 이미지

NVIDIA 루빈

HPE, Dell 등 서버에 Rubin을 탑재하여 GPU 서버를 구매할 수 있습니다.

NVIDIA Rubin GPU는 추론 성능을 극대화함으로써, Blackwell 대비 와트당 토큰 처리량은 높이고 토큰당 비용은 낮추었습니다.

B300 탑재 GPU 서버 가격 및 구매 가이드

NVIDIA 직접 설계 및 제조 DGX B300 구매 또는, HPE, Dell 등 서버에 B300 탑재 GPU 서버 구매, 2가지 옵션 중 선택할 수 있습니다.

B300 GPU 8장이 탑재된 NVIDIA DGX B300 GPU 서버 전면 이미지

NVIDIA DGX B300

DGX B300은 NVIDIA가 직접 설계 및 제조한 AI 전용 GPU 서버입니다.

Blackwell Ultra B300 GPU x 8장 탑재, 총 2.1TB GPU 메모리 용량과 초 당 62TB/s의 GPU 대역폭을 제공합니다.

NVIDIA B300 GPU를 탑재할 수 있는 HPE XD690 서버 전면 이미지

NVIDIA B300

HPE, Dell 등 서버에 B300을 탑재하여 GPU 서버를 구매할 수 있습니다.

HPE Compute XD690, Dell PowerEdge XE9780  등 벤더 서버에 B300을 탑재하여 GPU 서버를 구매할 수 있습니다.

B200 탑재 GPU 서버 가격 및 구매 가이드

NVIDIA 직접 제조 DGX B200 구매 또는, HPE, Dell 등 서버에 B200을 탑재하여 GPU 서버 구매, 2가지 옵션 중 선택할 수 있습니다.

B200 GPU 8장이 탑재된 NVIDIA DGX B200 GPU 서버 전면 이미지

NVIDIA DGX B200

DGX B200은 NVIDIA가 직접 설계 및 제조한 AI 전용 GPU 서버입니다.

Blackwell 아키텍처 기반 B200 GPU 8장 탑재, 총 1.4TB GPU 메모리 용량과 초 당 64TB/s의 GPU 메모리 대역폭을 제공합니다.

NVIDIA B200, B300 GPU를 탑재할 수 ��있는 Dell XE9780 서버가 랙에 장착된 이미지

NVIDIA B200

HPE, Dell 등 서버에 B200을 탑재하여 GPU 서버를 구매할 수 있습니다.

HPE Compute XD685 시리즈 또는, Dell PowerEdge XE9780 시리즈 서버에 B200을 탑재하여 GPU 서버를 구매할 수 있습니다.

H200 탑재 GPU 서버 가격 및 구매 가이드

NVIDIA 직접 제조 DGX H200 구매 또는, HPE, Dell 등 서버에 H200을 탑재하여 GPU 서버 구매, 2가지 옵션 중 선택할 수 있습니다.

H200 GPU 8장이 탑재된 NVIDIA DGX H200 GPU 서버 전면 이미지

NVIDIA DGX H200

DGX H200은 NVIDIA가 직접 설계 및 제조한 AI 전용 GPU 서버입니다.

Hopper 아키텍처 기반 H200 GPU 8장 탑재, 총 1.1TB GPU 메모리 용량과 초 당 38.4 TB/s의 GPU 메모리 대역폭을 제공합니다.

NVIDIA H200 GPU를 탑재할 수 있는 Dell XE7740 서버 전면 이미지

NVIDIA H200

HPE, Dell 등 서버에 H200을 탑재하여 GPU 서버를 구매할 수 있습니다.

HPE DL380, Dell R770, XE7740 등 서버에 원하는 만큼의 수량의 H200을 탑재하여, GPU 서버를 구매할 수 있습니다.

L40S 탑재 GPU 서버 가격 및 구매 가이드

HPE DL380 시리즈 또는, Dell R770 시리즈 등  벤더 서버에 원하는 만큼의 수량의 L40S GPU를 탑재할 수 있습니다.

NVIDIA L40S GPU를 탑재할 수 있는 HPE ProLiant DL380 서버 제품 전면 이미지

NVIDIA L40S

HPE DL380 서버에 L40S를 탑재하여 GPU 서버를 구매할 수 있습니다.

HPE ProLiant DL380 시리즈 서버에 원하는 만큼의 수량의 L40S GPU를 탑재하여 GPU 서버를 구매할 수 있습니다.

NVIDIA L40S GPU를 탑재할 수 있는 Dell PowerEdge R770 서버 제품 이미지

NVIDIA L40S

Dell R770 서버에 L40S를 탑재하여 GPU 서버를 구매할 수 있습니다.

Dell PowerEdge R770 시리즈 서버에 원하는 만큼의 수량의 L40S GPU를 탑재하여 GPU 서버를 구매할 수 있습니다.

RTX 6K 탑재 GPU 서버 가격 및 구매 가이드

HPE DL380 또는, Dell R770 등 벤더 서버에 원하는 만큼의 수량의 RTX Pro 6000 Blackwell 을 탑재, GPU 서버를 구매할 수 있습니다.

NVIDIA RTX Pro 6000 Blackwell GPU를 탑재할 수 있는 HPE ProLiant DL380 서버 제품 전면 이미지

RTX Pro 6000 Blackwell

HPE DL380 서버에 RTX Pro 6000 Blackwell 을 탑재, GPU 서버를 구매할 수 있습니다.

HPE DL380 서버에 원하는 만큼의 수량의 RTX Pro 6000 Blackwell GPU를 탑재하여 PU 서버를 구매할 수 있습니다.

dell-r770-gpu-server.jpg

RTX Pro 6000 Blackwell

Dell R770 서버에 RTX Pro 6000 Blackwell 을 탑재, GPU 서버를 구매할 수 있습니다.

Dell R770 서버에 원하는 만큼의 수량의 RTX Pro 6000 Blackwell GPU를 탑재하여 GPU 서버를 구매할 수 있습니다.

LLM 파인튜닝 및 RAG 시스템 구축

LLM 풀 파인튜닝, LoRA 학습, RAG 시스템 구축 및 운영에 적합한 GPU 서버를 구매하기 위한 다양한 비교표를 제공합니다.

LLM 파인튜닝에 적합한 GPU 선택 섹션에 쓰인 로봇 만드는 어린이들 이미지

LLM 파인튜닝

LLM 풀 파인튜닝 및 LoRA 학습이 가능한 모델의 파라미터 크기를 비교합니다.

LLM 풀 파인 튜닝 및 LoRA 학습 시, 적재 가능한 모델의 파라미터 크기를 BF16 정밀도 및 GPU 1 장 당 기준으로 비교합니다.

RAG 시스템 구축 및 운영에 적합한 GPU 선택 섹션에 쓰인 로봇 만드는 어린이 이미지

RAG 시스템 구축 및 운영

RAG 시스템 구축 및 운영를 위한 임베딩 처리 속도, 동시 접속 사용자 수를 비교합니다.

RAG 시스템 구축 및 운영 시, 임베딩 처리속도 및 실시간 동시 접속 사용자수를 FP16, FP8, FP4 정밀도 기준으로 비교합니다.

​추론 성능(tps) 및 연산 성능(flops) 비교표

NVIDIA B300, B200, H200, H100 등 GPU 제품별로 추론(tps), 연산(flops) 및 처리 속도를 비교합니다.

추론 성능 및 처리 속도 비교 섹션에 쓰인 로봇 이미지

추론 성능(tps)

추론 성능 구간별 사용자 체감 비교, 모델 크기별 추론 성능을 비교합니다.

모델 크기별, 8B, 30B, 70B 기준으로 각 GPU 제품별 추론 성능을 비교하고 사용자 체감 비교표를 제공하여 적합한 GPU 선택을 지원합니다.

연산 성능 및 처리 속도 비교 섹션에 쓰인 로봇 이미지

연산 성능(flops)

데이터 정밀도 FP16, FP8, FP4 기준으로 연산 성능 및 처리 속도를 비교합니다.

1 PFLOPS: 전 세계 인구 80억 명이 계산기를 들고 1초에 한 번씩, 쉬지 않고 약 35시간 동안 계산해야 하는 일을 1초만에 끝냅니다.

​LLM 학습 및 추론 가능한 모델 크기 비교표

LLM 학습 시, FP16 정밀도 기준으로, 추론 시 FP16, FP8, FP4 기준으로 적재 가능한 모델의 파라미터 수를 비교합니다.

LLM 학습 가능 모델 크기 비교 섹션에 쓰인 로봇 이미지

LLM 학습 모델 크기

LLM 학습 시, FP16 정밀도 기준으로 적재 가능한 모델의 파라미터 수를 비교합니다.

LLM 학습 시, GPU 1장에 단순히 적재할 수 있는 LLM 모델의 크기는 GPU 메모리 용량 크기를 기준으로 결정됩니다.

LLM 추론 가능 모델 크기 비교 섹션에 쓰인 로봇 이미지

LLM 추론 모델 크기

LLM 추론 시 FP16, FP8, FP4 기준으로 적재 가능한 모델의 파라미터 수를 비교합니다.

LLM 추론 시, GPU 1장에 단순히 적재할 수 있는 LLM 모델의 크기는 GPU 메모리 용량 크기를 기준으로 결정됩니다.

메모리 용량 및 전력 소모량 비교표

NVIDIA GPU 제품별 메모리 용량, 메모리 대역폭 및 전력 소모량을 비교합니다.

NVIDIA GPU 메모리 용량 섹션에 사용된 NVIDIA 데이터 센터 내부 이미지

메모리 용량 및 대역폭

NVIDIA GPU 제품별 메모리 용량 및 메모리 대역폭을 비교합니다.

NVIDIA GPU 메모리 용량의 1차적인 역할은 올릴 수 있는 LLM 모델의 크기를 결정합니다.

NVIDIA GPU 전력 소모량 비교 섹션에 사용된 NVIDIA 데이터 센터 내부 이미지

전력 소모량 및 최대 전력량

NVIDIA GPU 제품별 전력 소모량 및 최대 전력량을 비교합니다.

H100 / H200 GPU 1개당 최대 700W 정도, B200 1장은 최대 1,200W 정도 사용합니다.

bottom of page