Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX PRO 6000 Blackwell = 96 GB GDDR7 ECC VRAM, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

GPU VPS Hosting

RTX PRO 6000 Blackwell. A100. RTX 5090.
Paylaşımsız, bölünmemiş.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.7 (769 reviews)

Tam GPU passthrough. RTX PRO 6000 Blackwell, A100, RTX 5090, RTX 4090. CUDA, cuDNN ve PyTorch önceden yüklü.
NVMe + 40 Gbps ağ bağlantısı. 2008'den beri bağımsız bulut.

4.7 · 769 Trustpilot değerlendirmesi

₿ Crypto accepted

GPU VPS Başlat GPU planlarını karşılaştır

Başlangıç fiyatı $506.35/mo · yıllıkta %35 indirim · Kredi kartı gerekmez

~ ssh root@gpu-train-001 bağlandı

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX PRO 6000 Blackwell, 98304 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX PRO 6000 Blackwell
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS'a genel bakış

Cloudzy GPU VPS planlarını dedicated olarak satar RTX PRO 6000 Blackwell, Nvidia A100, RTX 5090, ve RTX 4090 kartlarda 1× to 4× yapılandırmalar, başlangıç olarak $506.35 aylık. Each plan ships pre-installed with the latest CUDA, cuDNN, and Nvidia drivers, runs on AMD EPYC + DDR5 with Yalnızca NVMe depolama ve 40 Gbps uplink ile sağlanır ve 60 saniye. GPUs are dedicated passthrough, not vGPU, not MIG, not shared. Cloudzy has operated independently since 2008 ve puanı 4.7 / 5 by 769+ reviewers Trustpilot'ta.

Başlangıç fiyatı: $506.35 / mo
GPU türleri: PRO 6000 · A100 · 5090 · 4090
Konfigürasyonlar: 1× to 4×
CUDA: Önceden yüklenmiş
Yıllık indirim: %35 indirim
Para iadesi: 14 gün

ML ekiplerinin Cloudzy'yi tercih etme nedenleri

GPU hesaplama, sıkıcı olmayan şekilde.

Ekiplerin AWS / GCP / hyperscaler GPU'lerden Cloudzy'ye geçmesinin dört nedeni.

Adanmış GPU geçişi

Fiziksel kartın tamamı size aittir; vGPU dilimleme yok, MIG bölümü yok, diğer kiracılarla kaynak çekişmesi yok. CUDA core'lar, VRAM, PCIe şeritleri, tümü size özel.

CUDA'ya hazır imajlar

En güncel Nvidia sürücüleri, CUDA toolkit ve cuDNN, Ubuntu imajına önceden entegre edilmiştir. PyTorch, TensorFlow, JAX, Hugging Face, pip install yapın ve eğitime başlayın.

NVMe + 40 Gbps

Saf NVMe depolama sayesinde veri seti yükleme bir darboğaz olmaktan çıkar. 40 Gbps ağ bağlantısıyla 100 GB'lık bir Hugging Face modeli dakikalar değil, saniyeler içinde indirilir.

7/24 insan desteği

Sohbet hattında gerçek mühendisler var. Çok GPU'li eğitim kurulumları, CUDA OOM hata ayıklamaları ve Llama inference ayarlamaları konusunda yeterince ekibe yardım ettik; sorularınıza hızlı yanıt gelir.

GPU sırası

Dört aile.
Dokuz farklı ölçekleme seçeneği.

RTX PRO 6000 Blackwell for pro-grade inference and rendering with 96 GB GDDR7 ECC VRAM. A100 for training and large-VRAM workloads. RTX 5090 for the newest inference. RTX 4090 for cost-effective inference up to 70B (4-bit). Multi-GPU plans available, pick what your VRAM budget needs.

Tam GPU geçişi, bölünmemiş ve paylaşılmamış

RTX PRO 6000 Blackwell

96 GB GDDR7 ECC VRAM · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

1× to 4× GPU

Çoklu GPU planları mevcut

CUDA preinstalled

PyTorch · TF · JAX hazır

Pure NVMe

Hızlı veri seti I/O

40 Gbps uplink

100 GB modellerini 30 saniyede çek

Kullanım alanları

Müşterilerimizin
gerçekten eğittiği iş yükleri.

LLM çıkarımı

vLLM veya Text Generation Inference ile Llama 3, Mistral, DeepSeek ya da Qwen çalıştırın. RTX 4090, 70B'yi 4-bit'te; RTX 5090, 70B'yi 8-bit'te işler; A100 ise nicemlenmemiş modelleri destekler.

Stable Diffusion · görsel üretimi

ComfyUI veya Automatic1111 ile SDXL, Flux ya da ince ayarlı Stable Diffusion checkpoint'leri çalıştırın. RTX 4090, standart 1024×1024 SDXL'de dakikada 30'un üzerinde görsel üretir.

ML eğitimi + ince ayar

LoRA, QLoRA, tam ince ayar. A100, 7B-13B nicemlenmemiş ince ayar için en dengeli seçenek; 4× A100 ise düzgün parçalama (FSDP / DeepSpeed) ile 70B'ye kadar çıkar.

3B Render · Blender

RTX kartlarda Cycles + OptiX, animasyon stüdyoları için en hızlı yoldur. RTX 4090 üzerindeki 24 GB VRAM, tek kare prodüksiyon sahnelerinin büyük çoğunluğunu rahatlıkla karşılar.

Ses + görü işlem hatları

Whisper Large, Faster-Whisper, YOLO, Segment Anything. RTX 4090 planı bile bu modellerde gerçek zamanlı çıkarımı fazladan boşlukla çalıştırır.

Uzun süreli toplu işler

Gömme üretimi, erişim hatları, veri kümesi ön işleme. Saatlik ödeyin, işi çalıştırın, çıktının anlık görüntüsünü alın, sunucuyu kapatın. Aynı iş yükü için AWS/GCP kiralamaktan daha ucuz.

80 GB

A100 VRAM

40 Gbps

Yükseliş bağlantısı

CUDA'ya hazır

Görüntü

4 ×

Max GPU'lar

35%

Yıllık indirim

14 days

Para iadesi

Fiyatlandırma

Öne çıkan GPU planları. Saatlik veya yıllık.

Yıllık faturalandırma şu an %35 indirim her GPU planında geçerli.

En çok tercih edilen

1× RTX PRO 6000 Blackwell

96 GB GDDR7 ECC VRAM

$845 /mo

$1300/mo -35%

Şimdi dağıt

14 gün para iade garantisi

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA önceden yüklenmiş

9 GPU planının tümünü görün (1× ile 4× kart)

SSS. GPU VPS

Sık sorulan sorular, net cevaplar.

Cloudzy hangi GPU'leri sunuyor?

Four families: RTX PRO 6000 Blackwell (1×, 96 GB GDDR7 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

GPU'ler ayrılmış mı yoksa paylaşımlı mı?

Adanmış. Her plan, fiziksel GPU'ların tamamını doğrudan size sunar; dilimlenmiş değil, vGPU değil, MIG değil. CUDA çekirdekleri, VRAM, PCIe bant genişliği, hepsi sizin. Çoklu GPU planları, fiziksel donanımın desteklediği durumlarda NVLink kullanır (A100 çoklu GPU planları).

CUDA önceden yüklü mü?

Evet. Her GPU VPS, en güncel kararlı CUDA toolkit, cuDNN ve Nvidia sürücüleriyle birlikte gelir; bunlar Ubuntu imajına önceden yüklenmiş olarak hazırdır. PyTorch, TensorFlow, JAX ve Hugging Face yığını kurulum gerektirmeden çalışır. Belirli bir sürüm yüklemek istiyorsanız, CUDA içermeyen temiz bir Ubuntu imajına geçebilirsiniz.

Ne kadar VRAM alıyorum?

Her GPU için: RTX PRO 6000 Blackwell = 96 GB GDDR7 ECC VRAM, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Çoklu GPU planlarında bu değerler toplanır; 4× A100 planında toplam 320 GB VRAM bulunur. Yukarıdaki plan listesinde sistem RAM ayrı olarak gösterilmektedir.

Stable Diffusion / Llama / Whisper'ı bir GPU VPS üzerinde çalıştırabilir miyim?

Evet. 1× RTX 4090 planı iyi bir başlangıç noktasıdır: SDXL inference, Llama 3 70B (4-bit quantized) veya Whisper Large için yeterli VRAM sunar. Unquantized 70B modeller çalıştırmanız veya LoRA eğitimi yapmanız gerekiyorsa RTX 5090 ya da A100'ye geçin.

Fiyatlandırma Google Cloud / Lambda Labs ile nasıl karşılaştırılır?

Sabit iş yükleri için genellikle daha uygun fiyatlıdır; 'isteğe bağlı' ve 'spot' ayrımı yaparak fiyat farklılaştırmıyoruz, çıkış ücreti de almıyoruz. Rakip fiyatlarını burada paylaşmayacağız, zaten her ay değişiyorlar. 14 günlük para iade garantisiyle mevcut sağlayıcınıza karşı kendi testlerinizle karşılaştırma yapabilirsiniz.

Yıllık indirim var mı?

Evet, her GPU planında yıllık ödemeye özel %35 indirim uygulanır (standart CPU planındaki %50'nin altında kalır çünkü GPU donanımının amortisman maliyeti daha yüksektir). Otomatik yenileme yoktur; her yıllık dönem başlamadan önce fatura gönderilir, böylece beklenmedik ücretlerle karşılaşmadan planınızı düşürebilir, yükseltebilir veya iptal edebilirsiniz.

Ağ bağlantısı hakkında ne söyleyebilirsiniz? Gerçekten 40 Gbps mi?

Evet. Amiral gemimiz Cloud VPS ile aynı 40 Gbps uplink bağlantıları sunuluyor; plan kotası dahilindeki aylık aktarımlarda çıkış ücreti yok. Büyük veri setlerini GPU node'una taşımak ya da buradan almak için oldukça kullanışlı; 100 GB'lık bir Hugging Face modelini hat hızında indirmek yaklaşık 30 saniye sürüyor.

Çok düğümlü eğitim (birden fazla GPU VPS bir arada) çalıştırabilir miyim?

Evet, aynı bölge içinde. Aynı veri merkezindeki VPS sunucuları, milisaniyenin altında gecikmeyle yerel ağı paylaşır. Şu an için InfiniBand bağlantısı sunmuyoruz; standart Ethernet üzerinden çok düğümlü eğitim, ince ayar ve küçük ölçekli dağıtık işler için yeterlidir, ancak büyük ölçekli ön eğitim söz konusu olduğunda bare-metal HPC çözümleriyle rekabet edemez.

GPU planlarında para iade garantisi var mı?

14 gün, hiçbir soru sorulmadan. Tek bir fatura döngüsü içinde iade. CUDA verimini ölçmek, gerçek bir eğitim adımı çalıştırmak ve Cloudzy'nin iş yükünüz için doğru seçim olup olmadığına karar vermek için fazlasıyla yeterli süre.

Bulut devlerinin fiyatlarını ödemeyi bırakın.
Özel GPU'ler üzerinde eğitin.

Bir kart seçin, bir bölge seçin, tıklayın. CUDA zaten kurulu gelir.