Der „Silizium-Lotterie“-Effekt: Warum gemietete GPUs unberechenbar sind

Wer eine GPU mietet, geht ein Risiko ein. Denn selbst Chips desselben Modells können erhebliche Leistungsunterschiede aufweisen. Das zeigt eine aktuelle Studie des College of William & Mary, des Jefferson Lab und des Unternehmens Silicon Data. Der Grund: die sogenannte „Silizium-Lotterie“.

„Es gibt keine Garantie, dass ein teureres Modell tatsächlich schneller ist“, erklärt Carmen Li, Gründerin und CEO von Silicon Data. Ihr Unternehmen analysiert GPU-Mietpreise und Benchmarks für Cloud-Computing-Leistungen. Der Effekt ist seit 2022 bekannt, als Forscher der University of Wisconsin nachwiesen, dass Supercomputer je nach GPU-Modell unterschiedlich performen.

Wie groß sind die Unterschiede wirklich?

Silicon Data testete 6.800 Instanzen eines Benchmark-Tools namens SiliconMark auf 3.500 zufällig ausgewählten GPUs von 11 Cloud-Anbietern. Die getesteten GPUs umfassten 11 Nvidia-Modelle, darunter die High-End-Chips H100 PCIe und H200 SXM.

Der Test maß zwei zentrale Leistungskennzahlen:

  • 16-Bit-Gleitkomma-Rechenleistung (gemessen in Billionen Operationen pro Sekunde)
  • Interne Speicherbandbreite (gemessen in Gigabyte pro Sekunde)

Die Ergebnisse waren überraschend: Bei den H100 PCIe-Modellen variierte die Rechenleistung um bis zu 34,5 %, die Speicherbandbreite der H200 SXM-Chips sogar um 38 %.

Was verursacht die Unterschiede?

Oberflächlich betrachtet könnten Faktoren wie Kühlung, Cloud-Konfiguration oder Nutzungsdauer eine Rolle spielen. Doch die Analyse von Silicon Data zeigt: Der Hauptgrund liegt in den Chips selbst – vermutlich durch Herstellungsprobleme.

„Das bedeutet, dass ein teureres Modell nicht zwangsläufig besser performt als ein älteres“, warnt Li. Für Nutzer kann das teuer werden: Wer für eine Hochleistungs-GPU zahlt, erhält möglicherweise nur die Leistung eines günstigeren Modells.

Wie können Nutzer das Risiko minimieren?

Silicon Data empfiehlt, vor der Anmietung einen Benchmark-Test durchzuführen. Jason Cornick, Leiter der Infrastruktur bei Silicon Data, rät: „Führen Sie einen Test wie SiliconMark durch, um die Leistung Ihrer konkreten Instanz mit anderen Daten zu vergleichen.“ So lässt sich sicherstellen, dass man tatsächlich die erwartete Performance erhält.

„Die praktikabelste Lösung ist, die gemietete GPU vorab zu benchmarken. Nur so lässt sich die tatsächliche Leistung einschätzen.“
Jason Cornick, Silicon Data

Fazit: Vorsicht bei GPU-Mieten in der Cloud

Die Studie zeigt: Der GPU-Markt in der Cloud ist alles andere als transparent. Nutzer sollten nicht blind auf Spezifikationen vertrauen, sondern eigene Tests durchführen. Andernfalls könnte das „Silizium-Lotterie“-Risiko teuer werden.