Verschleißen GPUs bei starker Nutzung?

Verschleißen GPUs bei starker Nutzung?

Wenn Sie auf Ihrer GPU intensive Spiele, GPU-Computing, Grafik-Rendering, Folding@home oder Krypto-Mining planen, machen Sie sich möglicherweise Sorgen, dass Ihre GPU bei starker Beanspruchung verschleißt. Aber wird es? Wir werden nachforschen.

Ja, aber es ist schwer

Viele der Informationen, die Sie im Internet über die Lebensdauer von Grafikkarten finden, sind anekdotisch, und die Zahlen können stark variieren, je nachdem, wen Sie fragen. Mit Hunderten von verschiedenen Grafikkartenmodellen, die in den letzten zehn Jahren veröffentlicht wurden, ist es schwierig, die Daten zu so unterschiedlichen Karten auf bloße Verallgemeinerungen einzugrenzen.

Was wir bisher wissen, ist Folgendes: Laut dem Bericht des deutschen Händlers 2020 haben die neuesten Grafikkarten eine Gesamtausfallrate von etwa 2-5% (gemessen in Rücksendungen an den Händler). Und im Jahr 2021 veröffentlichte Nvidia immer noch Treiber-Updates für Karten, die etwa 9-10 Jahre alt waren (wie die GTX 600-Serie), sodass Sie ein Jahrzehnt einer gut gemachten GPU-Karte erwarten können, obwohl diese wie wir Ausreißer sein könnten mal sehen weiter.

Ungeachtet der Zahlen ist hier schwere Physik am Werk. Die in GPU-Karten verwendeten Materialien und Komponenten sind keine Zauberei: Je mehr Sie sie verwenden, desto schneller verschleißen sie und desto wahrscheinlicher ist es, dass sie vollständig ausfallen. Eine intensive Nutzung wirkt sich also auf die Lebenserwartung aus.

Ob Sie einen Fehler in Ihrer GPU-Karte sehen, hängt von ganz anderen Variablen ab, darunter wie stark die GPU verwendet wurde, Art und Ausmaß der Temperaturschwankungen im Schaltkreis, wie oft die Karte ein- und ausgeschaltet wurde und wie sauber die Betriebsumgebung ist.

Da die GPU-Karte ein komplexes Gerät mit vielen Teilen ist, kann jedes auf seine eigene Weise ausfallen oder sich verschlechtern. Wir werfen einen Blick auf einige Hauptteile einer GPU-Karte und sehen, wie sie sich bei starker Beanspruchung im Laufe der Zeit abnutzen können.

Das Wichtigste zuerst: Lüfter

Von allen Teilen einer Grafikkarte, die überhaupt ausfallen können, müssen wir auf die Kühlgebläse (oder Lüfter) hinweisen, die die physisch beweglichen Teile sind. Lüfter kühlen Ihre GPU, indem sie heiße Luft vom GPU-Chip (mit Kühlkörper) wegziehen, damit er weiterarbeiten kann.

Warum ist Hitze schlecht? Bei genügend Wärme arbeiten die Transistoren nicht richtig , was bedeutet, dass die GPU-Karte nicht funktioniert. Bei noch mehr Hitze können die Transistoren in den Mikroschaltkreisen der Karte irreparabel beschädigt werden .

Im Laufe der Zeit werden Kühlventilatoren oft durch Staub verstopft, wodurch ihre Fähigkeit, Luft effizient zu bewegen, verringert wird. Oder die Lüfter können komplett ausfallen, wenn die interne Schmierung versagt. Jedes Skript erhöht die Temperatur der GPU.

Jede GPU schützt sich selbst vor Überhitzung mit thermischer Drosselung, die die GPU verlangsamt, um ihre Betriebstemperatur zu senken. Dies schränkt die Leistung stark ein. Wenn Sie also eine GPU haben, die plötzlich lauter als normal ist (Lüfter dreht sich schneller) oder schlechter arbeitet, reinigen Sie die Lüfter und den Kühlkörper Ihrer GPU gründlich mit Druckluft.

Wenn der GPU-Lüfter vollständig ausgefallen ist, kann er normalerweise ersetzt werden, wenn Sie einen ähnlichen Lüfter bei Ihrem Computerteilelieferanten finden.

Ein weiterer Verdächtiger: Fehlerhafte Wärmeleitpaste

Zwischen jedem Kühlkörper und dem GPU-Chip befindet sich eine Schicht aus wärmeleitendem Material, z. B. Kitt oder Paste, um die Wärmeübertragung vom GPU-Chip zum Kühlkörper zu unterstützen.

Im Laufe der Zeit kann Wärmeleitpaste reißen oder an Wirksamkeit verlieren. In diesem Fall wird der Kühlkörper nicht so effizient gekühlt und die Temperatur der GPU steigt. Wie wir oben im Lüfterabschnitt gesehen haben, führen hohe GPU-Temperaturen zu einer thermischen Drosselung, die Ihre GPU verlangsamt.

Die beste Lösung ist in diesem Fall , die Wärmeleitpaste selbst auszutauschen. Sie können Wärmeleitpaste von Computerhardware-Händlern kaufen.

Fehler in anderen Komponenten, Lötmittel

Neben dem GPU-Chip wird die Grafikkarte Dutzende anderer elektronischer Komponenten wie Kondensatoren, Widerstände, Speicherchips und mehr enthalten. Jede dieser Komponenten könnte möglicherweise aufgrund starker Beanspruchung oder zu hoher Hitzeeinwirkung ausfallen. Manche scheitern eher als andere.

Insbesondere Kondensatoren fallen mit der Zeit aus . Sie sind empfindlich gegenüber häufigen Temperaturschwankungen und einige von ihnen haben Mängel in der ersten Produktion. Wenn Sie versiert genug sind, um Kondensatorprobleme zu beheben, können Sie möglicherweise fehlerhafte Kondensatoren auf einer GPU-Karte ersetzen, wenn Sie gleichwertige Ersatzteile finden.

Darüber hinaus kann das Lötmittel, das Chips und Komponenten mit der Leiterplatte der GPU-Karte verbindet, altern und im Laufe der Zeit aufgrund von häufigen Temperaturänderungen, grober Handhabung, unsachgemäßer Lagerung oder Überhitzung reißen. Also ja, eine starke GPU-Nutzung kann das Risiko von Lötstellenfehlern erhöhen. Das Reparieren schlechter Lötstellen kann technisch schwierig, aber nicht unmöglich sein .

Fehler im GPU-Chip selbst

Bleibt also die Frage: Kann sich ein GPU-Chip bei starker Beanspruchung mit der Zeit abnutzen? Die Antwort lautet ja, theoretisch, unter extremen Umständen. Aber Sie werden höchstwahrscheinlich lange vorher eine andere Komponente der Grafikkarte ausfallen sehen.

Der GPU-Chip Ihrer Grafikkarte enthält Millionen oder Milliarden von Transistoren, die in ein Stück Silizium geätzt sind. Transistoren altern mit der Zeit , was sich auf ihre Leistung auswirkt. Wenn genügend Transistoren schiefgehen, fällt der Chip aus.

Laut Semiconductor Engineering gibt es mehrere Hauptgründe, warum Transistoren im Laufe der Zeit aufgrund von Alterung ausfallen ( einer davon ist Hitze ), und je kleiner das Element auf dem Chip ist, desto wahrscheinlicher sind Fehler. Experten vermuten, dass Computerchips, die heute hergestellt werden, nicht so lange halten wie Chips, die in den 1990er Jahren hergestellt wurden, aber die genaue Lebensdauer vorherzusagen, ist immer noch eine Vermutung , weil die Technologie so neu ist.

NVIDIA veröffentlicht derzeit keine MTBF -Bewertungen (Mean Time Between Failures) für seine Consumer-Grafikkarten, aber das Unternehmen  veröffentlicht sie für einige seiner industriellen und geschäftlichen Grafikbeschleuniger. Beispielsweise gibt das Datenblatt für den Tesla K20X GPU Accelerator an, dass die MTBF der Karte (bei 35°C/95F) 14,7 Jahre für eine „unkontrollierte Umgebung“ und 23,8 Jahre für eine „kontrollierte Umgebung“ beträgt. (Beachten Sie, dass industrielle Grafikhardware im Allgemeinen als zuverlässiger und besser in der Lage ist, einer starken Beanspruchung standzuhalten als Consumer-Grafikhardware.)

Interessanterweise können wir diese theoretische Zahl mit den exakten Felddaten vergleichen. Eine der wenigen empirischen Studien zur GPU-Lebensdauer stammt aus einem Papier aus dem Jahr 2020 mit dem Titel „ GPU Lifespan on the Titan Supercomputer: Survival and Reliability Analysis “, das vom Oak Ridge National Laboratory verfasst wurde. Das Papier berichtet über die Zuverlässigkeit von 18.688 Nvidia K20X Kepler-GPU-Karten, die fast 7 Jahre lang (2012-2019) im inzwischen ausgemusterten Supercomputer Cray XK7 Titan verwendet wurden.

Nach einigen anfänglichen Ausfällen aufgrund von Verbindungsproblemen stellten sie fest, dass die XK7-Grafikkarten bis 2016 (etwa 3-4 Jahre) relativ hoch zuverlässig waren, als viele von ihnen anfingen zu versagen. Aber weißt du was? Sie führten die meisten Fehler in der ersten Charge von Karten (vor dem Austausch) auf einen fehlerhaften Widerstand auf der Platine der Grafikkarte zurück, nicht auf den GPU-Chip selbst. Insgesamt stellten die Autoren der Studie fest, dass die MTBF stark genutzter K20X-Grafikkarten bei etwa 3 Jahren liegt (nicht 14-23 Jahre wie in Nvidias Datenblatt angegeben), wobei einige der heißesten Karten im Kern als erste ausfallen. Sie kamen zu dem Schluss, dass „die Zuverlässigkeit der GPU von der Wärmeableitung abhängt“.

Die Wahrscheinlichkeit ist also hoch, dass, wenn Sie Ihre Grafikkarte so stark wie einen der größten Supercomputer der Welt (zu dieser Zeit) nutzen, sie sich schneller abnutzt und andere Komponenten wie Lüfter und Widerstände lange vor dem Ausfall des GPU-Chips selbst ausfallen wie lange Sie erhalten, hängt von Faktoren ab, die wir nicht vorhersagen können.

Schließlich ist Hitze der Feind

Letztendlich ist nach allen Quellen, die wir gelesen haben, der wichtigste Faktor bei der Bestimmung, wie lange eine GPU-Karte hält, wie heiß sie ist. Je heißer die Karte, desto schneller verschlechtern sich alle ihre Komponenten. Je heißer die Karte ist, desto mehr reduziert sie die Leistung, um einen katastrophalen Ausfall zu verhindern. Eine gute Kühlung verlängert die Lebensdauer Ihrer Karte und steigert ihre Leistung.

Egal, ob Sie sich für Kryptowährungen oder Spiele interessieren, solange Ihre Grafikkarte mit sauber laufenden Lüftern und effektiver Wärmeleitpaste kühl genug gehalten wird, haben Sie wahrscheinlich eine Hochleistungskarte, die, wenn Sie Glück haben, genauso lange halten kann als veraltet und Sie aktualisieren.

Wenn Sie erwägen, eine gebrauchte GPU zu kaufen, sollten Sie unbedingt ihre Geschichte berücksichtigen, einschließlich der Art und Weise, wie ihr Besitzer sie gehandhabt und verwendet hat. Stärker genutzte Karten (jene, die jetzt funktionieren) werden eher kurzfristig gut funktionieren, sind aber langfristig anfälliger für Ausfälle. Wir können die Lebensdauer der Karte nicht genau bestimmen, aber bei starker Nutzung verschleißt die Grafikkarte definitiv schneller.

Viel Glück!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert