MIT stellt effizientere Methode zur Abschätzung des Stromverbrauchs von KI vor
Angesichts des rasanten Wachstums der künstlichen Intelligenz werden Rechenzentren bis 2028 nach Schätzungen des Lawrence-Berkeley-Nationallaboratoriums bis zu 12 Prozent des gesamten US-Stromverbrauchs ausmachen. Um die Energieeffizienz zu verbessern und die Nachhaltigkeit von KI-Projekten zu gewährleisten, haben Forscher des MIT und des MIT-IBM Watson AI Lab ein neues Werkzeug entwickelt, das den Stromverbrauch von KI-Arbeitslasten auf speziellen Prozessoren in Sekundenschnelle vorhersagt. Bislang benötigten traditionelle Simulationsmethoden für eine genaue Energieabschätzung Stunden oder sogar Tage, da sie jede einzelne Komponente einer Grafikverarbeitungseinheit (GPU) schrittweise emulieren mussten. Dies macht sie für den praktischen Einsatz unpraktikabel, wenn Entwickler oder Betreiber schnell zwischen verschiedenen Algorithmen und Konfigurationen wählen möchten, um die energieeffizienteste Lösung zu finden. Das neue Verfahren umgeht diese Ineffizienz, indem es sich auf wiederkehrende Muster in typischen KI-Arbeitslasten stützt. Da Entwickler Programme oft optimieren, um die Parallelverarbeitung und Datenübertragung effizient zu gestalten, entstehen regelmäßige Strukturen, die als Basis für eine schnelle Schätzung dienen können. Das entwickelte Modell namens EnergAIzer erfasst diese Nutzungsmuster und erzeugt in wenigen Sekunden einen verlässlichen Wert für den Energieverbrauch. Dabei geht die Methode über eine reine Berechnung hinaus, um auch variable Kosten zu berücksichtigen, die durch Startvorgänge, Hardware-Schwankungen oder Datenübertragungskonflikte entstehen. Durch die Einbeziehung realer Messdaten aus GPUs konnten die Forscher Korrekturen ableiten, die die Genauigkeit des Modells erhöhen. In Tests zeigte EnergAIzer eine Abweichung von nur etwa acht Prozent im Vergleich zu herkömmlichen, langwierigen Methoden, obwohl die Schätzung in Sekunden erfolgt. Das Tool ist flexibel einsetzbar und kann auf eine breite Palette aktueller sowie zukünftiger Hardware-Konfigurationen angewendet werden, solange sich die Hardware-Architektur nicht drastisch ändert. Datenzentrum-Betreiber können damit Ressourcen über mehrere Modelle und Prozessoren hinweg effizienter verteilen. Gleichzeitig erhalten Algorithmus-Entwickler und Anbieter die Möglichkeit, den potenziellen Energiebedarf eines neuen Modells bereits vor der Bereitstellung zu bewerten. Kyungmi Lee, leitende Autorin der Studie und Postdoktorandin am MIT, betont, dass diese schnelle und direkte Rückmeldung Entwickler und Betreiber ermutigen sollte, energiebewusstere Entscheidungen zu treffen. Die Forschung wurde unter anderem vom MIT-IBM Watson AI Lab finanziert und wurde kürzlich auf dem IEEE International Symposium on Performance Analysis of Systems and Software vorgestellt. Zukünftige Arbeiten sollen das Modell auf neueste GPU-Konfigurationen testen und skalieren, um den Energiebedarf in Umgebungen zu berechnen, in denen mehrere GPUs gemeinsam an einer Arbeitslast arbeiten. Ziel ist es, ein umfassendes Tool bereitzustellen, das entlang der gesamten Technologie-Kette, von Hardware-Designern bis zu Software-Entwicklern, für ein besseres Bewusstsein hinsichtlich des Stromverbrauchs sorgt. Mit diesem Schritt wird ein wichtiges Instrument zur Bewältigung der wachsenden Nachhaltigkeitsanforderungen in der KI-Industrie bereitgestellt.
