KI-Hardware

Für das Training großer KI-Modelle bedarf es starker Rechenpower. Mit WestAI können Sie auf die spezialisierte High Performance Computing (HPC) Recheninfrastruktur der RWTH Aachen und des Forschungszentrums Jülich zugreifen. Der Zugang erfolgt explorativ für Forschungseinrichtungen und Unternehmen.

Nutzen Sie unsere KI-Infrastruktur für Ihre KI-Idee!

So nehmen Sie die KI-Rechenressourcen in Anspruch

Forschungseinrichtungen

Wenn Sie aus dem akademischen Umfeld kommen und Interesse an Rechenzeit auf der High Performance Computing (HPC) Infrastruktur von WestAI haben, können Sie direkt einen Antrag einreichen. Der Antrag wurde sehr schlank gestaltet und kann – durch die unten beschriebenen fünf Schritte – mit wenig Aufwand realisiert werden.

Wichtig: Bitte beachten Sie die projektbezogenen Voraussetzungen.

Unternehmen

Sie gehören zu einem kleinen oder mittelständischen Unternehmen oder Start-up und verfolgen ein spannendes KI-Forschungsprojekt? Sie haben eine Idee für eine KI-Lösung, aber Ihnen fehlt die notwendige Hardware? Wir unterstützen Sie gerne persönlich bei der Antragstellung für unsere KI-Rechenressourcen und beraten Sie auch darüber hinaus. Kontaktieren Sie uns dafür bitte direkt.

Hinweis: Zum aktuellen Zeitpunkt können wir Ihnen diese Leistungen kostenlos anbieten. Es können bis zu 10.000 GPU-Stunden in Anspruch genommen werden. Bei großem Andrang auf die Systeme behalten wir uns vor, den Umfang der Rechenzeitprojekte zu reduzieren.

Ihre Partner im High Performance Computing

Mit jahrzehntelanger Erfahrung sind das IT Center der RWTH Aachen und das Jülich Supercomputing Centre am Forschungszentrum Jülich (FZJ) Ihre Experten für High Performance Computing (HPC) bei WestAI. Wir garantieren nicht nur einen stabilen Betrieb unserer Rechencluster, sondern sorgen auch für kontinuierliche Updates des Softwarestacks und eine fortschreitende Modernisierung der Infrastruktur. Dank unserer etablierten Prozesse zur Verarbeitung von Supportanfragen können wir zügig auf Ihre Bedürfnisse reagieren. Mit uns als Partner überlassen Sie die anspruchsvolle Verantwortung für HPC-Infrastruktur ausgewiesenen IT-Profis, damit Forschung und Entwicklung im Vordergrund stehen können.
WestAI hat mit seinen Partnern, der RWTH und dem FZJ, einfache Zugänge für Sie zu spezialisierter Recheninfrastruktur für das Training großer KI-Modelle geschaffen.

© Forschungszentrum Jülich / Sascha Kreklau

© NHR4CES

Unsere KI-Hardware im Detail

Um das Training großer KI-Modelle zu ermöglichen, bietet WestAI spezialisierte HPC-Recheninfrastruktur an. Insgesamt verfügen wir über 31 Server, die jeweils mit vier NVIDIA H100 GPUs ausgestattet sind. Die genauen Spezifikationen können mit einem Klick auf die folgenden Module entnommen werden.

JURECA / Forschungszentrum Jülich

16 Rechenknoten mit jeweils

  • 2x Intel Xeon Platinum 8462Y (Sapphire Rapids) CPUs
  • Insgesamt 64 Rechenkernen pro Knoten @2.8 GHz (Base Freq.)
  • 512 GB DDR5 RAM pro Knoten
  • 4x NVIDIA H100 GPUs (inkl. NVLink Interconnect)
  • 94 GB HBM2e pro GPU

 

CLAIX-2023 / RWTH Aachen

15 Rechenknoten mit jeweils

  • 2x Intel Xeon Platinum 8468 (Sapphire Rapids) CPUs
  • Insgesamt 96 Rechenkernen pro Knoten @2.1 GHz (Base Freq.)
  • 512 GB DDR5 RAM pro Knoten
  • 4x NVIDIA H100 GPUs (inkl. NVLink Interconnect)
  • 94 GB HBM2e pro GPU

Mehr Details

Beide Systeme verfügen über ein InfiniBand-Hochleistungsnetzwerk, welches die einzelnen Rechenknoten miteinander verbindet.

Die Hardware wird von uns durch einen ausgedehnten Softwarestack komplementiert. Dieser beinhaltet alle gängigen Machine Learning Frameworks wie z. B. Scikit-Learn, PyTorch und TensorFlow. Darüber hinaus besteht die Möglichkeit, eigene Apptainer-Container mitzubringen und auf dem System einzusetzen. Damit können unseren Nutzenden zügig und ohne viel Vorbereitungszeit mit ihrer Forschung beginnen.

Wie bei allen großen HPC-Systemen setzen wir Linux auf unseren Rechenclustern ein. Nutzende interagieren üblicherweise über die Konsole mit diesem. Für unerfahrene Nutzende kann die fehlende grafische Benutzeroberfläche eine große Einstiegshürde darstellen. Wir bieten daher auch JupyterHub-Instanzen an. Hierüber können Jupyter Notebooks über den Browser direkt auf dem Rechencluster ausgeführt werden. Diese benutzerfreundliche Umgebung ermöglicht es, das System zu testen und Anwendungen effizient zu entwickeln. Sollten Sie bei diesem Prozess Unterstützung benötigen, so helfen wir Ihnen auch in dieser Phase gerne weiter.

Voraussetzungen für Rechenzeitanträge

Rechenzeitanträge können zurzeit ausschließlich von Personen aus dem akademischen Umfeld gestellt werden. Personen aus dem Unternehmenskontext helfen wir gerne persönlich bei der Antragstellung – kontaktieren Sie uns dafür bitte direkt.

Jeder Antrag muss einen Principle Investigator (PI) und eine Person of Contact (PC) mit E-Mail-Adressen benennen, welche als wissenschaftliche und technische Hauptansprechpersonen für das Projekt fungieren. Mehr Informationen zu den Voraussetzungen für Rechenzeitanträge können mit einem Klick auf das folgende Modul entnommen werden.

Mehr Informationen

Wichtig: Folgende Nutzungsberechtigte dürfen als Principal Investigator Rechenzeitprojekte bei WestAI beantragen:

  • Leitende (i. d. R. promovierte) Wissenschaftler*innen, die einer staatlichen oder staatlich anerkannten, institutionell akkreditierten Hochschule in Deutschland angehören (inkl. Hochschulen der angewandten Wissenschaften).
  • Leitende (i. d. R. promovierte) Wissenschaftler*innen, die einer öffentlichen oder staatlich anerkannten Forschungseinrichtung in Deutschland angehören.

Für einen Rechenzeitantrag müssen außerdem folgende Anforderungen erfüllt sein bzw. folgende Informationen bereitgestellt werden:

  • Ein Titel (250 Zeichen) und eine Projektbeschreibung (500 bis 2000 Zeichen – ca. eine Seite). Diese Beschreibung sollte einen wissenschaftlichen und projektorientierten Charakter haben. Der KI-Bezug und GPU-Bedarf Ihres Vorhabens sollte aus der Beschreibung ersichtlich werden.
  • Eine Angabe der Forschungsschwerpunkte. Diese erfolgt nach DFG-Richtlinien, kann aber bequem über Dropdown-Listen aus Haupt- und Unterkategorien ausgewählt werden.
  • Eine technische Beschreibung des Vorhabens (300 bis 1000 Zeichen – ca. eine halbe Seite), z. B. welche Codes, Frameworks, Datensätze oder Modelle trainiert und verwendet werden.

Hinweis: Das Online-Formular für Rechenzeitanträge ist in englischer Sprache und kann bei Bedarf auch auf Deutsch ausgefüllt werden.

Da unser Angebot speziell auf GPU Ressourcen und KI ausgelegt ist, beantragen Sie bitte in den anderen Fällen Rechenzeit bei folgenden alternativen Anbietern:

In fünf Schritten zu Ihrer Rechenzeit

Sie kommen aus dem akademischen Umfeld? Dann können Sie Ihren Antrag für Rechenzeit via WestAI direkt stellen. Anhand der folgenden Anleitung erfahren Sie Schritt für Schritt, wie Sie Ihren Rechenzeitantrag stellen können. Sollten Sie Ihre Anforderungen nicht genau kennen oder Unterstützung benötigen, beraten wir Sie gerne.

Oder Sie kommen aus dem Unternehmenskontext? Dann helfen wir Ihnen gerne bei der Antragstellung. Nehmen Sie einfach Kontakt mit uns auf.

Schritt 1: Standortwahl

Besuchen Sie unser Online-Formular für WestAI-Rechenzeitanträge über den „Joint Application, Review, and Dispatch Service“ (JARDS) unter folgendem Link.

Zuerst suchen Sie den Standort (RWTH Aachen oder FZJ) aus, bei dem die Rechenzeit beantragt werden soll. Um die richtige Wahl zu treffen, sollten folgende Besonderheiten der einzelnen Systeme in Betracht gezogen werden:

CLAIX-2023 der RWTH Aachen

  • Erlaubt eine geteilte Nutzung von Rechenknoten (Shared Nodes), sodass z. B. auch Jobs ausgeführt werden, die nur 1 GPU benötigen.
  • Die 15 GPU-Rechenknoten, die für WestAI angeschafft wurden, sind in eine größere Partition aus insgesamt 52 Systemen eingebettet.

JURECA des Jülich Supercomputing Centre (JSC)

  • Hier ist eine geteilte Nutzung von Knoten aktuell noch nicht vorgesehen. Antragsstellende sollten deshalb in der Lage sein, mindestens einen ganzen Knoten mit 4x NVIDIA H100 GPUs auslasten zu können.
  • Rechenzeitprojekte am JSC verfügen über höhere Datei Quotas (Datenmenge und Anzahl Files). Sollten Sie in Ihrem Projekt größere Datensätze oder eine hohe Anzahl von Dateien prozessieren oder ablegen müssen, ist das JSC hier die richtige Wahl.
Schritt 2: Login / Anmeldung

Jetzt erfolgt die Anmeldung. Das Login-Verfahren erfolgt entweder über RegApp (falls Sie bereits einen HPC-Account an der RWTH Aachen haben) oder über eine E-Mail-Verifizierung.

Schritt 3: Antragsstellung

Ausfüllen des Rechenzeitantrags, u. a. mit Angabe von Projektdaten und Informationen zu benötigten Ressourcen. Beachten Sie hierzu die oben beschriebenen Voraussetzungen und bereitzustellende Informationen. Das Formular ist in englischer Sprache, kann aber auch auf Deutsch ausgefüllt werden.

Bitte beachten Sie außerdem, dass der Umfang von Rechenzeitprojekten innerhalb von WestAI auf 10.000 GPU-Stunden begrenzt ist. Die Dauer von WestAI-Projekten beträgt standardmäßig 12 Monate und kann nicht verlängert werden.

Sollten Sie einen höheren Ressourcen-Bedarf haben oder im Anschluss Ihr Vorhaben fortführen wollen, können Sie größere Anträge über folgende Links beantragen:

Hinweis: Bei großem Andrang auf die Systeme behalten wir uns vor, den Umfang der Rechenzeitprojekte zu reduzieren.

Schritt 4: Finalisierung

Finalisierung des Antrags. Dies kann auf der letzten Seite des Antrags vorgenommen werden. Nach der Finalisierung wird eine Zusammenfassung des Antrags per E-Mail an den angegebenen PI verschickt, welcher das Dokument unterschreiben muss. Der unterschriebene Antrag muss danach ggf. noch auf der JARDS-Webseite hochgeladen werden.

Schritt 5: Prüfung

Fertig! Ihr Rechenzeitantrag wird nun von uns geprüft. Nach der Begutachtung werden Sie über den Bewilligungsentscheid und die weiteren Schritte informiert.

Wir freuen uns, wenn Sie mit unserer Rechenpower Ihre KI-Idee realisieren können!

Nehmen Sie Kontakt mit uns auf

Sie haben Fragen oder sind an einer Zusammenarbeit interessiert?

Schreiben Sie uns eine E-Mail – wir beraten Sie gerne.

Folgen Sie uns auf LinkedIn

Sie möchten keine Updates, News und Events zu WestAI verpassen oder schneller mit Ihrem Netzwerk teilen?
Folgen Sie uns gerne auf LinkedIn!