NVIDIA CUDA Tile IR ανοιχτών πηγών στο GitHub

NVIDIA ανοιχτού κώδικα CUDA Tile IR, μια ενδιάμεση αναπαράσταση για προγραμματισμό GPU, στις 4 Δεκεμβρίου. Η εταιρεία κυκλοφόρησε τον κώδικα στο GitHub με την άδεια Apache 2.0, καθιστώντας τον διαθέσιμο για χρήση, τροποποίηση και διανομή από προγραμματιστές και ερευνητές.

Αυτή η πρωτοβουλία ακολουθεί την εισαγωγή της NVIDIA του παραδείγματος προγραμματισμού CUDA Tile GPU με το CUDA 13.1 στις 4 Δεκεμβρίου, σηματοδοτώντας την πιο ολοκληρωμένη επέκταση χαρακτηριστικών της πλατφόρμας από την κυκλοφορία της το 2006. Η κίνηση ευθυγραμμίζεται με την πρόσφατη στρατηγική ανοιχτότητας της NVIDIA για το οικοσύστημα CUDA, ανακαλώντας την αποκλειστική της άδεια για το CUDA Tile IR.

Το CUDA Tile IR βασίζεται στο πλαίσιο MLIR (Multi-Level Intermediate Representation) του έργου LLVM. Το MLIR έχει υιοθετηθεί σε τεχνητή νοημοσύνη και υπολογιστές υψηλής απόδοσης, συμπεριλαμβανομένης της στοίβας λογισμικού υπολογιστών και τεχνητής νοημοσύνης της AMD, του έργου IREE της Google που υποστηρίζει πολλαπλές πλατφόρμες υλικού και της διαλέκτου XeVM MLIR της Intel για το υλικό της. Άλλα πλαίσια IR όπως το ONNX-MLIR, το Torch-MLIR και το MLIRE-AIE χρησιμοποιούν επίσης το σύστημα MLIR.

Η βάση MLIR επιτρέπει ενδεχομένως τη μετατροπή του CUDA Tile IR σε άλλα backend, προσφέροντας μια τεχνική βάση για την υποστήριξη σχετικών μοντέλων υπολογιστών σε περιβάλλοντα GPU ή επιταχυντών που δεν ανήκουν στην NVIDIA. Το Open-source CUDA Tile IR αναμένεται να προωθήσει έργα συμβατότητας και μεταφοράς, συμπεριλαμβανομένου του ZLUDA.

Το έργο ανοιχτού κώδικα CUDA Tile περιλαμβάνει μια διάλεκτο Tile MLIR, εγγενείς συνδέσεις API Python, αναπαράσταση bytecode και μια σουίτα δοκιμής συμμόρφωσης. Η NVIDIA δήλωσε ότι το CUDA Tile IR είναι «μια ενδιάμεση αναπαράσταση και υποδομή μεταγλωττιστή βασισμένη σε MLIR για βελτιστοποίηση πυρήνα CUDA, με έμφαση στην υποστήριξη υπολογιστικών μοτίβων που βασίζονται σε πλακίδια και βελτιστοποιημένη για μονάδες Tensor Core NVIDIA». Η εταιρεία πρόσθεσε ότι το έργο «παρέχει ένα πλήρες οικοσύστημα για την έκφραση και τη βελτιστοποίηση υπολογισμού πλακιδίων για τις NVIDIA GPU, με στόχο την απλοποίηση της ανάπτυξης πυρήνων CUDA υψηλής απόδοσης παρέχοντας αφαιρέσεις για κοινά μοτίβα πλακιδίων, διαχείριση ιεραρχίας μνήμης και βελτιστοποιήσεις για συγκεκριμένες GPU».