Οι κατασκευαστές chip Nvidia και Groq συνήψαν μια μη αποκλειστική συμφωνία αδειοδότησης τεχνολογίας την περασμένη εβδομάδα για να επιταχύνουν και να μειώσουν το κόστος λειτουργίας προεκπαιδευμένων μοντέλων μεγάλων γλωσσών που χρησιμοποιούν τα τσιπ της μονάδας επεξεργασίας γλώσσας της Groq.
Τα τσιπ της μονάδας επεξεργασίας γλώσσας του Groq τροφοδοτούν ερωτήματα chatbot σε πραγματικό χρόνο κατά τη διάρκεια του σταδίου συμπερασμάτων των λειτουργιών τεχνητής νοημοσύνης, διαφορετικά από τη διαδικασία εκπαίδευσης του μοντέλου. Αυτά τα τσιπ επιτρέπουν στα μοντέλα τεχνητής νοημοσύνης να παράγουν απαντήσεις γρήγορα σε εφαρμογές όπως τα chatbots.
Τα τσιπ της Nvidia χειρίζονται επί του παρόντος μεγάλο μέρος της φάσης εκπαίδευσης AI σε ολόκληρο τον κλάδο. Το συμπέρασμα αντιπροσωπεύει ένα σημείο συμφόρησης που η Nvidia δεν ελέγχει πλήρως. Τα τσιπ του Groq στοχεύουν ειδικά σε αυτό το στάδιο συμπερασμάτων, όπου τα μοντέλα τεχνητής νοημοσύνης εφαρμόζουν τη γνώση που αποκτήθηκε από την εκπαίδευση για να παράγουν αποτελέσματα σε νέα δεδομένα.
Η Groq σχεδιάζει τα τσιπ της για συμπέρασμα για να μετακινήσει μοντέλα τεχνητής νοημοσύνης από τον εργαστηριακό πειραματισμό σε πρακτική ανάπτυξη. Το συμπέρασμα προκύπτει μετά την εκπαίδευση, όταν τα μοντέλα επεξεργάζονται αόρατες εισόδους για να παραδώσουν αποτελέσματα σε σενάρια πραγματικού κόσμου.
Οι επενδυτές κατευθύνουν κεφάλαια σε νεοφυείς επιχειρήσεις για να συνδέσουν την έρευνα τεχνητής νοημοσύνης με καθημερινές εφαρμογές μεγάλης κλίμακας. Ο δημοσιογράφος του Axios, Chris Metinko, κάλυψε αυτή την επενδυτική τάση νωρίτερα φέτος.
Οι βελτιωμένες δυνατότητες εξαγωγής συμπερασμάτων επιτρέπουν στις εταιρείες να επιδιώκουν πρόσθετα επιχειρηματικά έργα τεχνητής νοημοσύνης σε μεγαλύτερη κλίμακα. Αυτές οι πρωτοβουλίες αυξάνουν τη ζήτηση για διαδικασίες εκπαίδευσης, γεγονός που με τη σειρά του αυξάνει την ανάγκη για εκπαιδευτικά τσιπ της Nvidia.
Τα μοντέλα τεχνητής νοημοσύνης λειτουργούν σε δύο φάσεις: εκπαίδευση και εξαγωγή συμπερασμάτων. Κατά τη διάρκεια της εκπαίδευσης, τα μοντέλα επεξεργάζονται εκτεταμένα σύνολα δεδομένων, συμπεριλαμβανομένων κειμένου, εικόνων και βίντεο για να δημιουργήσουν εσωτερικές αναπαραστάσεις της γνώσης.
Στη φάση εξαγωγής συμπερασμάτων, τα μοντέλα εντοπίζουν μοτίβα μέσα σε δεδομένα που δεν είχαν δει προηγουμένως και παράγουν απαντήσεις σε συγκεκριμένες προτροπές με βάση αυτά τα μοτίβα. Αυτή η διαδικασία μοιάζει με έναν μαθητή που μελετά υλικό για μια εξέταση και στη συνέχεια εφαρμόζει αυτή τη γνώση κατά τη διάρκεια του τεστ.
Το Groq δημιουργήθηκε το 2016 υπό την ιδρυτική ηγεσία του Jonathan Ross. Η εταιρεία δεν έχει καμία σχέση με το xAI chatbot του Elon Musk που ονομάζεται Grok.
Ο Jonathan Ross, ο πρόεδρος της Groq Sunny Madra και επιλεγμένοι άλλοι υπάλληλοι σχεδιάζουν να ενταχθούν στη Nvidia, όπως αναφέρεται Ο ιστότοπος του Groq. Η Groq σκοπεύει να διατηρήσει ανεξάρτητες δραστηριότητες μετά από αυτές τις μεταβάσεις.
Η συμφωνία αποτελεί μια «μη αποκλειστική συμφωνία αδειοδότησης τεχνολογίας συμπερασμάτων». Αυτή η ρύθμιση μοιάζει με απόκτηση ή απόκτηση. Η Stacy Rasgon περιέγραψε τη δομή σε ένα σημείωμα προς τους πελάτες ότι διατηρεί τη φαντασία του ανταγωνισμού, σύμφωνα με CNBC.
Οι εταιρείες χρησιμοποιούν τέτοιες δομές συναλλαγών για την πλοήγηση σε αντιμονοπωλιακές επιθεωρήσεις ενώ παράλληλα εξασφαλίζουν εξειδικευμένο προσωπικό τεχνητής νοημοσύνης.
- Παράδειγμα Microsoft: Προσέλαβε τον Μουσταφά Σουλεϊμάν, συνιδρυτή του DeepMind.
- Παράδειγμα Google: Επαναδέσμευσε τον Noam Shazeer, συν-εφευρέτη της αρχιτεκτονικής Transformer που είναι κεντρική στα μοντέλα GPT.
Ο Τζόναθαν Ρος, που τώρα μετακομίζει στη Nvidia, ανέπτυξε στο παρελθόν τη Μονάδα Επεξεργασίας Τενσόρ της Google, γνωστή ως TPU. Το κόστος εγκατάστασης καθορίζει τον βαθμό στον οποίο οι εταιρείες χρησιμοποιούν μοντέλα που αναπτύχθηκαν μέσω προηγούμενων προσπαθειών κατάρτισης.
VIA: DataConomy.com




