Την Πέμπτη, το Ινστιτούτο Laude ανακοίνωσε η πρώτη της παρτίδα επιχορηγήσεων Slingshotsμε στόχο την «προώθηση της επιστήμης και της πρακτικής της τεχνητής νοημοσύνης».
Σχεδιασμένο ως επιταχυντής για ερευνητές, το πρόγραμμα Slingshots προορίζεται να παρέχει πόρους που δεν θα ήταν διαθέσιμοι στα περισσότερα ακαδημαϊκά περιβάλλοντα, είτε πρόκειται για χρηματοδότηση, υπολογιστική ισχύ ή υποστήριξη προϊόντων και μηχανικής. Σε αντάλλαγμα, οι παραλήπτες δεσμεύονται να παράγουν κάποιο τελικό προϊόν εργασίας, είτε πρόκειται για εκκίνηση, βάση κώδικα ανοιχτού κώδικα ή άλλο είδος τεχνουργήματος.
Η αρχική κοόρτη είναι 15 έργα, με ιδιαίτερη έμφαση στο δύσκολο πρόβλημα της αξιολόγησης της τεχνητής νοημοσύνης. Μερικά από αυτά τα έργα θα είναι γνωστά στους αναγνώστες του TechCrunch, συμπεριλαμβανομένου του σημείου αναφοράς κωδικοποίησης γραμμής εντολών Terminal Bench και της πιο πρόσφατης έκδοσης του μακροχρόνιου έργου ARC-AGI.
Άλλοι υιοθετούν μια νέα προσέγγιση σε ένα μακροχρόνιο πρόβλημα αξιολόγησης. Το Formula Code, που κατασκευάστηκε από ερευνητές στο Caltech και στο UT Austin, στοχεύει να παράγει μια αξιολόγηση της ικανότητας των πρακτόρων AI να βελτιστοποιούν τον υπάρχοντα κώδικα, ενώ το BizBench με έδρα την Κολούμπια προτείνει ένα ολοκληρωμένο σημείο αναφοράς για τους “white-collar AI agents”. Άλλες επιχορηγήσεις διερευνούν νέες δομές για ενισχυτική μάθηση ή συμπίεση μοντέλων.
SWE-Πάγκος Ο συνιδρυτής John Boda Yang είναι επίσης μέρος της κοόρτης, ως επικεφαλής του νέου έργου CodeClash. Εμπνευσμένο από την επιτυχία του SWE-Bench, το CodeClash θα αξιολογήσει τον κώδικα μέσω ενός δυναμικού πλαισίου βασισμένου στον ανταγωνισμό, το οποίο ο Yang ελπίζει ότι θα
«Πιστεύω ότι οι άνθρωποι που συνεχίζουν να αξιολογούν σε βασικά σημεία αναφοράς τρίτων οδηγούν στην πρόοδο», είπε ο Yang στο TechCrunch. «Ανησυχώ λίγο για ένα μέλλον όπου τα σημεία αναφοράς θα γίνονται συγκεκριμένα για τις εταιρείες».
Via: techcrunch.com







