Οι ερευνητές του MIT ανέπτυξαν ένα νέο σύστημα ομιλίας σε πραγματικότητα που συνδυάζει την τρισδιάστατη τεχνητή νοημοσύνη με ρομποτική συναρμολόγηση για την κατασκευή αντικειμένων κατά παραγγελία. Το σύστημα δημιούργησε αντικείμενα όπως έπιπλα σε μόλις πέντε λεπτά.
Αυτή η ροή εργασίας που βασίζεται στο AI επιτρέπει στους χρήστες να παρέχουν προφορική είσοδο σε έναν ρομποτικό βραχίονα, «ομιλώντας αντικείμενα στην ύπαρξη». Η τεχνολογία αξιοποιεί την επεξεργασία φυσικής γλώσσας, την τρισδιάστατη τεχνητή νοημοσύνη και τη ρομποτική συναρμολόγηση για τον εξορθολογισμό της διαδικασίας κατασκευής.
Ο Alexander Htet Kyaw, μεταπτυχιακός φοιτητής του MIT και υπότροφος της Morningside Academy for Design (MAD), δήλωσε: «Συνδέουμε την επεξεργασία φυσικής γλώσσας, το 3D Generative AI και τη ρομποτική συναρμολόγηση». Πρόσθεσε ότι αυτές οι ταχέως εξελισσόμενες ερευνητικές περιοχές δεν είχαν προηγουμένως συνδυαστεί για να δημιουργήσουν φυσικά αντικείμενα από μια απλή προτροπή ομιλίας.
Το σύστημα λαμβάνει προφορικές εντολές, όπως «Θέλω ένα απλό σκαμνί» και στη συνέχεια κατασκευάζει αντικείμενα από αρθρωτά στοιχεία. Μέχρι στιγμής, οι ερευνητές έχουν χρησιμοποιήσει το σύστημα για να κατασκευάσουν σκαμπό, ράφια, καρέκλες, ένα μικρό τραπέζι και διακοσμητικές φόρμες, συμπεριλαμβανομένου ενός αγάλματος σκύλου.
Το σύστημα ομιλίας σε πραγματικότητα επεξεργάζεται τα αιτήματα των χρηστών σε διάφορα στάδια:
- Αναγνώριση ομιλίας: Ένα μεγάλο μοντέλο γλώσσας επεξεργάζεται την ομιλούμενη είσοδο του χρήστη.
- 3D Generative AI: Το σύστημα δημιουργεί μια αναπαράσταση ψηφιακού πλέγματος του επιθυμητού αντικειμένου.
- Αλγόριθμος Voxelization: Το τρισδιάστατο πλέγμα αναλύεται σε συγκεκριμένα εξαρτήματα συναρμολόγησης.
- Γεωμετρική επεξεργασία: Το συγκρότημα που δημιουργείται από την τεχνητή νοημοσύνη τροποποιείται για να ληφθούν υπόψη οι πραγματικοί περιορισμοί κατασκευής, όπως ο αριθμός εξαρτημάτων, οι προεξοχές και η γεωμετρική συνδεσιμότητα.
- Ακολουθία συναρμολόγησης και σχεδιασμός διαδρομής: Το σύστημα δημιουργεί μια εφικτή ακολουθία συναρμολόγησης και αυτοματοποιημένο σχεδιασμό διαδρομής για τον ρομποτικό βραχίονα.
Σε αντίθεση με την τρισδιάστατη εκτύπωση, η οποία συχνά διαρκεί ώρες ή μέρες, αυτό το σύστημα ολοκληρώνει την κατασκευή αντικειμένων μέσα σε λίγα λεπτά. Κάνει επίσης τη σχεδίαση και την κατασκευή πιο προσιτή σε άτομα χωρίς εξειδίκευση στην τρισδιάστατη μοντελοποίηση ή τον ρομποτικό προγραμματισμό.
Ο Kyaw ανέπτυξε το αρχικό σύστημα ενώ παρακολουθούσε το μάθημα του καθηγητή Neil Gershenfeld, «How to Make Almost Anything». Συνέχισε το έργο στο MIT Center for Bits and Atoms (CBA), συνεργαζόμενος με τους μεταπτυχιακούς φοιτητές Se Hwan Jeon του Τμήματος Μηχανολόγων Μηχανικών και Miana Smith του CBA.
Η ομάδα σχεδιάζει να βελτιώσει την ικανότητα μεταφοράς βάρους των επίπλων εφαρμόζοντας πιο στιβαρές συνδέσεις μεταξύ αρθρωτών κύβων, που ξεπερνούν τις τρέχουσες μαγνητικές συνδέσεις. Ο Smith σημείωσε, «Έχουμε επίσης αναπτύξει αγωγούς για τη μετατροπή δομών voxel σε εφικτές ακολουθίες συναρμολόγησης για μικρά, κατανεμημένα κινητά ρομπότ, που θα μπορούσαν να βοηθήσουν στη μετάφραση αυτής της εργασίας σε δομές οποιασδήποτε κλίμακας μεγέθους».
Η χρήση αρθρωτών εξαρτημάτων στοχεύει στη μείωση των απορριμμάτων κατασκευής επιτρέποντας την αποσυναρμολόγηση και επανασυναρμολόγηση σε νέα αντικείμενα. Ο Kyaw εργάζεται επίσης για να ενσωματώσει την αναγνώριση χειρονομιών και την επαυξημένη πραγματικότητα στο σύστημα, συνδυάζοντας τον έλεγχο ομιλίας και χειρονομίας για βελτιωμένη αλληλεπίδραση.
Η ομάδα παρουσίασε την εργασία της, «Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly», στο Συμπόσιο της Association for Computing Machinery (ACM) on Computational Fabrication (SCF ’25) στο MIT στις 21 Νοεμβρίου.
VIA: DataConomy.com










