Οι προγραμματιστές και οι εταιρείες αναπτύσσουν ολοένα και περισσότερο πράκτορες τεχνητής νοημοσύνης και chatbot μέσα στις εφαρμογές τους, αλλά μέχρι στιγμής έχουν περιοριστεί κυρίως στο κείμενο. Εταιρεία παραγωγής ψηφιακού avatar Φέτα λεμονιού εργάζεται για να προσθέσει ένα επίπεδο βίντεο σε αυτές τις συνομιλίες με ένα νέο μοντέλο διάχυσης που μπορεί να δημιουργήσει ψηφιακά είδωλα από μία μόνο εικόνα.
Ονομάζεται Lemon Slice-2, το μοντέλο μπορεί να δημιουργήσει ένα ψηφιακό avatar που λειτουργεί πάνω από μια βάση γνώσεων για να παίξει οποιονδήποτε ρόλο απαιτείται από τον πράκτορα AI, όπως να απαντήσει σε ερωτήματα πελατών, να βοηθήσει σε ερωτήσεις για τις εργασίες του σπιτιού ή ακόμα και να εργαστεί ως εκπρόσωπος υποστήριξης ψυχικής υγείας.
“Στις πρώτες μέρες του GenAI, οι συνιδρυτές μου άρχισαν να παίζουν με διαφορετικά μοντέλα βίντεο και έγινε προφανές σε εμάς ότι το βίντεο επρόκειτο να είναι διαδραστικό. Το συναρπαστικό μέρος για εργαλεία όπως το ChatGPT ήταν ότι ήταν διαδραστικά και θέλουμε το βίντεο να έχει αυτό το επίπεδο”, δήλωσε η συνιδρύτρια Lina Colucci.
Το Lemon Slice λέει ότι πρόκειται για ένα μοντέλο 20 δισεκατομμυρίων παραμέτρων που μπορεί να λειτουργήσει σε μία μόνο GPU για ζωντανή ροή βίντεο με ταχύτητα 20 καρέ ανά δευτερόλεπτο. Η εταιρεία καθιστά το μοντέλο διαθέσιμο μέσω ενός API και ενός ενσωματώσιμου γραφικού στοιχείου που οι εταιρείες μπορούν να ενσωματώσουν στους ιστότοπούς τους με μία μόνο γραμμή κώδικα. Αφού δημιουργηθεί ένα avatar, μπορείτε να αλλάξετε το φόντο, το στυλ και την εμφάνιση ενός χαρακτήρα σε οποιοδήποτε σημείο.
Εκτός από τα ανθρώπινα είδωλα, η εταιρεία εστιάζει επίσης στο να μπορεί να δημιουργήσει μη ανθρώπινους χαρακτήρες για να ταιριάζουν σε διαφορετικές ανάγκες. Η startup χρησιμοποιεί την τεχνολογία της ElevenLabs για να δημιουργήσει τις φωνές αυτών των avatar.
Ιδρύθηκε από τη Lina Colucci, τον Sidney Primas και τον Andrew Weitz το 2024, η Lemon Slice στοιχηματίζει ότι η χρήση του δικού της μοντέλου διάχυσης γενικής χρήσης (ένας τύπος παραγωγικού μοντέλου που μαθαίνει να λειτουργεί αντίστροφα από θορυβώδη δεδομένα εκπαίδευσης για τη δημιουργία νέων δεδομένων) για τη δημιουργία avatar θα το κάνει να ξεχωρίζει από τους ανταγωνιστές.
«Οι υπάρχουσες λύσεις avatar που έχω δει μέχρι σήμερα προσθέτουν αρνητική αξία στο προϊόν», είπε ο Colucci. “Είναι ανατριχιαστικά και είναι άκαμπτα. Φαίνονται καλά για λίγα δευτερόλεπτα και μόλις αρχίσετε να αλληλεπιδράτε μαζί τους, αισθάνεστε πολύ παράξενο και δεν σας χαλαρώνει. Αυτό που εμπόδισε τα avatar να απογειωθούν είναι ότι δεν ήταν αρκετά καλά.”
Εκδήλωση Techcrunch
Σαν Φρανσίσκο
|
13-15 Οκτωβρίου 2026
Για να χρηματοδοτήσει αυτή την προσπάθεια, η εταιρεία είπε την Τρίτη ότι συγκέντρωσε 10,5 εκατομμύρια δολάρια σε χρηματοδότηση εκκίνησης από τους Matrix Partners, Y Combinator, CTO του Dropbox Arash Ferdowsi, τον Διευθύνοντα Σύμβουλο του Twitch Emmett Shear και τους The Chainsmokers.
Η εταιρεία λέει ότι διαθέτει προστατευτικά κιγκλιδώματα για την αποτροπή μη εξουσιοδοτημένης κλωνοποίησης προσώπου ή φωνής και ότι χρησιμοποιεί μεγάλα μοντέλα γλώσσας για την εποπτεία περιεχομένου.
Το Lemon Slice δεν κατονόμασε τους οργανισμούς που χρησιμοποιούν την τεχνολογία του, αλλά είπε ότι το μοντέλο τίθεται σε εφαρμογή για περιπτώσεις χρήσης όπως η εκπαίδευση, η εκμάθηση γλωσσών, το ηλεκτρονικό εμπόριο και η εταιρική κατάρτιση.
Η startup αντιμετωπίζει σκληρό ανταγωνισμό από startups παραγωγής βίντεο όπως οι D-ID, HeyGen και Synthesia, καθώς και άλλοι κατασκευαστές ψηφιακών avatar Genies, Soul Machine, Praktika και AvatarOS.
Ο Ilya Sukhar, συνεργάτης στο Matrix, πιστεύει ότι τα avatars θα είναι χρήσιμα σε περιοχές όπου τα βίντεο είναι εμφανή. Για παράδειγμα, στους ανθρώπους αρέσει να μαθαίνουν από το YouTube αντί να διαβάζουν μεγάλα τμήματα κειμένου. Σημείωσε ότι η τεχνική ικανότητα του Lemon Slice και η δική του θα του δώσουν ένα πλεονέκτημα έναντι άλλων startups.
“Είναι μια βαθιά τεχνική ομάδα με ιστορικό αποστολής προϊόντων ML, όχι μόνο επιδείξεων και έρευνας. Πολλοί από τους άλλους παίκτες είναι προσαρμοσμένοι σε συγκεκριμένα σενάρια ή κλάδους, και η Lemon Slice παίρνει το γενικευμένο “Πικρό μάθημα” προσέγγιση κλιμάκωσης (δεδομένων και υπολογισμών) που έχει λειτουργήσει σε άλλες μεθόδους τεχνητής νοημοσύνης», είπε.
Ο Jared Friedman του Y Combinator πιστεύει ότι η χρήση ενός μοντέλου τύπου διάχυσης επιτρέπει στο Lemon Slice να δημιουργήσει οποιοδήποτε είδος avatar σε σύγκριση με ορισμένες άλλες startups που επικεντρώνονται είτε σε ανθρώπινα είδωλα είτε σε χαρακτήρες παιχνιδιού.
“Το Lemon Slice είναι, πιστεύω, η μόνη εταιρεία που υιοθετεί τη θεμελιώδη προσέγγιση ML που μπορεί τελικά να ξεπεράσει την παράξενη κοιλάδα και να σπάσει το τεστ του avatar Turing. Εκπαιδεύει τον ίδιο τύπο μοντέλου με το Veo3 ή το Sora: έναν μετασχηματιστή διάχυσης βίντεο. Επειδή είναι ένα μοντέλο γενικής χρήσης που κάνει τα πάντα από άκρο σε άκρο, δεν μπορεί να δει το ανώτατο όριο για το πόσο καλά λειτουργεί. μη ανθρώπινα πρόσωπα και απαιτεί μόνο μια εικόνα για να προσθέσει ένα νέο πρόσωπο», είπε.
Η startup έχει επί του παρόντος οκτώ υπαλλήλους και σχεδιάζει να χρησιμοποιήσει τα κεφάλαια για να προσλάβει μηχανικούς και προσωπικό που θα κυκλοφορήσει στην αγορά, μαζί με την πληρωμή των λογαριασμών για την εκπαίδευση των μοντέλων της.
Via: techcrunch.com










