Close Menu
TechReport.grTechReport.gr
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology

Subscribe to Updates

Get the latest creative news from FooBar about art, design and business.

What's Hot
«ΕΕ και Τουρκία: Οι Αποκαλυπτικοί Νέοι Δρόμοι που θα Αλλάξουν τις Οικονομικές Σχέσεις των Δύο Χωρών!»

«ΕΕ και Τουρκία: Οι Αποκαλυπτικοί Νέοι Δρόμοι που θα Αλλάξουν τις Οικονομικές Σχέσεις των Δύο Χωρών!»

19 Δεκεμβρίου 2025
Πώς η Θεωρία της Αναγέννησης Μέσα από το Θάνατο Αλλαγεί τη Σκοτεινή Πραγματικότητα του Dead Space!

Πώς η Θεωρία της Αναγέννησης Μέσα από το Θάνατο Αλλαγεί τη Σκοτεινή Πραγματικότητα του Dead Space!

19 Δεκεμβρίου 2025
«Σοκαριστική Ανατροπή: Τροχιακή Ανωμαλία και Επικείμενη Πτώση προς τη Γη!»

«Σοκαριστική Ανατροπή: Τροχιακή Ανωμαλία και Επικείμενη Πτώση προς τη Γη!»

19 Δεκεμβρίου 2025
Facebook X (Twitter) Instagram
  • Home
  • Πολιτική απορρήτου
  • Σχετικά με εμάς
  • Contact With TechReport
  • Greek Live Channels IPTV 2025
Facebook X (Twitter) Instagram Pinterest Vimeo
TechReport.grTechReport.gr
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
TechReport.grTechReport.gr
Αρχική » Η Apple κυκλοφορεί ένα επιμελημένο σύνολο δεδομένων AI για έρευνα επεξεργασίας εικόνας
Apple

Η Apple κυκλοφορεί ένα επιμελημένο σύνολο δεδομένων AI για έρευνα επεξεργασίας εικόνας

Marizas DimitrisBy Marizas Dimitris2 Νοεμβρίου 2025Δεν υπάρχουν Σχόλια3 Mins Read
Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
Share
Facebook Twitter LinkedIn Pinterest Tumblr Telegram WhatsApp Email



Η Apple κυκλοφόρησε το Pico-Banana-400K, ένα εξαιρετικά επιμελημένο ερευνητικό σύνολο 400.000 εικόνων, το οποίο, ενδιαφέροντα, κατασκευάστηκε χρησιμοποιώντας τα μοντέλα Gemini-2.5 της Google. Εδώ είναι οι λεπτομέρειες.

Η ερευνητική ομάδα της Apple δημοσίευσε μια ενδιαφέρουσα μελέτη που ονομάζεται «Pico-Banana-400K: Ένα σύνολο δεδομένων μεγάλης κλίμακας για επεξεργασία εικόνας με καθοδήγηση κειμένου».

Εκτός από τη μελέτη, κυκλοφόρησαν επίσης το πλήρες σύνολο δεδομένων 400.000 εικόνων που παρήγαγε, το οποίο διαθέτει άδεια μη εμπορικής έρευνας. Αυτό σημαίνει ότι ο καθένας μπορεί να το χρησιμοποιήσει και να το εξερευνήσει, υπό την προϋπόθεση ότι είναι για ακαδημαϊκό έργο ή ερευνητικούς σκοπούς AI. Με άλλα λόγια, δεν μπορεί να χρησιμοποιηθεί εμπορικά.

Σωστά, αλλά τι είναι;

Πριν από λίγους μήνες, η Google κυκλοφόρησε το μοντέλο Gemini-2.5-Flash-Image, γνωστό και ως Nanon-Banana, το οποίο είναι αναμφισβήτητα το πιο σύγχρονο όταν πρόκειται για μοντέλα επεξεργασίας εικόνας.

Άλλα μοντέλα έχουν επίσης παρουσιάσει σημαντικές βελτιώσεις, αλλά, όπως το έθεσαν οι ερευνητές της Apple:

“Παρά αυτές τις προόδους, η ανοιχτή έρευνα παραμένει περιορισμένη λόγω της έλλειψης συνόλων δεδομένων επεξεργασίας μεγάλης κλίμακας, υψηλής ποιότητας και πλήρως κοινοποιήσιμα. Τα υπάρχοντα σύνολα δεδομένων συχνά βασίζονται σε συνθετικές γενιές από ιδιόκτητα μοντέλα ή περιορισμένα υποσύνολα που επιμελούνται από τον άνθρωπο. Επιπλέον, αυτά τα σύνολα δεδομένων συχνά εμφανίζουν μετατοπίσεις τομέα, αστάθμητα σύνολα δεδομένων. μοντέλα.”

Έτσι, η Apple ξεκίνησε να κάνει κάτι γι ‘αυτό.

Κτίριο Pico-Banana-400K

Το πρώτο πράγμα που έκανε η Apple ήταν να έβγαλε έναν απροσδιόριστο αριθμό πραγματικών φωτογραφιών από το σύνολο δεδομένων OpenImages, «που επιλέχθηκαν για να εξασφαλίσουν κάλυψη ανθρώπων, αντικειμένων και σκηνικών κειμένου».

Ναι, χρησιμοποίησαν στην πραγματικότητα Comic Sans

Στη συνέχεια, κατέληξε σε μια λίστα με 35 διαφορετικούς τύπους αλλαγών που ένας χρήστης μπορούσε να ζητήσει από το μοντέλο να κάνει, ομαδοποιημένες σε οκτώ κατηγορίες. Για παράδειγμα:

  • Προσθέστε κόκκους φιλμ ή vintage φίλτρο
  • Ανθρωποκεντρική: Φιγούρα παιχνιδιού σε στυλ Funko-Pop του ατόμου
  • Αλλαγή καιρικών συνθηκών (ηλιοφάνεια/βροχή/χιόνι)
  • Σημασιολογία σε επίπεδο αντικειμένου: Μετατόπιση αντικειμένου (αλλαγή θέσης/χωρικής σχέσης του)
  • Κλίμακα: Μεγέθυνση

Στη συνέχεια, οι ερευνητές θα ανέβαζαν μια εικόνα στο Nano-Banana, μαζί με ένα από αυτά τα μηνύματα. Μόλις ολοκληρωθεί η δημιουργία της επεξεργασμένης εικόνας από το Nano-Banana, οι ερευνητές θα έβαλαν στη συνέχεια το Gemini-2.5-Pro ​​να αναλύσει το αποτέλεσμα, είτε εγκρίνοντάς το είτε απορρίπτοντάς το, με βάση τη συμμόρφωση με τις οδηγίες και την οπτική ποιότητα.

Το αποτέλεσμα έγινε Pico-Banana-400K, το οποίο περιλαμβάνει εικόνες που παράγονται μέσω επεξεργασιών μίας στροφής (μία μόνο προτροπή), ακολουθίες επεξεργασίας πολλών στροφών (πολλαπλές επαναληπτικές προτροπές) και ζεύγη προτιμήσεων που συγκρίνουν επιτυχημένα και αποτυχημένα αποτελέσματα (έτσι τα μοντέλα μπορούν επίσης να μάθουν πώς μοιάζουν με ανεπιθύμητα αποτελέσματα).

Αν και αναγνωρίζουν τους περιορισμούς του Nano-Banana στη λεπτομερή χωρική επεξεργασία, την παρέκταση διάταξης και την τυπογραφία, οι ερευνητές λένε ότι ελπίζουν ότι το Pico-Banana-400K θα χρησιμεύσει ως «ένα ισχυρό θεμέλιο για την εκπαίδευση και τη συγκριτική αξιολόγηση της επόμενης γενιάς μοντέλων επεξεργασίας εικόνας με καθοδήγηση κειμένου».

Μπορείτε να βρείτε τη μελέτη στο arXivκαι το σύνολο δεδομένων είναι δωρεάν διαθέσιμο στο GitHub.

Προσφορές αξεσουάρ στο Amazon

FTC: Χρησιμοποιούμε συνδέσμους θυγατρικών που κερδίζουν αυτόματα εισόδημα. Περισσότερο.



Via: 9to5mac.com

Related Posts

No related posts.
Share. Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram WhatsApp Email
Previous ArticleΚαθώς τελειώνει η 5η σεζόν του Slow Horses, η Apple TV λανσάρει άλλη μια νέα δραματική σειρά Mick Herron για να κρατήσει τους συνδρομητές της
Next Article 28 Οκτωβρίου 2025 – Φήμες για iPhone 18, εφαρμογές iPad
Marizas Dimitris
  • Website
  • Facebook

Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες. Λατρεύει να εξερευνά νέες ιδέες, να επιλύει σύνθετα προβλήματα και να βρίσκει τρόπους ώστε η τεχνολογία να γίνεται πιο ανθρώπινη, απολαυστική και προσιτή για όλους. Στον ελεύθερο χρόνο του ασχολείται με το σκάκι και το poker, απολαμβάνοντας την στρατηγική και τη δημιουργική σκέψη που απαιτούν.

Related Posts

iOS 26.2: Κρίσιμη Ασφαλείας Apple – Ενημέρωση ΤΩΡΑ
Apple

iOS 26.2: Κρίσιμη Ασφαλείας Apple – Ενημέρωση ΤΩΡΑ

14 Δεκεμβρίου 2025
Η παρακολούθηση παραγγελιών του Apple Wallet βελτιώθηκε με το iOS 26, αλλά εξακολουθεί να λείπει κάτι
Apple

Η παρακολούθηση παραγγελιών του Apple Wallet βελτιώθηκε με το iOS 26, αλλά εξακολουθεί να λείπει κάτι

13 Δεκεμβρίου 2025
Οδηγός τεχνολογίας δώρων 2025 για χρήστες της Apple — δοκιμασμένος και συνιστάται προσωπικά
Apple

Οδηγός τεχνολογίας δώρων 2025 για χρήστες της Apple — δοκιμασμένος και συνιστάται προσωπικά

13 Δεκεμβρίου 2025
Add A Comment
Leave A Reply Cancel Reply

Top Posts

Οδηγός για το Πρόγραμμα «Ψηφιακές Συναλλαγές Β’» (2025) – Όσα πρέπει να γνωρίζουμε

13 Νοεμβρίου 20251.156 Views

Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

30 Οκτωβρίου 2025570 Views
Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα οδηγός

Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους

12 Νοεμβρίου 2025468 Views
Stay In Touch
  • Facebook
  • YouTube
  • TikTok
  • WhatsApp
  • Twitter
  • Instagram
Latest News
«ΕΕ και Τουρκία: Οι Αποκαλυπτικοί Νέοι Δρόμοι που θα Αλλάξουν τις Οικονομικές Σχέσεις των Δύο Χωρών!» Business

«ΕΕ και Τουρκία: Οι Αποκαλυπτικοί Νέοι Δρόμοι που θα Αλλάξουν τις Οικονομικές Σχέσεις των Δύο Χωρών!»

Marizas Dimitris19 Δεκεμβρίου 2025
Πώς η Θεωρία της Αναγέννησης Μέσα από το Θάνατο Αλλαγεί τη Σκοτεινή Πραγματικότητα του Dead Space! Entertainment

Πώς η Θεωρία της Αναγέννησης Μέσα από το Θάνατο Αλλαγεί τη Σκοτεινή Πραγματικότητα του Dead Space!

Marizas Dimitris19 Δεκεμβρίου 2025
«Σοκαριστική Ανατροπή: Τροχιακή Ανωμαλία και Επικείμενη Πτώση προς τη Γη!» Technology

«Σοκαριστική Ανατροπή: Τροχιακή Ανωμαλία και Επικείμενη Πτώση προς τη Γη!»

Marizas Dimitris19 Δεκεμβρίου 2025
Most Popular

Οδηγός για το Πρόγραμμα «Ψηφιακές Συναλλαγές Β’» (2025) – Όσα πρέπει να γνωρίζουμε

13 Νοεμβρίου 20251.156 Views

Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

30 Οκτωβρίου 2025570 Views
Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα οδηγός

Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους

12 Νοεμβρίου 2025468 Views
About TechReport.gr

Το TechReport.gr ιδρύθηκε με στόχο να αποτελέσει την πρώτη πηγή ενημέρωσης για όσους αναζητούν αξιόπιστη και εμπεριστατωμένη κάλυψη του τεχνολογικού κόσμου. Από την αρχή της λειτουργίας του, το site έχει δεσμευτεί στην παροχή ποιοτικού περιεχομένου που συνδυάζει ενημέρωση, ανάλυση και πρακτικές συμβουλές.
• Email: [email protected]
• Phone: +30 6980 730 713
Copyright © 2025| TechReport.gr | A project by: Δημήτρης Μάριζας
Λογότυπα, επωνυμίες, εμπορικά σήματα και γνωρίσματα ανήκουν στους νόμιμους ιδιοκτήτες.

Our Picks
«ΕΕ και Τουρκία: Οι Αποκαλυπτικοί Νέοι Δρόμοι που θα Αλλάξουν τις Οικονομικές Σχέσεις των Δύο Χωρών!»

«ΕΕ και Τουρκία: Οι Αποκαλυπτικοί Νέοι Δρόμοι που θα Αλλάξουν τις Οικονομικές Σχέσεις των Δύο Χωρών!»

19 Δεκεμβρίου 2025
Πώς η Θεωρία της Αναγέννησης Μέσα από το Θάνατο Αλλαγεί τη Σκοτεινή Πραγματικότητα του Dead Space!

Πώς η Θεωρία της Αναγέννησης Μέσα από το Θάνατο Αλλαγεί τη Σκοτεινή Πραγματικότητα του Dead Space!

19 Δεκεμβρίου 2025
«Σοκαριστική Ανατροπή: Τροχιακή Ανωμαλία και Επικείμενη Πτώση προς τη Γη!»

«Σοκαριστική Ανατροπή: Τροχιακή Ανωμαλία και Επικείμενη Πτώση προς τη Γη!»

19 Δεκεμβρίου 2025
Facebook X (Twitter) Instagram Pinterest
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
© 2025 TechReport.gr Designed and Developed by Dimitris Marizas.

Type above and press Enter to search. Press Esc to cancel.

Ad Blocker Enabled!
Ad Blocker Enabled!
Our website is made possible by displaying online advertisements to our visitors. Please support us by disabling your Ad Blocker.