Το νέο Haiku 4.5 της Anthropic αντιπαλεύει το Sonnet 4 στο ένα τρίτο της τιμής - TechReport.gr

Anthropic έχει απελευθερώθηκε Claude Haiku 4.5, ένα μικρό μοντέλο AI βελτιστοποιημένο σε καθυστέρηση. Ταιριάζει με την απόδοση κωδικοποίησης του Claude Sonnet 4 με υπερδιπλάσια ταχύτητα και το ένα τρίτο του κόστους και είναι διαθέσιμο μέσω API και συνεργατών cloud.

Το μοντέλο στοχεύει εφαρμογές με περιορισμένους προϋπολογισμούς καθυστέρησης και υψηλές απαιτήσεις απόδοσης, συμπεριλαμβανομένων των βοηθών σε πραγματικό χρόνο, του αυτοματισμού υποστήριξης πελατών και του προγραμματισμού ζευγών. Το Anthropic τοποθετεί το Haiku 4.5 ως εναλλακτική λύση για το Haiku 3.5 και το Sonnet 4 σε διαδραστικούς φόρτους εργασίας που είναι ευαίσθητοι στο κόστος. Σύμφωνα με πληροφορίες, ξεπερνά το Sonnet 4 σε εργασίες «χρήσης υπολογιστή», οι οποίες περιλαμβάνουν χειρισμό GUI και προγράμματος περιήγησης για προϊόντα όπως το Claude για Chrome. Το μοντέλο περιγράφεται επίσης ως ουσιαστικά βελτίωση της ανταπόκρισης στον Κώδικα Claude για έργα πολλαπλών πρακτόρων και γρήγορη δημιουργία πρωτοτύπων.

Στην ιεραρχία μοντέλων της Anthropic, το Haiku 4.5 παρέχει δυνατότητες σχεδόν στα σύνορα με μεγαλύτερη απόδοση κόστους. Η εταιρεία επιβεβαίωσε ότι το μοντέλο Sonnet 4.5 παραμένει η αιχμή και «το καλύτερο μοντέλο κωδικοποίησης στον κόσμο». Το Anthropic προτείνει ένα μοτίβο ενορχήστρωσης όπου το Sonnet 4.5 χειρίζεται πολύπλοκο σχεδιασμό πολλαπλών βημάτων και μια ομάδα εργαζομένων στο Haiku 4.5 εκτελεί τις δευτερεύουσες εργασίες παράλληλα. Αυτή η προσέγγιση συνιστάται για την εξισορρόπηση της συλλογιστικής υψηλού επιπέδου με την οικονομικά αποδοτική, υψηλής ταχύτητας εκτέλεση για μεγάλα ή πολύπλοκα έργα.

Οι προγραμματιστές μπορούν να έχουν άμεση πρόσβαση στο μοντέλο μέσω του API της Anthropic με το αναγνωριστικό «claude-haiku-4-5». Είναι επίσης διαθέσιμο στο Amazon Bedrock και στο Google Cloud Vertex AI, αν και η Anthropic σημειώνει ότι η περιφερειακή κάλυψη και τα αναγνωριστικά μοντέλων σε αυτές τις πλατφόρμες cloud ενδέχεται να ενημερώνονται με την πάροδο του χρόνου. Η τιμή API είναι 1 $ ανά εκατομμύριο διακριτικά εισόδου και 5 $ ανά εκατομμύριο διακριτικά εξόδου. Για ροές εργασιών που χρησιμοποιούν προσωρινή αποθήκευση, οι τιμές αναφέρονται σε 1,25 $ ανά εκατομμύριο διακριτικά εγγραφής και 0,10 $ ανά εκατομμύριο διακριτικά ανάγνωσης, προσφέροντας περαιτέρω μειώσεις κόστους για επαναλαμβανόμενα ερωτήματα.

Η Anthropic δημοσίευσε αποτελέσματα συγκριτικής αξιολόγησης με λεπτομέρειες μεθοδολογίας, δηλώνοντας ότι τα δεδομένα δείχνουν ισοτιμία κωδικοποίησης με το Sonnet 4 και ανώτερη απόδοση σε εργασίες χρήσης υπολογιστή κάτω από τα ικριώματα δοκιμών του. Τα αποτελέσματα περιλαμβάνουν:

SWE-bench Επαληθεύτηκε: Επιτυχία 73,3% σε 50 δοκιμές, χρησιμοποιώντας ένα απλό ικρίωμα με δύο εργαλεία (bash, επεξεργασία αρχείων), προϋπολογισμό σκέψης 128K, προεπιλεγμένη δειγματοληψία και χωρίς υπολογισμό χρόνου δοκιμής.
Τερματικός πάγκος: Ένας μέσος όρος πάνω από 11 εκτελέσεις με τον πράκτορα Terminus-2, όπου έξι εκτελέσεις δεν είχαν προϋπολογισμό σκέψης και πέντε είχαν προϋπολογισμό σκέψης 32.000.
OSWorld-Verified: Ένας μέσος όρος σε τέσσερις διαδρομές με μέγιστο 100 βήματα, συνολικό προϋπολογισμό σκέψης 128K και διαμόρφωση 2K ανά βήμα.
AIME / MMMLU: Μέσοι όροι από πολλαπλές εκτελέσεις χρησιμοποιώντας προεπιλεγμένη δειγματοληψία και προϋπολογισμούς σκέψης 128.000.

Η εταιρεία συμβουλεύει ότι οι χρήστες θα πρέπει να επαναλάβουν τις δοκιμές χρησιμοποιώντας τη δική τους συγκεκριμένη ενορχήστρωση, στοίβες εργαλείων και προϋπολογισμούς σκέψης πριν γενικεύσουν τα αποτελέσματα απόδοσης στις δικές τους εφαρμογές.

Το Claude Haiku 4.5 κυκλοφορεί με την άδεια ASL-2. Σύμφωνα με τις εσωτερικές δοκιμές της Anthropic, το μοντέλο έχει χαμηλότερο μετρημένο ποσοστό κακής ευθυγράμμισης από το Sonnet 4.5 και το Opus 4.1, υποδεικνύοντας ένα διαφορετικό προφίλ ασφάλειας στο πλαίσιο αξιολόγησης της εταιρείας.

Πίστωση επιλεγμένης εικόνας

VIA: DataConomy.com

Related Posts

Ανθρωπικό Προτεινόμενα σονέτο 4 Χαϊκού 4.5

Previous Article7 νέες συμβουλές και κόλπα για το iPhone 17 ή το iPhone Air σας

Next Article Η Meta τερματίζει τη λειτουργία των desktop εφαρμογών του Messenger για Windows και macOS – Facebook

Marizas Dimitris

Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες. Λατρεύει να εξερευνά νέες ιδέες, να επιλύει σύνθετα προβλήματα και να βρίσκει τρόπους ώστε η τεχνολογία να γίνεται πιο ανθρώπινη, απολαυστική και προσιτή για όλους. Στον ελεύθερο χρόνο του ασχολείται με το σκάκι και το poker, απολαμβάνοντας την στρατηγική και τη δημιουργική σκέψη που απαιτούν.

Leave A Reply