Anthropic έχει απελευθερώθηκε Claude Haiku 4.5, ένα μικρό μοντέλο AI βελτιστοποιημένο σε καθυστέρηση. Ταιριάζει με την απόδοση κωδικοποίησης του Claude Sonnet 4 με υπερδιπλάσια ταχύτητα και το ένα τρίτο του κόστους και είναι διαθέσιμο μέσω API και συνεργατών cloud.
Το μοντέλο στοχεύει εφαρμογές με περιορισμένους προϋπολογισμούς καθυστέρησης και υψηλές απαιτήσεις απόδοσης, συμπεριλαμβανομένων των βοηθών σε πραγματικό χρόνο, του αυτοματισμού υποστήριξης πελατών και του προγραμματισμού ζευγών. Το Anthropic τοποθετεί το Haiku 4.5 ως εναλλακτική λύση για το Haiku 3.5 και το Sonnet 4 σε διαδραστικούς φόρτους εργασίας που είναι ευαίσθητοι στο κόστος. Σύμφωνα με πληροφορίες, ξεπερνά το Sonnet 4 σε εργασίες «χρήσης υπολογιστή», οι οποίες περιλαμβάνουν χειρισμό GUI και προγράμματος περιήγησης για προϊόντα όπως το Claude για Chrome. Το μοντέλο περιγράφεται επίσης ως ουσιαστικά βελτίωση της ανταπόκρισης στον Κώδικα Claude για έργα πολλαπλών πρακτόρων και γρήγορη δημιουργία πρωτοτύπων.
Στην ιεραρχία μοντέλων της Anthropic, το Haiku 4.5 παρέχει δυνατότητες σχεδόν στα σύνορα με μεγαλύτερη απόδοση κόστους. Η εταιρεία επιβεβαίωσε ότι το μοντέλο Sonnet 4.5 παραμένει η αιχμή και «το καλύτερο μοντέλο κωδικοποίησης στον κόσμο». Το Anthropic προτείνει ένα μοτίβο ενορχήστρωσης όπου το Sonnet 4.5 χειρίζεται πολύπλοκο σχεδιασμό πολλαπλών βημάτων και μια ομάδα εργαζομένων στο Haiku 4.5 εκτελεί τις δευτερεύουσες εργασίες παράλληλα. Αυτή η προσέγγιση συνιστάται για την εξισορρόπηση της συλλογιστικής υψηλού επιπέδου με την οικονομικά αποδοτική, υψηλής ταχύτητας εκτέλεση για μεγάλα ή πολύπλοκα έργα.
Οι προγραμματιστές μπορούν να έχουν άμεση πρόσβαση στο μοντέλο μέσω του API της Anthropic με το αναγνωριστικό «claude-haiku-4-5». Είναι επίσης διαθέσιμο στο Amazon Bedrock και στο Google Cloud Vertex AI, αν και η Anthropic σημειώνει ότι η περιφερειακή κάλυψη και τα αναγνωριστικά μοντέλων σε αυτές τις πλατφόρμες cloud ενδέχεται να ενημερώνονται με την πάροδο του χρόνου. Η τιμή API είναι 1 $ ανά εκατομμύριο διακριτικά εισόδου και 5 $ ανά εκατομμύριο διακριτικά εξόδου. Για ροές εργασιών που χρησιμοποιούν προσωρινή αποθήκευση, οι τιμές αναφέρονται σε 1,25 $ ανά εκατομμύριο διακριτικά εγγραφής και 0,10 $ ανά εκατομμύριο διακριτικά ανάγνωσης, προσφέροντας περαιτέρω μειώσεις κόστους για επαναλαμβανόμενα ερωτήματα.
Η Anthropic δημοσίευσε αποτελέσματα συγκριτικής αξιολόγησης με λεπτομέρειες μεθοδολογίας, δηλώνοντας ότι τα δεδομένα δείχνουν ισοτιμία κωδικοποίησης με το Sonnet 4 και ανώτερη απόδοση σε εργασίες χρήσης υπολογιστή κάτω από τα ικριώματα δοκιμών του. Τα αποτελέσματα περιλαμβάνουν:
- SWE-bench Επαληθεύτηκε: Επιτυχία 73,3% σε 50 δοκιμές, χρησιμοποιώντας ένα απλό ικρίωμα με δύο εργαλεία (bash, επεξεργασία αρχείων), προϋπολογισμό σκέψης 128K, προεπιλεγμένη δειγματοληψία και χωρίς υπολογισμό χρόνου δοκιμής.
- Τερματικός πάγκος: Ένας μέσος όρος πάνω από 11 εκτελέσεις με τον πράκτορα Terminus-2, όπου έξι εκτελέσεις δεν είχαν προϋπολογισμό σκέψης και πέντε είχαν προϋπολογισμό σκέψης 32.000.
- OSWorld-Verified: Ένας μέσος όρος σε τέσσερις διαδρομές με μέγιστο 100 βήματα, συνολικό προϋπολογισμό σκέψης 128K και διαμόρφωση 2K ανά βήμα.
- AIME / MMMLU: Μέσοι όροι από πολλαπλές εκτελέσεις χρησιμοποιώντας προεπιλεγμένη δειγματοληψία και προϋπολογισμούς σκέψης 128.000.
Η εταιρεία συμβουλεύει ότι οι χρήστες θα πρέπει να επαναλάβουν τις δοκιμές χρησιμοποιώντας τη δική τους συγκεκριμένη ενορχήστρωση, στοίβες εργαλείων και προϋπολογισμούς σκέψης πριν γενικεύσουν τα αποτελέσματα απόδοσης στις δικές τους εφαρμογές.
Το Claude Haiku 4.5 κυκλοφορεί με την άδεια ASL-2. Σύμφωνα με τις εσωτερικές δοκιμές της Anthropic, το μοντέλο έχει χαμηλότερο μετρημένο ποσοστό κακής ευθυγράμμισης από το Sonnet 4.5 και το Opus 4.1, υποδεικνύοντας ένα διαφορετικό προφίλ ασφάλειας στο πλαίσιο αξιολόγησης της εταιρείας.
VIA: DataConomy.com







