Δοκιμές που πραγματοποιήθηκαν σε δημοφιλή chatbots αποκάλυψαν σοβαρά προβλήματα. Για παράδειγμα, το Copilot της Microsoft και το ChatGPT δυστυχώς συμβούλευσαν την παραβίαση των επενδυτικών ορίων του HMRC για τα ISAs. Επίσης, το ChatGPT δήλωσε εσφαλμένα ότι η ταξιδιωτική ασφάλιση είναι υποχρεωτική για τη μετάβαση στις περισσότερες χώρες της ΕΕ. Την ίδια στιγμή, η τεχνητή νοημοσύνη της Meta παρείχε λανθασμένες λεπτομέρειες για το πώς να ζητήσει κάποιος αποζημίωση για καθυστερημένες πτήσεις.
Σημαντικές ανησυχίες αναφέρθηκαν και για το Gemini της Google, το οποίο συμβούλευσε την παρακράτηση χρημάτων από έναν οικοδόμο αν κάποιες εργασίες δεν εκτελούντο σωστά, μια ενέργεια που κατά τη διάρκεια της έρευνας αναφέρθηκε ως επικίνδυνη για την πιθανότητα σύμβασης. Η καταναλωτική οργάνωση Which? δήλωσε ότι η ερευνά της αποκάλυψε πολλές ανακρίβειες και παραπλανητικά σχόλια σχετικά με σημαντικά ζητήματα, όπως οικονομικά και νομικά θέματα.
Σύμφωνα με τη βαθμολογία, η τεχνητή νοημοσύνη της Meta ήταν η λιγότερο ακριβής, ενώ το ChatGPT ακολούθησε στη δεύτερη θέση. Από την άλλη, το Copilot και το Gemini παρουσίασαν ελαφρώς καλύτερες επιδόσεις, όμως η κορυφαία βαθμολογία αποδόθηκε στο Perplexity, το οποίο είναι γνωστό για την εξειδίκευσή του στην αναζήτηση.
Σε έρευνα που διεξήχθη από την Guardian, χρήστες ανέφεραν τη χρήση της τεχνητής νοημοσύνης για την εύρεση των καλύτερων πιστωτικών καρτών, την παροχή συμβουλών για μείωση τελών επένδυσης, καθώς και για την ενοικίαση συσκευών, όπως επιβεβαίωσε η 65χρονη Kathryn Boyd από το Wexford της Ιρλανδίας, η οποία, αν και ικανοποιημένη από την προσωπική της εμπειρία, ανέφερε ότι οι λανθασμένες πληροφορίες του ChatGPT περί φόρου αυτοαπασχόλησης την οδήγησαν σε καθυστερήσεις και ταλαιπωρία.
“Μου έδωσε όλες τις λάθος πληροφορίες,” δήλωσε η Kathryn, επισημαίνοντας ότι αναγκάστηκε να διορθώσει τα λάθη τουλάχιστον τρεις φορές. “Ανησυχώ για τους υπόλοιπους χρήστες που μπορεί να εμπιστεύονται αυτές τις πληροφορίες χωρίς γνώση για τις ορθές απαντήσεις – είναι απαραίτητο να προσέχουμε τις φορολογικές πιστώσεις και άλλες λεπτομέρειες.”
Σε περίπτωση που οι ερευνητές της Which? ρωτούσαν τα chatbots για τη διαδικασία φορολογικής επιστροφής από το HMRC, το ChatGPT και το Perplexity παρουσίασαν links προς εταιρείες φορολογικών επιστροφών που κοστίζουν, γεγονός που ανήσυχε τους αναγνώστες.
Λάθος στις πληροφορίες τους σχετικά με το όριο των ISAs επιβεβαίωσε τις ανησυχίες, όταν το ChatGPT και το Copilot δεν παρατήρησαν ότι το όριο ήταν 20.000 λίρες, οδηγώντας τους χρήστες σε πιθανές παραβάσεις.
Σχετικά με την κατάσταση, η Google δήλωσε ότι προσπαθεί να είναι διαφανής όσον αφορά τους περιορισμούς της τεχνητής νοημοσύνης. Το Gemini υπενθυμίζει στους χρήστες να ελέγχουν πάντα τις πληροφορίες τους και να συμβουλεύονται επαγγελματίες για νομικά, ιατρικά και οικονομικά θέματα. Εκπρόσωπος της Microsoft δήλωσε ότι ενθαρρύνουν τη διασταύρωση των πληροφοριών και εργάζονται για την βελτίωση των εργαλείων τεχνητής νοημοσύνης τους.
Η OpenAI επισημαίνει ότι “η βελτίωση της ακρίβειας είναι προτεραιότητα του κλάδου” και ότι το νέο μοντέλο της, το GPT-5.1, επιδιώκει να είναι το πιο ακριβές που έχει αναπτυχθεί μέχρι σήμερα.










