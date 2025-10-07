«Η αποστολή μας είναι να διασφαλίσουμε ότι η τεχνητή γενική νοημοσύνη (AGI) θα ωφελήσει ολόκληρη την ανθρωπότητα» αναφέρει η εταιρεία OpenAI. Στο πλαίσιο αυτής της αποστολής παρουσιάστηκε το GDPval: μια νέα αξιολόγηση σχεδιασμένη για να βοηθάει στην παρακολούθηση της απόδοσης των μοντέλων ΑΙ και άλλων μοντέλων σε πραγματικές εργασίες.

Η αξιολόγηση μοντέλων με βάση ρεαλιστικές επαγγελματικές εργασίες συνεισφέρει στο να κατανοήσουμε όχι μόνο την επίδοσή τους σε ελεγχόμενα περιβάλλοντα, αλλά και πώς μπορούν να υποστηρίξουν τους ανθρώπους στην καθημερινή τους εργασία.

Με τίτλο «Measuring the performance of our models on real-world tasks», το OpenAI αξιολόγησε 44 επαγγέλματα από τους εννέα πιο κερδοφόρους κλάδους της οικονομίας των ΗΠΑ και διαπίστωσε πως τα κορυφαία μοντέλα τεχνητής νοημοσύνης σήμερα πλησιάζουν ήδη την ποιότητα εργασίας που παράγουν επαγγελματίες του κλάδου.

Οι δουλειές που είναι πιο επιρρεπείς στην αυτοματοποίηση