OpenAI оприлюднила результати нового дослідження GDPval — першої масштабної спроби оцінити, наскільки сучасні ШІ-моделі здатні виконувати завдання на рівні професіоналів у ключових економічних галузях.
Як проходив тест
-
Охоплено 9 галузей економіки США та 44 професії — від рієлторів, юристів і фінансових консультантів до медсестер, соціальних працівників і розробників ПЗ.
-
ШІ-моделям пропонували понад 200 реальних робочих завдань, після чого експерти-люди оцінювали результат.
Де ШІ показав себе найкраще
Моделі продемонстрували найвищу ефективність у чітко формалізованих та повторюваних задачах, зокрема:
-
створення маркетингових матеріалів;
-
аналіз ринку;
-
робота з типовими юридичними документами;
-
обробка медичних зображень.
Професії з найбільшим потенціалом для автоматизації ШІ:
-
рієлтори
-
юристи
-
інженери
-
розробники ПЗ
-
соціальні працівники
-
фармацевти
-
фінансові консультанти
-
медсестри
-
фахівці з клієнтської підтримки
Хто став лідером
Неочікувано, першість здобула не GPT-5, а Claude Opus 4.1 від Anthropic, який отримав найвищі оцінки у 220 завданнях. GPT-5 від OpenAI зайняв друге місце, показавши точність на рівні людських експертів.
Обмеження і виклики
OpenAI визнає: поки що тест охоплює лише частину робочих процесів, тож повне заміщення людей не на часі. Водночас компанія прямо зазначає — ШІ вже може виконувати частину роботи швидше і дешевше за людей.
Найбільша проблема залишається незмінною: галюцинації та помилки, які можуть бути критичними у медицині, освіті й науці.
ШІ стрімко розвивається — ринок праці реагує болісно
З моменту появи першого ChatGPT наприкінці 2022 року моделі OpenAI постійно вдосконалюються. У серпні 2025-го компанія представила ChatGPT 5, який, за словами розробників, «спілкується як кандидат наук».
Паралельно медіа повідомляють про масові скорочення в ІТ-сфері:
з початку 2025 року було звільнено понад 50 тисяч спеціалістів, включно з досвідченими інженерами з Google, Microsoft та Amazon.

.jpg)
.jpg)
6666666(1).jpg)
.jpg)

.jpg)
