Героїв Севастополя 03061 Україна, Київ
  1. 5
  2. 4
  3. 3
  4. 2
  5. 1
(0 голосів, в середньому: 5 із 5)
Retro illustration of a man with a mechanical brain.
Технології

Що означає AI “PHD-рівень”? По чутках, що Agent Plan OpenAI в розмірі 20 000 доларів.

В індустрії штучного інтелекту з’явилося нове модне слово: “штучний інтелект на рівні доктора філософії”. За даними видання The Information, OpenAI, можливо, планує запустити кілька спеціалізованих продуктів-“агентів” ШІ, включаючи рівень за $20 000 на місяць, орієнтований на підтримку “досліджень на рівні доктора філософії”. Інші заплановані агенти включають асистента для “високооплачуваного працівника сфери знань” з зарплатою $2,000 на місяць і агента для розробників програмного забезпечення з зарплатою $10,000 на місяць.

OpenAI ще не підтвердила ці ціни, але раніше вони вже згадували про можливості ШІ на рівні доктора філософії. Так що ж саме являє собою “ШІ рівня PhD”? Під цим терміном маються на увазі моделі, які нібито виконують завдання, що вимагають знань докторського рівня. До них відносяться агенти, які проводять передові дослідження, пишуть і налагоджують складний код без втручання людини, аналізують великі масиви даних для створення вичерпних звітів. Ключове твердження полягає в тому, що ці моделі можуть вирішувати проблеми, які зазвичай вимагають років спеціалізованої академічної підготовки.

Компанії на кшталт OpenAI засновують свої заяви про “докторський рівень” на результатах конкретних порівняльних тестів. Наприклад, моделі OpenAI показали хороші результати в тестах з природничих наук, кодування та математики, подібні до результатів аспірантів, які виконують складні завдання. Інструмент компанії, який може генерувати наукові роботи з цитатами, набрав 26,6 відсотка за результатами комплексного оцінювання, що охоплює понад 3 000 запитань з більш ніж 100 дисциплін.

Останнє досягнення OpenAI в цьому напрямку пов’язане з моделями , оголошеними в грудні. Ці моделі базуються на сімействі o1, запущеному на початку минулого року. Як і o1, моделі o3 використовують те, що OpenAI називає “приватним ланцюжком думок”, техніку імітації міркувань, коли модель працює через внутрішній діалог і ітеративно опрацьовує питання, перш ніж представити остаточну відповідь.

Цей підхід нібито відображає те, як люди-дослідники витрачають час на обдумування складних проблем, а не на надання негайних відповідей. Згідно з OpenAI, чим більше часу ви витрачаєте на ці обчислення в часі виведення, тим кращі відповіді ви отримуєте. Отже, ось ключовий момент: За $20 000 клієнт, ймовірно, купує тонни часу на роздуми для ШІ-моделі, щоб вона працювала над складними проблемами.

За даними OpenAI, o3 отримав рекордний результат у тесті на візуальне міркування ARC-AGI, досягнувши 87,5% у високопродуктивному тестуванні – це можна порівняти з людською продуктивністю при пороговому значенні 85%. Модель також набрала 96,7 відсотка на Американському запрошувальному іспиті з математики 2024 року, пропустивши лише одне питання, і досягла 87,7 відсотка на іспиті GPQA Diamond, який містить питання з біології, фізики та хімії випускного рівня.

У тесті Frontier Math від EpochAI o3 вирішив 25,2% завдань, тоді як жодна інша модель не перевищила 2%, що свідчить про стрибок у можливостях математичного мислення порівняно з попередньою моделлю.

Бенчмарки проти реальної цінності

В ідеалі, потенційні сфери застосування справжньої моделі штучного інтелекту докторського рівня включають аналіз даних медичних досліджень, підтримку моделювання клімату та обробку рутинних аспектів науково-дослідної роботи.

Високі ціни, про які повідомляє The Information, якщо вони відповідають дійсності, свідчать про те, що OpenAI вважає, що ці системи можуть принести значну користь бізнесу. Видання зазначає, що SoftBank, інвестор OpenAI, зобов’язався витратити $3 млрд на агентські продукти OpenAI тільки в цьому році, що свідчить про значну зацікавленість бізнесу, незважаючи на витрати.

Тем часом OpenAI стикається з фінансовим тиском, який може вплинути на її преміальну цінову стратегію. Повідомляється, що минулого року компанія втратила близько $5 млрд на покриття операційних витрат та інших витрат, пов’язаних з роботою своїх сервісів.

Новини про стратосферні цінові плани OpenAI з’явилися після багатьох років відносно доступних послуг ШІ, які призвели до того, що користувачі звикли очікувати потужні можливості за відносно низьку ціну. ChatGPT Plus залишається вартістю $20 на місяць, а Claude Pro коштує $30 щомісяця – і це лише невелика частина запропонованих корпоративних рівнів. Навіть підписка на ChatGPT Pro вартістю 200 доларів на місяць є відносно невеликою порівняно з новими запропонованими тарифами. Чи буде різниця в продуктивності між цими рівнями відповідати їхній тисячократній різниці в ціні – питання відкрите.

Не дивлячись на свої еталонні показники, ці імітаційні моделі міркувань все ще борються з випадками, коли вони генерують правдоподібну на вигляд, але фактично неправильну інформацію. Це залишається критичною проблемою для дослідницьких програм, де точність і надійність мають першорядне значення. Щомісячні інвестиції в розмірі 20 000 доларів ставлять питання про те, чи можуть організації довіряти цим системам, що вони не внесуть малопомітні помилки в дослідження з високими ставками.

У відповідь на цю новину в соціальних мережах кілька людей пожартували, що компанії можуть найняти справжнього аспіранта набагато дешевше. “Якщо ви забули, – написав у вірусному твіті розробник xAI Х’є Фам, – більшість аспірантів, включно з найяскравішими зірками, які можуть виконувати роботу набагато краще, ніж будь-які нинішні магістри, не отримують $20 тис. на місяць”

Хоча ці системи демонструють потужні можливості в конкретних тестах, ярлик “докторський рівень” залишається здебільшого маркетинговим терміном. Ці моделі можуть обробляти і синтезувати інформацію з вражаючою швидкістю, але залишаються питання про те, наскільки ефективно вони можуть впоратися з творчим мисленням, інтелектуальним скептицизмом і оригінальними дослідженнями, які визначають справжню роботу на докторському рівні. З іншого боку, вони ніколи не втомлюються і не потребують медичної страховки, і, швидше за все, з часом їхні можливості будуть вдосконалюватися, а вартість знижуватися.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *