Розвиток штучного інтелекту Gemini від Google, можливо, і був повільним, але це було не у 2025 році. Не минає й тижня, щоб у додатку Gemini або в інструментах для розробників, таких як AI Studio, не з’являлася нова модель, а сьогодні в додатку виходить велике оновлення. Google оголосив, що його швидша та ефективніша модель Gemini 2.5 Flash широко розгортається в режимі попереднього перегляду. У той же час, розробники можуть почати створювати з 2.5 Flash, використовуючи нещодавно оголошені ціни на API компанії, які, за словами Google, набагато нижчі, ніж у конкуруючих продуктів.
Зграйка Близнюків
Спадний список моделей у додатку Gemini дещо заплутаний, особливо коли ми бачимо, що там з’являються продукти, які нам подобаються і з’являються. Google випускає так багато моделей для попереднього перегляду і нових способів використання Gemini, що може бути важко зрозуміти, який варіант вибрати для конкретного завдання. Справедливості заради варто зазначити, що Google – далеко не єдиний великий гравець у сфері ШІ, який стикається з цією проблемою.
Тулсе Доші – директор Google з управління продуктами Gemini, а це означає, що вона очолює команду, яка займається створенням цих моделей. Ми запитали Доші, якою версією Gemini вона користується, і не дивно, що їй подобається більш потужний варіант. “Зазвичай зараз я використовую 2.5 Pro, – каже Доші. “Я використовую Gemini протягом дня для роботи в кількох ключових сферах, таких як створення документів або слайдів. Це або для внутрішнього використання, або для поширення назовні, і я виявив, що 2.5 Pro дуже корисний для творчої роботи з текстом”.

Нова модель менша за розміром і приблизно така ж, як і 2.0 Flash, але вона повинна працювати краще. Доші називає її “сильним кроком вперед у порівнянні з 2.0 Flash”. Gemini 2.5 Flash принаймні не додасть плутанини в додатках. Ця модель буде вказана як 2.5 Flash (Експериментальна) в додатку і на сайті, замінивши опцію 2.0 Thinking (Експериментальна). Той факт, що модель мислення 2.0 навіть не вийшла з експериментальної стадії, свідчить про те, як швидко рухається команда Google Gemini в наші дні.
На відміну від моделі мислення 2.0, новий 2.5 Flash дебютує з підтримкою функції Google Canvas для роботи над текстом або кодом. За словами представника Google, глибока дослідницька підтримка цієї моделі з’явиться пізніше.
Gemini 2.5 Pro все ще перебуває на стадії експерименту, залишаючи 2.0 Flash єдиним неекспериментальним чат-ботом. Однак ця модель не включає в себе можливості міркування.
Думати далі, думати далі
Як і всі моделі Google у гілці 2.5 і далі, Gemini 2.5 має вбудовану функцію, яку Google називає “мисленням”. Це означає, що модель перевіряє свої факти на ходу, що призводить до більш точних результатів. Однак це також робить моделі повільнішими і набагато дорожчими. Оскільки не всі запити вимагають такого рівня постійного аналізу, Google оснастив Flash деякими інструментами, які можуть допомогти розробникам налаштувати його відповідно до свого сценарію використання.
Ви можете пам’ятати, що Google почав заманювати розробників з Gemini 2.5 Flash . Хоча модель ще не повністю завершена, Google вирішила зробити її повністю доступною в Vertex AI і AI Studio з .
Gemini 2.5 Flash дозволить розробникам встановити ліміт токенів для мислення або просто відключити мислення взагалі. Google встановив ціну за 1 мільйон токенів у розмірі $0,15 за введення, а виведення відбувається у двох варіантах. Без мислення вартість виводу становить $0,60, але якщо увімкнути мислення, то вона зростає до $3,50. Опція “мислення” дозволить розробникам точно налаштувати модель так, щоб вона робила те, що вони хочуть, за гроші, які вони готові заплатити. За словами Доші, ви дійсно можете побачити поліпшення міркувань в бенчмарках, коли ви додаєте більше бюджету токенів.

Як і 2.5 Pro, ця модель підтримує функцію , яка може автоматично регулювати кількість роботи, яка йде на генерацію вихідних даних на основі складності вхідних даних. Нова модель Flash йде далі, дозволяючи розробникам контролювати мислення. За словами Доші, Google запускає цю модель зараз, щоб керувати вдосконаленням цих динамічних функцій.
“Частково причина, чому ми випускаємо модель у попередній версії, полягає в тому, щоб отримати від розробників відгуки про те, де модель відповідає їхнім очікуванням, де вона недодумує або передумує, щоб ми могли продовжувати ітерації над [динамічним мисленням]”, – каже Доші.
Втім, не варто очікувати такого точного контролю для споживчих продуктів Gemini прямо зараз. Доші зазначає, що основна причина, через яку ви захочете переключити мислення або встановити бюджет, – це контроль витрат і затримок, що має значення для розробників. Однак Google сподівається, що те, що вона дізнається на етапі попереднього перегляду, допоможе їй зрозуміти, чого користувачі та розробники очікують від моделі. “Наша мета – створити простіший досвід роботи з додатками Gemini для користувачів, зберігаючи при цьому гнучкість”, – каже Доші.
Зважаючи на швидкий темп випуску нових версій, фінальна версія Gemini 2.5 не здається такою вже й далекою. Google все ще не може поділитися жодними подробицями, але завдяки новим можливостям для розробників і доступності в додатку Gemini, Доші каже, що команда сподівається незабаром випустити сімейство 2.5 у загальний доступ.


