Google оголосив, що в Gemini з’явиться ще одна модель штучного інтелекту, але цього разу це більше, ніж чат-бот. У додатку Gemini та на веб-сайті компанії з’явився відеогенератор Veo 2, який дає можливість платним клієнтам створювати короткі відеокліпи за допомогою нібито найсучаснішої відеомоделі Google.
Veo 2 працює так само, як і інші відеогенератори: ви вводите текст з описом потрібного відео, а центр обробки даних Google перебирає токени, поки не отримаєте анімацію. що Veo 2 був розроблений з урахуванням фізики реального світу, зокрема, того, як рухаються люди. Приклади Google виглядають добре, але, ймовірно, саме тому вони і були обрані.
Підказка: Аерознімок трав’янистої скелі на піщаному пляжі, де хвилі розбиваються об берег, видатний морський стовп піднімається з океану біля пляжу, купаючись у теплому, золотистому світлі сходу або заходу сонця, захоплюючи безтурботну красу тихоокеанського узбережжя.
Підказка: Аерознімок трав’янистої скелі на піщаному пляжі, де хвилі розбиваються об берег.
Veo 2 буде доступний у випадаючому списку моделей, але Google зазначає, що все ще розглядає способи інтеграції цієї функції, і тому місце розташування може змінитися. Однак, ймовірно, поки що її там взагалі немає. Google починає розгортання сьогодні, але може пройти кілька тижнів, перш ніж всі передплатники Gemini Advanced отримають доступ до Veo 2. Функції Gemini можуть з’являтися у більшості користувачів напрочуд довго – наприклад, Google знадобилося близько місяця, щоб зробити відео Gemini Live доступним для всіх після оголошення про його випуск.
Коли Veo 2 з’явиться у вашому додатку Gemini, ви зможете надати йому стільки деталей, скільки захочете, що, за словами Google, забезпечить вам точний контроль над кінцевим відео. Наразі функція Veo 2 обмежена 8 секундами відео з роздільною здатністю 720p, яке ви можете завантажити як стандартний файл MP4. Генерація відео використовує навіть більше обчислювальних ресурсів, ніж ваша середня генеративна функція ШІ, тому Google запровадила щомісячний ліміт. Однак компанія не підтвердила, що це за ліміт, сказавши лише, що користувачі отримають сповіщення, коли вони наблизяться до нього.
Підказка: Анімований знімок крихітного мишеняти у великих окулярах, який читає книгу при світлі гриба, що світиться, у затишній лісовій нірці.
Якщо ви не хочете чекати на появу Veo 2 у додатку Gemini, є спосіб погратися з нею раніше. Новий відеогенератор Google також додано до Whisk, експерименту Google Labs, анонсованого наприкінці минулого року. Whisk дозволяє створювати зображення, використовуючи як текстові підказки, так і приклади зображень.
Починаючи з сьогоднішнього дня, з’явилася опція “анімувати”, яка використовує Veo 2 для перетворення ваших фотографій на 8-секундні відеокліпи. Цікаво, що Google вказує на 100 відеороликів на місяць для Whisk, що може означати таку ж стелю для використання Veo 2 у Gemini. Навіть з можливістю вдосконалити початкове зображення і стиль, ми не були надто вражені Veo 2. Тож ви можете пробігтися по ньому в пошуках того, що вам потрібно.
Вищезгадане відео мало показати загадковий кам’яний моноліт на Марсі, рендеринг якого здається досить хорошим. Але ми попросили показати, як марсіанський супутник Фобос обрушиться на моноліт і перетворить його на пил. “Місяць” просто пролітає повз і зникає, відкриваючи той самий моноліт. Принаймні в тому, що стосується планетних тіл, розуміння фізики Veo 2 може покращитися.
Принаймні в тому, що стосується планетарних тіл.
Google заявляє, що доклав чимало зусиль, щоб гарантувати, що Veo 2 безпечний і не генерує нічого протизаконного або підбурювального. Згенеровані відео також позначені символом “a”, щоб позначити їх як створені штучним інтелектом. Хоча Veo 2, ймовірно, ще не на тому етапі, коли його результати можна буде сплутати з реальністю.


