Gemini стає все більш хорошим чат-ботом, але все ще поганим помічником

Google оголосив про намір об’єднати свої зусилля в галузі генеративного ШІ під брендом Gemini наприкінці 2023 року, і відтоді робота над цим проектом триває повним ходом. У 2025 році Google Assistant буде . Оскільки Google, , та інші компанії рухаються до світу, в якому всі віртуальні помічники базуються на генеративному ШІ, є сенс замислитися над тим, чи дійсно це гарна ідея. Незважаючи на обіцянки “розумнішого” ШІ і постійно зростаючі ліміти токенів, ці роботи все ще мають фундаментальну ваду, яка може зробити їх поганими помічниками: Вони брешуть.

Звісно, вони не ставлять собі за мету брехати, бо не знають, що таке “брехня”. Ці системи намагаються згенерувати найбільш правдоподібну наступну лексему для побудови висновку. Через це генеративний ШІ є недетермінованим – ви не можете передбачити результат, і навіть запуск однієї і тієї ж підказки кілька разів дасть різні відповіді.

Іноді це може виглядати вражаюче як мислення, але це також призводить до частих галюцинацій. Ось чому iPhone і Google . Прихильники GenAI, такі як Google і Apple, намагаються приборкати хаос , але це завжди може бути проблемою через природу базової технології.

Прихильники генеративного мислення, такі як Google і Apple, намагаються приборкати хаос , але це завжди може бути проблемою через природу базової технології.

Навіть якщо асистент генеративного ШІ має рацію більшу частину часу – а ми наближаємося до цього моменту – випадкова галюцинація все одно може зіпсувати вам день. І все ж Google з невпинною ефективністю вбудовує генеративний ШІ в кожен свій продукт, тому ми всі спостерігаємо, як Асистент в’яне і вмирає на користь Gemini.

Довіряй, але перевіряй

Я не дуже прихильний до Assistant – йому бракує багато функціональності, а іноді помилки можуть настільки розчаровувати, що я шкодую, що взагалі взявся за нього. Однак я майже впевнений, що буду сумувати за ним, коли він зникне. Assistant чудово справляється з такими базовими речами, як встановлення таймерів та надсилання повідомлень, і робить це без зайвої метушні. Це ті речі, з якими Gemini, незважаючи на всю свою хмарну обчислювальну потужність, все ще не справляється. Для чогось більш складного або важливого Gemini гірше, ніж неефективний – він не заслуговує на довіру.

Google використовує теоретичну потужність генеративного штучного інтелекту, щоб надати Gemini доступ до даних з різних додатків. Коли це працює, це може бути дуже зручно. Наприклад, ви можете попросити Gemini перевірити вашу електронну пошту на наявність певного повідомлення, витягти дані і передати їх в інший додаток. Спочатку я був у захваті від цієї функціональності, але на практиці вона змушує мене сумувати за тим, що Асистент просто виходив з ладу, не витрачаючи на це мій час.

Я згадав про цю проблему нещодавно, коли попросив Gemini знайти номер відстеження відправлення з електронного листа – я роблю це досить часто. Здавалося, все працювало чудово, робот вказав правильну адресу електронної пошти і видав довгий рядок чисел. Я не зрозумів, що щось не так, поки не спробував знайти номер відстеження. Він не працював у пошуковому трекері Google, а перехід на сайт Поштової служби США призвів до помилки.

Тоді мене осяяло: Номер для відстеження не був номером для відстеження; це була конфабуляція. Це було правдоподібно, до того ж. Номер був приблизно правильної довжини, і, як і всі номери для відстеження USPS, він починався з дев’ятки. Я міг би сам перевірити номер відстеження за частку часу, який знадобився Близнюкам, щоб усунути помилку, і це дуже, дуже засмучує. Gemini, схоже, був упевнений, що виконав завдання, яке я йому дав, але злитися на чат-бота не допоможе – він не може зрозуміти мою злість так само, як не може зрозуміти суть мого початкового запиту.

У цей момент я готовий вбити за “Вибачте, я не розумію” від Асистента.

Це лише один з багатьох подібних інцидентів, які трапилися з Gemini за останній рік – я не можу порахувати, скільки разів Gemini додавав події в календарі не на той день або вносив неправильні дані в примітку. Справедливості заради, Близнюки зазвичай виконують ці завдання правильно, але його механічна уява блукає досить часто, що ставить під сумнів його корисність як асистента. Асистент просто не міг зробити багато речей, але він не витрачав мій час, вдаючи, що може. Близнюки більш підступні, стверджуючи, що вирішили мою проблему, коли насправді відправляють мене в кролячу нору, щоб виправити свої помилки. Якби так діяв людський помічник, мені довелося б зробити висновок, що він некомпетентний або відверто зловмисний.

Як і всі фірми, що розробляють генеративний ШІ, Google включає в Gemini застереження про те, що він може робити помилки, і користувачі повинні перевіряти його роботу. Якщо я використовую Gemini для чогось навіть віддалено важливого, будьте певні, я ретельно перевіряю, що він робить. Можливо, це життєздатно для деяких завдань, але в той момент я міг би з таким же успіхом зробити все сам.

Google має що сказати про введення-виведення

Коли Google пішов ва-банк з Асистентом, він створив широкий набір інструментів для розробників, щоб вони могли створювати інтеграції та експериментувати з системою в діалоговому режимі. Тепер розробники починають з нуля в епоху Gemini, оскільки Google намагається завершити роботу над Асистентом до кінця року. Google зробила велику ставку на вдосконалення Gemini, і всі будуть шукати докази цього на Google I/O.

Це, звичайно, не сюрприз. Від самого початку Gemini витісняв Асистента в бік. Коли Google випустила додаток Gemini для Android, ви навіть не могли встановити його, не відключивши Асистента на телефоні.

Щорічний захід Google I/O нібито призначений для розробників, і багато хто з учасників, як віртуальних, так і реальних, пам’ятають, коли Асистент був ключовим елементом стратегії Google. Багато з них, напевно, провели час, працюючи з інструментами для розробників Assistant, але цього року Google буде ще активніше представляти Gemini.

Кожен, хто підключений до платформи Google, може підтвердити, що Gemini пройшов довгий шлях. Google не міг дочекатися, щоб зробити його помічником для всіх, навіть якщо йому не вистачало функцій у порівнянні з Google Assistant. Google рухається швидко, намагаючись наздогнати OpenAI, випускаючи нові моделі Gemini так швидко, що за ними важко встигнути. Деякі з них, такі як нова , починають демонструвати помітні покращення. Але чи можна довіряти Gemini в управлінні календарем або електронною поштою? Поки що ні.

Gemini стає все більш хорошим чат-ботом, але все ще поганим помічником

Довіряй, але перевіряй

Google має що сказати про введення-виведення

Залишити відповідь Скасувати коментар

Останні коментарі

Останні публікації

Довіряй, але перевіряй

Google має що сказати про введення-виведення

Залишити відповідь Скасувати коментар

Категорії

Останні коментарі

Останні публікації