Категорії: Бізнес Ідеї

Deep Cogito виходить зі стелсу з гібридними моделями “міркувань” ШІ

Нова компанія , , вийшла з тіні з сімейством відкритих моделей ШІ, які можна перемикати між режимами “міркування” і “не міркування”.

Моделі міркувань, такі як OpenAI, показали велику перспективу в таких галузях, як математика і фізика, завдяки їхній здатності ефективно перевіряти факти, працюючи над складними проблемами крок за кроком. Однак це міркування має свою ціну: більш високі обчислення і затримки. Саме тому ми шукаємо “гібридні” архітектури моделей, які поєднують компоненти міркувань зі стандартними, не пов’язаними з міркуваннями елементами. Гібридні моделі можуть швидко відповідати на прості запитання, витрачаючи додатковий час на розгляд більш складних запитів.

Усі моделі Deep Cogito, які називаються Cogito 1, є гібридними моделями. Cogito стверджує, що вони перевершують найкращі відкриті моделі такого ж розміру, в тому числі моделі від Meta і китайського стартапу AI.

“Кожна модель може відповідати безпосередньо […] або саморефлексувати перед відповіддю (як моделі міркувань)”, – повідомляє компанія. “[Всі вони] були розроблені невеликою командою приблизно за 75 днів”.

Моделі Cogito 1 мають від 3 мільярдів параметрів до 70 мільярдів параметрів, і Cogito заявляє, що в найближчі тижні і місяці до них приєднаються моделі з 671 мільярдом параметрів. Параметри приблизно відповідають навичкам моделі вирішувати проблеми, причому чим більше параметрів, тим краще.

Cogito 1 не був розроблений з нуля, щоб бути зрозумілим. Deep Cogito спирається на відкриті моделі Llama від Meta та Qwen від Alibaba, щоб створити свою власну. Компанія заявляє, що застосувала нові підходи до навчання, щоб підвищити продуктивність базових моделей та уможливити перемикання міркувань.

Згідно з результатами внутрішнього бенчмаркінгу Cogito, найбільша модель Cogito 1, Cogito 70B, з міркуваннями перевершує модель міркувань DeepSeek R1 за кількома математичними та мовними оцінками. Cogito 70B з вимкненими міркуваннями також затьмарює нещодавно випущену Meta модель Llama 4 Scout на LiveBench, універсальному тесті ШІ.

Кожна модель Cogito 1 доступна для завантаження або використання через API хмарних провайдерів Fireworks AI і Together AI.

Deep Cogito, серед прихильників якої є South Park Commons, має амбітну мету створити “загальний суперінтелект”. Засновники компанії розуміють під цим словосполученням ШІ, який може виконувати завдання краще, ніж більшість людей, і “відкривати абсолютно нові можливості, які ми ще не можемо собі уявити”.

Poster Adam

Наступний Всередині стартапу електромобілів, який таємно підтримує Джефф Безос »

Попередній « 25-річний творець поліцейських безпілотників щойно зібрав $75 млн на чолі з Index

Залиште коментар

Поділитись...

Опубліковано

Poster Adam

1 рік тому

Розкриті електронні листи показали, як Meta намагалася підтримувати культурну релевантність Facebook
Позаду залишився перший тиждень роботи Meta, а документи, опубліковані Федеральною торговою комісією США (FTC), дали…
Ілля Суцкевер використовує Google Cloud для досліджень свого стартапу зі штучного інтелекту
Новий стартап Safe Superintelligence (SSI), співзасновника OpenAI і колишнього головного наукового співробітника Іллі Суцкевера, використовує…
Google впроваджує стандарт Anthropic для зв’язку моделей штучного інтелекту з даними
Після того, як OpenAI заявила, що візьме на озброєння конкурентний стандарт Anthropic для підключення моделей…

Раніші дописи

Криптовалюти

Crypto Daybook Americas: Прорив біткоїна піднімає ШІ, мемокоїни та підкреслює цінність хеджування

Ваш прогноз на 21 квітня 2025 року Ви переглядаєте Crypto Daybook Americas, ваш новий ранковий…

1 рік тому

Стратегія купила $555 млн біткоїнів, збільшивши загальний запас до 538 200 BTC

Компанія витратила на біткоїн $36,47 млрд на сьогоднішній день і залишається найбільшим корпоративним власником BTC.

1 рік тому

Zora, що базується на монетній базі, випустить токен після тижня суперечливого просування

"Хороший маркетинг", - написав відомий криптотрейдер на X. Ончейн-платформа соціальних мереж Zora заявила, що її…

1 рік тому

Оновлення показників CoinDesk 20: NEAR зріс на 11,7%, провідний індекс виріс на вихідних

Аптос (APT) приєднався до протоколу NEAR (NEAR) в якості лідера, набравши 8,7% з п'ятниці. Представляємо…

1 рік тому

Бізнес Ідеї

OpenAI представляє Codex CLI, інструмент для кодування терміналів з відкритим вихідним кодом

Намагаючись впровадити ШІ в процес програмування, OpenAI запускає "агента" кодування, призначеного для локального запуску з…

1 рік тому

Бізнес Ідеї

Прочитайте, що Марк Цукерберг та керівники Facebook говорили про Instagram, перш ніж купувати його

Перший тиждень приніс нові одкровення про те, як компанія, раніше відома як Facebook, підійшла до…

1 рік тому

Deep Cogito виходить зі стелсу з гібридними моделями “міркувань” ШІ

Leave a Comment

Пізніші дописи

Раніші дописи

Crypto Daybook Americas: Прорив біткоїна піднімає ШІ, мемокоїни та підкреслює цінність хеджування

Стратегія купила $555 млн біткоїнів, збільшивши загальний запас до 538 200 BTC

Zora, що базується на монетній базі, випустить токен після тижня суперечливого просування

Оновлення показників CoinDesk 20: NEAR зріс на 11,7%, провідний індекс виріс на вихідних

OpenAI представляє Codex CLI, інструмент для кодування терміналів з відкритим вихідним кодом

Прочитайте, що Марк Цукерберг та керівники Facebook говорили про Instagram, перш ніж купувати його