Обзор новостей ИИ: GPT 4.5, Grog, Cloud 3.5 и другие

Краткое содержание обсуждения новостей в сфере ИИ:

GPT 4.5: Появились слухи о скором релизе GPT 4.5. Ранние тестеры предполагают, что это может быть настоящий AGI (Artificial General Intelligence). Microsoft готовится разместить у себя GPT 4.5 под кодовым названием Ar примерно на следующей неделе, а GPT 5 ожидается примерно в конце мая 2025 года.
Grok от Илона Маска (xAI): Grok стал бесплатным для всех, доступен через Twitter/X или сайт grok.com, но с жёсткими лимитами. После релиза Grok, оказалось, что пользователи тестировали Grok 2 вместо Grok 3 из-за ошибки.
Open Source модели от OpenAI: Сэм Альтман спрашивал у аудитории, что выпустить в Open Source: модель, сопоставимую с GPT 3 mini, либо Font sized Model для запуска на телефоне. В итоге победила GPT 3 mini.
Статистика Chat GPT: Недельное активное использование Chat GPT достигло 400 миллионов пользователей, что на 33% больше, чем 300 млн в декабре прошлого года. Количество платящих корпоративных пользователей удвоилось с сентября 2024 года и достигло 2 миллионов на февраль 2025 года. Трафик разработчиков, использующих API Open AI, удвоился за последние 6 месяцев, а трафик модели o3 вырос в пять раз за тот же период, несмотря на то, что o3 была выпущена месяц назад.
Оператор в Chat GPT: Оператор для pro-подписчиков теперь доступен и в других регионах, включая UK, Канаду, Индию, Японию, Сингапур, Южную Корею. В Европе по-прежнему оператор недоступен.
Whisper summary ai: Telegram бот, который расшифровывает аудио и видео, позволяя задавать вопросы по содержанию.
Децензурированная модель R1 от Plexi: Plexi взяли R1 и создали мультиязычный сет из тысячи примеров для её дообучения (fine-tuning). Компания ai Lab также добилась интересных результатов, децензурировав R1 и назвав это Open thinker.
Figure и Vision Language Action Model: Компания Figure представила модель vla, состоящую из двух моделей: маленькой VM на 7 млрд параметров и Трансформера на 80 млн. Роботы, использующие эту модель, могут коммуницировать друг с другом, передавая предметы из руки в руку.
Thinking Machines: Компания, основанная бывшим cto Open ai, мира мурати, и другими разработчиками из Open ai. Компания намерена делать мультимодальные модели, измерять прогресс и создавать более персонализированный ai.
Google и co-researcher: Google выпускает систему co-researcher, которая помогает генерировать новые гипотезы и предложения учёным, ускоряя научные прорывы. Модель показывает наилучшие результаты по сравнению с gemin 2.0 по СЕР. Примеры применения включают поиск новых вариантов перепрофилирования лекарств для лечения лейкоза и целей для фиброза печени, а также раскрытие механизма устойчивости к антибиотикам.
Агенты ИИ: 2025 год и грядущее десятилетие — это время агентов ИИ, что подтверждается конференцией ai engineer Summit.
Spotify и аудиокниги, озвученные ИИ: Spotify теперь поддерживает аудиокниги, озвученные ИИ от ElevenLabs. Авторы могут загружать свои работы и получать роялти.
Квантовые вычисления от Microsoft: Microsoft представила квантовый чип murana One с восемью топологическими кубитами на топопроводнике.
Muza от Microsoft: Новая модель от Microsoft, которая может генерировать 3D миры.
OpenAI подтвердили, что Клод 3,5 Sonet лучше в программировании: Open ai выпустила бенчмарк software engineer, где Клод 3,5 Sonet показал лучшие результаты, чем gpt 4o, в задачах по программированию.

Содержание

Слухи и анонсы о новых моделях ИИ
Реакция OpenAI и Сэма Альтмана
Расширение доступа к функциям OpenAI
Рост популярности ChatGPT и использование API OpenAI
Microsoft и GPT 4.5
Whisper Summary AI: Решение для обработки аудио и видео
R1 вырвался из клетки: Удаление цензуры
Open Thinker: Альтернативная модель R1
Figure и их прорывная модель VLA
Thinking Machines: Новая компания мира Мурати
Google Co-Researcher: ИИ-ассистент для ученых
Год агентов: Тенденция развития ИИ
Spotify и аудиокниги, озвученные ИИ
Прорыв в квантовых вычислениях от Microsoft
Muza: Генерация 3D-миров от Microsoft
Cloud 3.5 Sonet лучше других моделей в программировании

Слухи и анонсы о новых моделях ИИ

Поползли слухи о скором релизе GPT 4.5. Китайский R1 вырвался из клетки. OpenAI официально подтвердили, что модели конкурентов круче. Люди, роботы, привет! Это продсовет, уйма интересных новостей в индустрии нейросетей и технологии в общем. Всё это сегодня обсудим и продолжим наше обсуждение, конечно, с модели Илона Маска Grog 3, ну точнее, с модели xAI. Почему продолжим? Потому что отдельный ролик про Grog 3 с его обзором мы на неделе на канале выпустили. Посмотрите, если пропустили.

Появилось несколько интересных обновлений по Grog. Во-первых, он стал бесплатным для всех. После того, как мы уже выпустили ролик, там мы об этом не сказали, но теперь вы знаете: можно зайти либо через Twitter X, либо на сайт grog.com и бесплатно попользоваться. Но готовьтесь, что будут какие-то достаточно жёсткие лимиты. В некотором роде ситуация случилась после релиза Grog. Ребята, оказывается, выдали всем модельку Grog 2. Точнее, что-то там не подкрутили, не переключили, не ту кнопку нажали, и большая часть людей, которые сразу побежали тестировать Grog, на самом деле общались с Grog 2.

Но потом Игорь Бабушкин пришёл, сказал, что пардон, всё поправили, заходите снова, пробуйте по новой и используйте нашего чудного Grog. Своё мнение по этой модельке я так или иначе высказал в ролике. Действительно, передавая, действительно крутейшая модель, которая на некоторых тестах абсолютно превосходит всех своих конкурентов, на некоторых уступает. За подробностями сходите посмотреть.

Реакция OpenAI и Сэма Альтмана

Что, конечно, стало возможно следствием этого релиза, стали вот такие посты от Сэма Альтмана: первый опрос: «Что за осорсить, когда OpenAI последний раз что-то опенсорснула, именно в плане моделей?» Большой-большой вопрос. Я, например, не знаю. Сэм Альтман спрашивает у аудитории, что же выпустить в Open Source: модельку сопоставимую с GPT-3 mini, либо какую-то Font-sized Model, то бишь модельку, которую можно запустить на телефоне.

Благо, в итоге победила GPT-3 mini, несмотря на то, что она не являлась лидером на протяжении долгого количества времени. Надеемся, что это в Open Source и попадёт. И также Альтман вот поделился такой информацией, что ранние тестеры GPT 4.5, ну прям вот говорят, что это уж прямо AGI настоящий AGI по нашим ощущениям. Вот такой вот твит, что тоже нам намекает на то, что возможно GPT 4.5 где-то рядом и близятся.

Расширение доступа к функциям OpenAI

Менее значительная новость, но всё равно для кого-то важная: Operator для pro-подписчиков теперь доступен и в других регионах, включая UK, Канаду, Индию, Японию, Сингапур, Южную Корею. В Европе по-прежнему Operator пользоваться нельзя. Мы будем очень вам признательны, если вы подпишитесь на этот канал, поставите лайк и оставите коммент. Это поможет продвижению проекта и поможет вам не пропускать новые выпуски.

Рост популярности ChatGPT и использование API OpenAI

Смотрите, какой улыбчивый дядя нам здесь говорит о том, что недельное… я тут написал Мау, но вообще, конечно, ошибка непростительная. Это уже даже не ЦАУ, а должно быть ВАУ, потому что полный ВАУ. Недельное среднее использование ChatGPT достигло 400 миллионов пользователей. Не среднее, а Active Weekly users. Это на 33% больше, чем 300 млн в декабре прошлого года. Благодаря полезности ChatGPT, сарафанного радио.

Также я слышал версию о том, что ИИ на самом деле очень хорошенечко помог ChatGPT, потому что в целом повысил так называемую осведомлённость пользователей, населения нашего чудного шарика, о том, что есть вот такие вот крутые модели, ими можно пользоваться, ИИ вообще супер, надо скорее становиться продуктивнее, используя их в своей работе. Более того, OpenAI ещё делится такой интересной статистикой: 2 млн платящих корпоративных пользователей на февраль двадцать пятого года — это удвоение с сентября двадцать четвёртого года. Трафик разработчиков удвоился за последние 6 месяцев — это те, кто получают, используют ChatGPT, а точнее модель OpenAI через API. И трафик модели GPT-3 вырос в пять раз за последние 6 месяцев, несмотря на то, что GPT-3 было выпущено месяц назад. Угу.

Microsoft и GPT 4.5

А дядечка этот здесь неспроста. Это операционный директор BD Light Cap. Рад познакомиться. Ну а теперь о слухах. Уже сказал, что Альтман там закинул в посте какую-то информацию, намёк не намёк, как угодно это можно воспринимать. Но вот The Verge нам сообщает, что Microsoft готовится разместить у себя GPT 4.5 под кодовым названием Ar, что мы с вами знаем, уже на следующей неделе. А GPT 5 ожидается примерно в конце мая двадцать пятого года.

Whisper Summary AI: Решение для обработки аудио и видео

Мы тут с вами говорим про высокие технологии, и знаете, что я больше всего люблю в технологиях? Когда они решают наши конкретные проблемы быстро, дёшево и эффективно. Есть такой чудесный Telegram-бот под названием Whisper Summary AI. Загружаешь туда аудио или видео, и оно не только рас

R1 вырвался из клетки: Удаление цензуры

фрует, как это работает. Допустим, есть длинный вебинар, урок, голосовое сообщение, либо даже ссылка на YouTube, RuTube, Vimeo, Twitter. Вы открываете бота Whisper Summary AI, загружаете туда нужный файл или ссылку. Бот моментально всё это обрабатывает и выдаёт вам готовый текст. После расшифровки вы можете задать боту любые вопросы по содержанию, например, «что там этот дядя говорит про ИИ в этом ролике?», и он ответит, опираясь на текст.

Идеально для тех, кто либо конспектирует уроки, делает гайды, просто хочет разобраться в какой-то теме, но времени смотреть ролик нет. В настройках можно выбрать подходящую и модель. А если нужно вручную указать язык файла. На бесплатной версии дают три расшифровки, чтобы попробовать. А с подпиской у вас будет безлимит загрузок и до 6 часов обработки. Если хотите сэкономить время, выжить максимум из любого видео и аудио, то используйте Whisper Summary AI. Будет что-то непонятно? Напишите, и ВРТ вам помогут.

Open Thinker: Альтернативная модель R1

R1 вырвался из клетки! Вот такую чудную анимацию нам показывает perplexity AI. К чему это всё? А к тому, что ребята из perplexity взяли R1, зацензурировали все эти китайские моменты и мотивы, культурные особенности, но вы меня поняли, и расценку. Что сделали? Сделали такой разнообразный, различный, мультиязычный сет из тысячи плюс примеров для того, чтобы модель дофайн тюнить, перефармить, вот такие показатели по бенчмаркам получились у perplexity.

де-то чуточку по MMLU из-за такого подхода моделька просела, но, например, олимпиада по математике, наоборот, показатели стали лучше. Модель доступна на Hugging Face, но нужно понимать, что это как-никак вот эта сумасшедших размеров 600 миллиардная параметров модель. То есть, если у вас там где-то под столом кластер из видеокарт такой объёмный не завалялся, то вряд ли вы всё это чудо запустите.

Figure и их прорывная модель VLA

Я нашёл ещё одну компанию, которая называется bep clbs, и они рассказывают, что они тоже достигли интересных результатов. Им удалось расценку R1, они назвали это всё Open Thinker. Вот такие показатели у этих Open ров, и идут они в двух вариациях: 32 млрд параметров и 7 млрд параметров. Модель доступна через Ollama. Если вы хотите запускать локально и используете Ollama, то, пожалуйста, вот вам нужная команда.

И самое забавное, что компания вот эта AI Lab не прилагала никаких усилий целенаправленных к тому, чтобы как-то вот эту цензуру оттуда убрать. Они просто сделали специальный датасет на 114.000, ну, видимо, тех или иных примеров, вопросов, ответов, который вообще никак не затрагивал политику, но, тем не менее, почему-то модель там что-то себе придумала и перестала следовать политике партии. Такие вот интересные новости.

Thinking Machines: Новая компания мира Мурати

Figure, тот самый прорыв. Хочется спросить, если помните, на прошлой неделе рассказывал, что компания Figure разорвала контракт с OpenAI и сказала, что у них там что-то вот невероятно прорывное, революционное готовится, они справятся сами без больших языковых моделей от нашего любимого разработчика Chat GPT. На этой неделе компания приходит с таким анонсом, представляют модель VLA, то бишь Vision Language Action Model, которая на самом деле состоит из двух моделек: системы 2 и системы 1.

Первая — это моделька достаточно маленькая на 7 млрд параметров VLM Vision Language Model, вторая — это Трансформер на 80 млн, который, в принципе, работает и существует исключительно, чтобы вот совершать какие-то действия и передавать роботу понимание того, что нужно сделать. Компания говорит, что у них там робастная генерализация, невероятно, всё это круто работает в условиях абсолютной неопределённости, даже когда роботы совершенно не видели те или иные предметы, они способны с ними взаимодействовать. Много, действительно много разных подробностей, много интересных видео и примеров в этой статье, она достаточно объёмная.

Если интересно, можете зайти почитать. Ну, и наверное, самое неожиданное — это вот эта возможность роботов коммуницировать друг с другом. Они оба используют одну и ту же модель, и они каким-то образом друг друга промтят, либо, может быть, человек их промтит, говоря одному роботу «передай», а другому роботу, говоря «прими». Модели абсолютно одинаковые в обоих вот этих в обоих механических друзьях, и, видите, грузится… Ollama здесь отказывает, но они действительно из руки в руку, из клешни в клешню передают, например, там что-то пакетик с овсянкой, ну, или вот что-то иное.

Google Co-Researcher: ИИ-ассистент для ученых

Thinking Machines. Но это уже другая новость. С таким названием, с названием компании. Наконец-таки пришла в медиапространство мира. Мурати — это бывший, cto, если я не ошибаюсь, компании OpenAI. Она вот какое-то время назад оттуда ушла и прихватила с собой ещё несколько, если не десятков, то несколько крутейших разработчиков из OpenAI, включая Барета Зоф, включая Джона Шульмана, который является сооснователем OpenAI, и огромное количество других крутых исследователей, которые работали на Chat GPT, AI, P torch, Mistral и вот сделали такую чудную компанию под названием Thinking Machines. Не могу пока сказать, чем это всё будет кардинально отличаться от OpenAI.

У них есть на их сайте… сайт, вот ссылочка на сайт. Есть некоторое количество тезисов, которые как будто бы говорят о том, что больше намерена компания выкладывать в Open Source, делать какие-то публичные посты, выкладывать код. Там, кстати, слово Open Source особо и не присутствует, просто говорят: «Мы будем более публичны». Ну, и делают упор на то, что нужно делать мультимодальные модели, нужно измерять прогресс, измерять то, что действительно нужно, важно для людей и делать более персонализированный AI, который будет не только направлен на решение математических задач или программирования, но и в целом для всего человечества будет важен и полезен. Честно, абсолютно не понимаю, чем же это всё-таки отличается от того, что вот сейчас делает OpenAI.

Как бы кардинальных больших различий не вижу. OpenAI там в их дорожной карте или в их уставе тоже написана куча красивых, сладких, интересных словечек. Будем ждать какой-то продукт, релиз или исследование от Thinking Machines. Обязательно вам расскажем.

Год агентов: Тенденция развития ИИ

Ускорится любой ценой! Вот помните, как когда ещё ходили слухи о Strawberry, о том, что вот какое-то там что-то невероятное у OpenAI готовится внутри. Потом оказалось, что это, собственно, нинг-модели. Очень многие полагали, что эти слухи относятся к какому-то AI researcher. Ну, и вообще, это понятный Вектор, куда двигаются все AI лабы — сделать себе researcher, который будет двигать технологический прогресс и в AI, и в любых других областях, просто чтобы вот мы достигли этой сингулярности по не по какой-нибудь там линейной шкале, а желательно по интегральной.

Но вот Google выпускает так называемого ко-researcher. Мне переводчик решил написать «и сонаучников». Ну, пусть так. Этот и сонаучников включает в себя… Это многоагентная система, которая помогает генерировать новые гипотезы и предложения учёным в первую очередь, ускоряя научные прорывы. В этом основная задумка. Достаточно непростая система, которая в сравнении с Gemini 2.0 по СР получает наилучшие результаты, выше 1400 уже забирается. И, конечно, чем больше эта модель размышляет, это тоже Нинг-модель или какая-то сборная солянка из не ризон, тем лучше она даёт точность и тем более качественные результаты.

Пока что это всё чудо потрогать, попробовать нельзя. Ну, вот где-то оно там потом появится, но, тем не менее, пока что вот на стадии пера исследования Google делится такой информацией. Интересно всё-таки, как это будет действительно применяться, какие есть уже примеры того, что сделала эта модель. Google приводит как минимум вот два таких примера: новые варианты перепрофилирования, перепрофилирования лекарств для лечения лейкоза и цели для фиброза печени. Ну, видимо, тоже поиск определённых препаратов, чтобы это лечить и раскрыл механизм устойчивости к антибиотикам. Такой вот чудный со-научник.

И вот тут как раз хочется сделать маленькое лирическое отступление, наверное, о том, что двадцать пятый год, я в целом про это говорил, и вообще десятилетие грядущее — это э, десятилетие или конкретно двадцать пятый год — это год агентов. В целом, мы это с вами уже наблюдаем. Большое количество компаний с какими-то агентами выходят: тот же Deep Search depr Search, этот самый Google со-научник.

И вот в Telegram-канале я делал ещё пост о том, что проходит сейчас конференция, вот буквально сейчас, когда записываю этот ролик, AI Engineer Summit, где огромное количество интересных компаний и конкретно из и индустрии, и, в принципе, из какой-то другой индустрии, финансовой и не только, рассказывает о том, как использовать и агентов. Я прикрепил вот две ссылочки на уже, скорее всего, записи этих выступлений. Там и OpenAI, и Anthropic, и Mistral, все повыступали, что-то интересное рассказали. На 8 часов каждый ролик на ютубери. Если сон не идёт, то почему бы ночку с пользой и не провести.

Spotify и аудиокниги, озвученные ИИ

Может быть пора Удариться в и Content Mate? Как минимум, Spotify теперь поддерживает аудиокниги, озвученные и от El laabs. Авторы могут загрузить свои работы через find Way Voices, и после проверки Spotify всё это смело может опубликовать, а вы получить какой-то роялти. Вот здесь нужно свести дебет с кредитом и посмотреть, сможете ли вы окупить свою подписку в 11v laabs Pro 99 долларов в месяц, чтобы до 500 минут озвучивать различный текст, и получится ли, собственно, со Spotify эти деньги заработать. Но бизнес-идею я вам озвучил.

Прорыв в квантовых вычислениях от Microsoft

Прорыв в квантовых вычислениях или нет? Microsoft на этой неделе Представила их чип murana One, это квантовый чип с восемью топологических кубита на топопроводнике. Как бы про кубиты кванты мы слышали. Вот про эти топологические топопроводники, честно говоря, нет. Но нам Microsoft заявляет, что последние 20 лет исследований завершились Вот именно таким интересным прорывом. Кубиты из арсенида Индия и алюминия размером всего, мм. Более того, варки шпатель на канале выложил такой вот интересный ролик, собственно интервью с Сатья Наделла, где, конечно, Вот видите, в руке Он держит этот чип, они так или иначе про это разговаривают.

Посмотреть его не успел, Но если вам интересно, то оставляю здесь этот ролик. И Microsoft сами выложили более короткий ролик на всего там 12 минут о том, как это всё чудо работает. Как я понял, это не является каким-то невероятным прорывом. Microsoft это всё позиционирует как путь к миллионам кубив, что и должно как будто бы победить вот эту декогеренция проблему квантовых вычислений, чтобы сделать кубиты более надёжными и надёжнее классических вариантов. Пока что, как я уже сказал выше, это восьмикутна система, Но вот позиционирование такое: сначала соточку, потом и туда вот дальше пойдём.

Muza: Генерация 3D-миров от Microsoft

Muza меняет игры. Muza — Это новая модель снова от Microsoft, которая может генерировать 3D миры. Вот сейчас покажу вам, как это выглядит примерно таким образом. Use от Xbox Microsoft research обученный на bleeding Edge, Я так понимаю это какая-то игра, расширяет горизонты геймплея с глубоким пониманием 3D миров. Одна из идей, почему это прикольно и важно, потому что можно адаптировать старые игры для современных устройств.

Ну и ускорить создание различных прототипов, сохраняя классику и обогащая контент, как это раз уже рассказывал про подобные компании, которые тренируют свои модельки, например, на Майнкрафте, на Вот таких мирах, и потом можно действительно в латентно пространстве по большому счёту рубиться в Minecraft. А здесь видите и вот в другие игры. Ну, Судя по всему, конкретно в bling Edge пока что это недоступно для того, чтобы попробовать, но у них там есть некоторые copilot experimental. Туда можно зайти, подать заявочку и ожидать, пока вам выт выдадут доступ к этой модельке и даже вероятно можно быт что-то пог нери. Достаточно интересно.

Cloud 3.5 Sonet лучше других моделей в программировании

Ну, и наконец, OpenAI официально подтвердили. Они, конечно, это не артикулировали, но цифры говорят сами за себя, что Cloud 3.5 sonet просто-напросто в реальной жизни лучше, когда мы говорим про программирование. Вот такой бенчмарк выпустила компания OpenAI под названием software engineer. Он тестирует и на 1400 и более задачах subw с биржи фриланса общей стоимостью примерно на миллион долларов, проверяя полный цикл разработки и взять задачу, и написать код, и задебажить, и несколько итераций ещё сделать. И вот что самое интересное, Они смотрят, сколько же денег смогла бы заработать та или иная модель.

Задача очень разные, там от 50 20 долларов до 30.000 долларов за задачу. Половины снет, если вот Вы посмотрите на нижний показатель заработал 43.000 долларов, То есть точность 43%. В то время как даже модель o1, причём они говорят, что это что это модель o1 High здесь мне кажется, а написано, что это o1 High на Хай ризон набрала меньше. GPT 4o вообще на 10% меньше. Ну и там несколько… Ну и там… Ну и там чуть-чуть адаптированные бенчмарки SW медр, SW Diamond, где статистика может маленько отличаться, тем не менее, Cloud просто порвал всех. Понимаете, модель которой уже практически год до сих пор является лидером для программирования.

Ну, правда они там её Обновили полгода назад, Но неважно. Мне кажется интересной И в чём-то заставляющий поразмышлять, задуматься новости вышли на этой неделе. Чтобы не пропускать новые выпуски, подпишитесь на этот канал, поставьте комментарий и лайк. А лучше Поставьте лайк и Оставьте комментарий, и увидимся в будущих выпусках. Пока