«Яндекс» выпустил новое — четвертое — поколение генеративных нейросетей, сообщили в пресс-службе компании.
YandexGPT — это нейросеть, которая умеет создавать и перерабатывать тексты, предлагать новые идеи и учитывает контекст беседы с пользователем.
Новая линейка включает мощную языковую модель Pro и облегченную версию Lite. Они, как отмечается, превосходят по качеству ответов предыдущие версии, способны рассуждать и обрабатывать в четыре раза более длинные запросы. Это позволяет использовать нейросети для решения более сложных и разнообразных бизнес-задач, от анализа обращений клиентов до автоматизации закупок.
Модели четвертого поколения уже доступны по API в Yandex Cloud, часть функций пока работают в тестовом режиме. В будущем они появятся в сервисах «Яндекса» для широкой аудитории. Первым таким сервисом станет голосовой помощник «Алиса» с опцией «Про».
«Новые модели применимы в разных сферах бизнеса. С их помощью можно сортировать письма и заявки клиентов, анализировать резюме и решать другие задачи, связанные с обработкой текста. Версия Pro больше подходит для сложных трудоемких задач — например, анализа продаж. Lite будет полезна в более простых сценариях, где важна скорость ответа», — отмечают в «Яндексе».
По качеству ответов YandexGPT 4 Pro выигрывает у модели прошлого поколения в среднем в 70% случаев, а в некоторых типах задач — например, в ответах на открытые вопросы — вплотную приближается к GPT-4o (GPT-4 Omni — это новейшая модель чат-бота ChatGPT и преемник GPT-4, разработанная компанией OpenAI).
Версия Lite отвечает не хуже самой мощной модели «Яндекса» прошлого поколения. Это стало возможным благодаря улучшению процесса обучения. В частности, разработчики научили нейросеть рассуждать — на примерах с пошаговым решением задач, поясняют в компании.
Модели нового поколения также способны рассуждать (поддерживать функцию chain-of-thought). Прежде чем ответить на сложный вопрос, они разбивают задачу на более простые и решают их пошагово, выстраивая цепочку рассуждений. Это не только улучшает качество ответов, но и помогает нейросети отвечать на вопросы, которые требуют анализа. Например, новая модель способна изучить жалобу клиента, разобраться в проблеме и предложить выход из ситуации. В будущем в API появится возможность включать скрытые рассуждения для всех запросов.
Новые модели в среднем в два раза быстрее предыдущих отвечают на вопросы.
Кроме того, нейросети нового поколения обрабатывают в четыре раза больше текста, чем модели третьего поколения. В итоге они гораздо дольше удерживают контекст беседы, могут отвечать на сложные длинные вопросы и анализировать порядка 60 страниц текста. Новые модели лучше отвечают на вопросы с опорой на внешние источники. Такими источниками могут быть, например, документы компании или статьи. Доля ошибок, в том числе выдуманных фактов, снизилась в таких сценариях почти в два раза — с 4% до 2,1%.
YandexGPT 4 умеет и генерировать команды для сторонних приложений. Например, если попросить нейросеть найти билет на самолет, она напишет команду для сервиса авиабилетов, чтобы он запустил функцию поиска мест. Генерация команд станет доступна в Yandex Cloud в ближайшее время, и разработчики смогут использовать новые модели для работы с внешними приложениями. Для этого им нужно будет описать функции и правила составления команд, а модель будет сама определять, когда ими воспользоваться.
Предыдущее — третье — поколение больших языковых моделей YandexGPT «Яндекс» представил в конце марта 2024 года. Первой в линейке появилась YandexGPT 3 Pro, а через два месяца компания запустила YandexGPT 3 Lite — урезанную версию «старшей» языковой модели YandexGPT 3.