YandexGPT Lite третьего поколения ошибается в 44% случаев

30.05.2024

Компания «Яндекс» запустила YandexGPT 3 Lite — облегчённую версию собственной генеративной нейросети третьего поколения. Она будет доступна клиентам облачной платформы Yandex Cloud через API. Новая модель полезна в сценариях, где важна скорость ответа: например, её можно использовать в чат-ботах, для проверки орфографии или анализа данных. Согласно уверениям разработчика YandexGPT 3 Lite — это оптимальная по цене и качеству коммерческая модель для решения рутинных задач, которая подходит для разных типов бизнеса, от небольших компаний до крупных организаций. С её помощью можно оптимизировать такие задачи, как консультация клиентов в чате и по телефону, подготовка ответов для службы поддержки, создание маркетинговых материалов или дайджеста рабочих встреч. Крупные компании со сложными бизнес-процессами и большим потоком информации могут применять её для анализа данных, необходимых для принятия решений.

«Яндекс» запустила YandexGPT 3 Lite — облегчённую версию собственной генеративной нейросети третьего поколения

Новая модель по многим параметрам превосходит YandexGPT 2 Lite — облегчённую модель предыдущего поколения. По итогам теста YaMMLU_ru (русскоязычной версии международного эталонного теста MMLU), новая модель даёт на 6 п. п. больше верных ответов, чем модель предыдущего поколения (56% vs 50%). Модели сравнивали также по методике Side by Side: нейросети отвечали на одни и те же вопросы, а эксперты выбирали лучший ответ. В среднем YandexGPT 3 Lite отвечала лучше, чем YandexGPT 2 Lite, в 68% случаев. Эксперты оценивали также, насколько хорошо новая модель справляется с задачами классификации, генерации контента, ответами на вопросы и другими основными типами бизнес-задач и получили примерно те же результаты. Кроме того, новая модель допускает меньше орфографических и фактических ошибок, чем модель второго поколения YandexGPT 2 Lite.

Для создания новой модели разработчики усовершенствовали все этапы обучения. В частности, улучшили отбор данных для предварительного этапа обучения (pretraining), повысив долю полезной информации. А кроме того, стали использовать на этом этапе технологию curriculum learning, позволяющую поэтапно усложнять данные. На втором этапе обучения (alignment, или выравнивание модели), включающем в себя обучение с подкреплением (reinforcement learning), улучшили модель для оценки качества ответов нейросети. Кроме того, в архитектуру нейросети добавили технологию Grouped Query Attention — она ускоряет обработку данных без потери качества.

YandexGPT 3 Lite можно интегрировать в свои продукты через API в сервисе Foundation Models. Новая модель заменит предыдущую в течение месяца, но попробовать её можно уже сейчас. Стоимость использования YandexGPT 3 Lite — 20 копеек за тысячу токенов. Новые пользователи Yandex Cloud могут бесплатно протестировать её в демо-режиме.


Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует