«Индустриальные бенчмарки: MERA, ruMMLU, Ru Arena Hard, MT Bench и AlpacaEval показали, что T-Lite и T-Pro превосходят все российские и зарубежные модели по общему уровню знаний, умению вести диалог и выполнять практические задачи», — говорится в сообщении.
Модели входят в Gen-T — семейство собственных специализированных языковых моделей группы «Т-Технологии». Они предназначены для решения конкретных узкоспециализированных задач в отличие от универсальных решений, таких как ChatGPT. Открытый доступ предполагает полностью бесплатное использование моделей для решения внутренних бизнес-задач и создания новых продуктов на базе LLM. Например, с помощью LLM можно создавать умных чат-ботов в поддержке, которые более приближены к человеческому общению и отвечают не по скриптам, а в режиме живого диалога. Это позволит частично или полностью автоматизировать разбор клиентских обращений.
В группе отмечают, что модели T-Lite и T-Pro основаны на базе моделей семейства Qwen-2.5, но показывают более высокое качество на задачах русского языка, чем оригинальные модели. Среди закрытых моделей T-Pro занимает второе место по ряду бенчмарков, уступая лишь GPT-4o.
Авто-репост. Читать в блоге >>>