Forklog
2024-12-11 10:33:20

«Т-банк» выложил LLM на 32 млрд параметров в открытый доступ

«Т-банк» открыл доступ к двум большим языковым моделям (LLM) T-Pro и обновленной версии T-Lite. Об этом пишут «Ведомости» со ссылкой на представителя банка. Профессиональная версия нейросети обладает 32 млрд параметров, T-Lite — 7 млрд. Вторую представили в июле 2024 года.  Количество параметров отражает способность модели учитывать больше контекста, лучше запоминать информацию и давать точные ответы. Для сравнения, у Llama 3.1 405B от Meta 405 млрд параметров, у Large 2 от французского стартапа Mistral — 123 млрд. Открытый доступ к T-Pro и T-Lite позволит бизнесу бесплатно применять нейросети для решения внутренних задач и создавать новые продукты на базе разработанных моделей. В пример «Ведомости» привели умные чат-боты для службы поддержки и ассистентов для сотрудников вроде инструментов по написанию кода, составления отчетов или исследований. Представленные модели входят в семейство LLM Gen-T, предназначенное для решения узкоспециализированных задач. Этим они отличаются от ChatGPT, который универсален. T-Lite и T-Pro созданы на базе Qwen-2.5 от китайского разработчика Alibaba Group и адаптированы под русский язык. «Такой подход позволяет “Т-технологиям” существенно сократить затраты на создание больших языковых моделей — на 80–90% по сравнению с компаниями, которые обучают их с нуля. При этом качество решений LLM-продуктов на русском языке превосходит решения, базирующиеся на открытых и проприетарных моделях от OpenAI, Google и Anthropic», — отметил представитель банка. Бизнес может запустить языковые модели на своих серверах и дообучить под конкретный кейс, подчеркнул CEO Dbrain Алексей Хахунов. Напомним, в декабре в России представили виртуального ассистента на базе ИИ для психологов, который в два раза повышает продуктивность, качество услуг и выручку. В том же месяце российские ученые презентовали новую открытую среду XLand-MiniGrid, которая предназначена для разработки алгоритмов контекстного обучения с подкреплением — отдельного направления в ИИ-исследованиях.

Ricevi la newsletter di Crypto
Leggi la dichiarazione di non responsabilità : Tutti i contenuti forniti nel nostro sito Web, i siti con collegamento ipertestuale, le applicazioni associate, i forum, i blog, gli account dei social media e altre piattaforme ("Sito") sono solo per le vostre informazioni generali, procurati da fonti di terze parti. Non rilasciamo alcuna garanzia di alcun tipo in relazione al nostro contenuto, incluso ma non limitato a accuratezza e aggiornamento. Nessuna parte del contenuto che forniamo costituisce consulenza finanziaria, consulenza legale o qualsiasi altra forma di consulenza intesa per la vostra specifica dipendenza per qualsiasi scopo. Qualsiasi uso o affidamento sui nostri contenuti è esclusivamente a proprio rischio e discrezione. Devi condurre la tua ricerca, rivedere, analizzare e verificare i nostri contenuti prima di fare affidamento su di essi. Il trading è un'attività altamente rischiosa che può portare a perdite importanti, pertanto si prega di consultare il proprio consulente finanziario prima di prendere qualsiasi decisione. Nessun contenuto sul nostro sito è pensato per essere una sollecitazione o un'offerta