GigaChat
| GigaChat | |
|---|---|
| Тип | Большая языковая модель |
| Разработчик | Сбер |
| Первый выпуск | 24 апреля 2023 года |
| Состояние | функционирует |
| Сайт | https://giga.chat |
GigaChat — российский мультимодальный чат-бот на базе генеративной нейросети, разработанный компанией «Сбер». Система поддерживает русский и английский языки и способна генерировать связанный текст и изображения по запросам на естественном языке. Проект был запущен в 2023 году как отечественный аналог ChatGPT от OpenAI с упором на более корректную работу с русским языком и открытой архитектурой модели[1][2].
История
Разработкой GigaChat занимались команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI. Обучение модели проводилось на собственном суперкомпьютере «Кристофари Neo». Впервые о нейросети объявлено 24 апреля 2023 года, когда «Сбер» представил GigaChat в режиме закрытого тестирования по приглашениям. 17 августа 2023 года возможности GigaChat были интегрированы в фирменные умные колонки SberBoom и SberBoom Mini с голосовым ассистентом «Салют», что позволило запускать чат-бот голосовой командой[3][4].
5 сентября 2023 года «Сбер» объявил об открытии GigaChat для всех пользователей, сделав его первым общедоступным российским сервисом подобного рода. Одновременно были опубликованы в открытом доступе ключевые предобученные модели (например, ruGPT-3.5 и Kandinsky 2.2), на основе которых создан GigaChat, с целью поддержки open-source сообщества и исследований в области ИИ. В отличие от закрытых западных аналогов, архитектура GigaChat была открыта для разработчиков, а кроме текста сеть изначально научена генерировать и изображения. Для расширения применения в бизнес-среде в том же месяце «Сбер» запустил для GigaChat облачный API и SDK GigaChain (адаптированная библиотека LangChain для русского языка) с целью интеграции модели во внешние приложения и сервисы. Спустя несколько месяцев после запуска аудитория сервиса достигла миллионов пользователей: по данным компании, за первый год число уникальных пользователей превысило 5 миллионов (считая веб-версию и ботов в мессенджерах)[3][4].
Технические характеристики
GigaChat основан на ансамбле нейросетевых моделей, объединённых под названием NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Основу составляет большая языковая модель типа ruGPT-3.5 с объёмом 13 миллиардов параметров, обученная на масштабном корпусе текстовых данных на русском и английском языках. Эта модель представляет собой декодерную трансформер-сеть (аналогично архитектуре GPT-3) и была дополнительно дообучена на выборках инструкций (вопрос-ответ, диалоги, код и др.), включая этап обучения с подкреплением от обратной связи человека (RLHF) для повышения качества и этичности ответов[5].
Ансамбль NeONKA является мультимодальным: помимо текстовой модели ruGPT-3.5 и связанных с ней моделей (например, FRED-T5 для обработки знаний), в состав входит модель генерации изображений Kandinsky 2.1 и модель ruCLIP для оценки соответствия между текстом и картинкой. Благодаря этому GigaChat способен в рамках одной сессии не только вести диалог и решать языковые задачи, но и создавать иллюстрации по текстовому описанию[6].
Обучение финальной версии модели проходило на высокопроизводительном оборудовании: сообщается, что базовая модель (ruGPT-3) обучалась несколько недель на десятках GPU, а последующая версия ruGPT-3.5 дообучалась на сотнях графических процессоров NVIDIA A100. Код модели и ее архитектура были опубликованы открыто (например, размещены на платформе Hugging Face) для того, чтобы исследователи и разработчики могли самостоятельно дообучать и применять русскоязычные языковые модели[7].
Применение и использование
GigaChat позиционируется как универсальная AI-система, способная решать широкий круг задач по генерации и преобразованию информации. На уровне конечных пользователей сервис применяется для создания разнообразного текстового контента: от ответов на вопросы и ведения диалога до написания статей, стихотворений, сценариев и программного кода. Встроенная генерация изображений позволяет получать иллюстрации по описанию, что делает GigaChat удобным инструментом для дизайнеров и создателей контента. Модель может поддерживать контекст беседы, учитывая предыдущие запросы и уточнения, а также предоставлять результаты на русском языке высокого качества благодаря специализированному обучению. При этом отмечается, что сильной стороной GigaChat являются творческие задачи — генерирование оригинальных идей, написание креативных текстов, подбор вариантов в маркетинге. При решении строго фактических вопросов нейросеть пока уступает экспертам: она может допускать неточности и «галлюцинации» (ошибочные факты в ответах), поэтому результаты по сложным вопросам рекомендуется перепроверять. Модель имеет встроенные ограничения и отказывается обрабатывать некорректные запросы — например, связанные с противоправным либо заведомо неэтичным содержанием[8].
Доступ к GigaChat для частных пользователей предоставляется бесплатно через веб-интерфейс (портал SberDevices) и официальных ботов в мессенджерах: в частности, чат-бот GigaChat открыт на площадках Telegram и «ВКонтакте». Кроме того, технологии GigaChat интегрируются в продукты экосистемы «Сбера» — умные устройства с ассистентом «Салют» (колонки, телевизоры и др.), мобильные приложения и сервисы банка, что позволяет клиентам получать помощь ИИ в привычных сервисах[8].
Для корпоративных клиентов «Сбер» предлагает коммерческую версию модели через облачный GigaChat API. По состоянию на 2024 год свыше 4 тысяч российских компаний подключили GigaChat к своим бизнес-процессам. Среди примеров применения – использование чат-бота в компании «Сибур» для внутренних задач (первый крупный эксперимент внедрения большой языковой модели в отечественной промышленности), разработка на основе GigaChat специализированных AI-ассистентов: виртуального помощника инженера-диагноста, советника по закупкам, ассистента для R&D (моделирование новых материалов) и финансового консультанта. Также сторонние разработчики интегрируют возможности GigaChat в конечные продукты – например, российский пакет офисного ПО «Мой офис» добавил интеллектуальные функции на базе GigaChat для работы с документами и коммуникацией[3][9].
Этические и правовые вопросы
Активное внедрение генеративных ИИ-систем, таких как GigaChat, поднимает ряд этических и правовых вопросов. С одной стороны, появление подобных нейросетей открывает новые возможности – они способны автоматизировать рутинный труд, помогать в обучении, решать творческие задачи и даже находить применение в медицине. С другой стороны, есть опасения относительно негативных последствий: массовая замена человеческого труда алгоритмами может привести к сокращению рабочих мест, генерация недостоверной информации угрожает распространением дезинформации, а бесконтрольное влияние таких систем на общественное мнение и культуру может «размыть» социальные нормы. В ответ на эти вызовы особое внимание уделяется этичности и безопасности ИИ. Разработчики GigaChat изначально заложили механизмы контент-модерации и фильтрации: нейросеть не отвечает на запросы, нарушающие законодательные или моральные нормы, избегает провокационных тем и обладает встроенными ограничениями на вредоносные действия. В процессе обучения применяются методы Alignment (выравнивания моделей), включающие обучение с подкреплением от оценок человека, что помогает сделать ответы более безопасными и соответствующими этическим принципам. Представители «Сбера» подчёркивают, что продолжат улучшать модель, уделяя особое внимание вопросам этики и безопасности её использования[4][2].
Правовые аспекты использования GigaChat и подобных технологий находятся в стадии формирования. В российской юрисдикции уже предприняты шаги к регулированию сферы искусственного интеллекта. В 2020 году вступил в силу закон № 123-ФЗ, который в экспериментальном порядке регулирует разработку и внедрение ИИ-технологий в Москве. Однако этот закон лишь задаёт общие рамки и не отвечает на многие конкретные вопросы, в частности об ответственности за возможный вред от действий ИИ. По мере роста популярности генеративных моделей регуляторы работают над обновлением законодательства: обсуждаются требования к анонимизации данных, используемых для обучения ИИ, обязательства по маркировке сгенерированного контента, меры ответственности за распространение вредоносной информации и другие нормы. Отраслевое сообщество также участвует в саморегулировании: ведущие компании присоединились к Кодексу этики в сфере ИИ, принятому в РФ, а в 2023 году был опубликован отдельный декларативный документ с принципами ответственной разработки и использования генеративного ИИ. В частности, в этих принципах указано, что разработчики сервисов на базе генеративного ИИ должны осознавать риски технологии и принимать меры для их предотвращения в соответствии с законодательством и этическими нормами. Международный опыт также стимулирует усиление контроля: во многих странах (ЕС, США, Китай и др.) в 2023–2024 годах появились инициативы и законопроекты, направленные на регулирование ИИ, что побуждает и российские власти и компании повышать прозрачность и ответственность при внедрении подобных систем. Развитие этических стандартов и правовых норм в этой области продолжается параллельно с совершенствованием самих технологий[8][10].
Примечания
- ↑ Сбер представляет мультимодальную нейросеть GigaChat. Developers Sber (23 апреля 2023). Дата обращения: 1 марта 2025.
- ↑ 2,0 2,1 «Сбер» выпустила собственный аналог ChatGPT — GigaChat. Хабр (24 апреля 2023). Дата обращения: 1 марта 2025.
- ↑ 3,0 3,1 3,2 Филиппов, Денис. GigaГОД! C днём рождения, GigaChat!. Sber Devices (27 апреля 2024). Дата обращения: 1 марта 2025.
- ↑ 4,0 4,1 4,2 Сбер встроил нейросеть GigaChat в умные колонки. ТАСС (17 августа 2023). Дата обращения: 1 марта 2025.
- ↑ Аверкиев, Сергей. Это не чат, это GigaChat. Русскоязычная ChatGPT от Сбера. Хабр (24 апреля 2023). Дата обращения: 1 марта 2025.
- ↑ Цукергохер, Игнатий. «Сбер» выпустила собственный аналог ChatGPT (24 апреля 2023). Дата обращения: 1 марта 2025.
- ↑ Ромашков, Андрей. «Сбер» представил собственную нейросеть GigaChat. Бизнес ФМ. 2025-03-01 (24 апреля 2023).
- ↑ 8,0 8,1 8,2 Нейросеть от Сбера: что умеет GigaChat и как получить к нему доступ. Reg.ru (4 августа 2023). Дата обращения: 1 марта 2025.
- ↑ Ганьшин, Павел. В Сбере рассказали об использовании их нейросети бизнесом. Контент Сибирь (5 сентября 2024). Дата обращения: 1 марта 2025.
- ↑ Белокопытова, Василиса. AI и закон: как правительства пытаются регулировать искусственный интеллект. Хабр (1 декабря 2023). Дата обращения: 1 марта 2025.
Данная статья имеет статус «готовой». Это не говорит о качестве статьи, однако в ней уже в достаточной степени раскрыта основная тема. Если вы хотите улучшить статью — правьте смело! |
Данная статья имеет статус «проверенной». Это говорит о том, что статья была проверена экспертом |