YandexGPT

Эта статья прошла проверку экспертом
Материал из «Знание.Вики»
YandexGPT
Тип Большая языковая модель
Разработчик Яндекс
Первый выпуск 17 мая 2023 года
Последняя версия 3 (28 марта 2024)
Состояние функционирует
Сайт https://ya.ru/ai/gpt-3

YandexGPT — нейронная сеть из семейства GPT, разработанная компанией «Яндекс». Способен генерировать и перерабатывать тексты, предлагать креативные идеи и учитывать контекст взаимодействия с пользователем.

YandexGPT обучается на основе датасета, который включает данные из множества книг, журналов, газет и других доступных источников из интернета[1]. Искусственный интеллект имеет склонность к ошибкам и иногда придумывает неверную информацию, но с каждым этапом обучения его ответы становятся всё более точными.

Использование YandexGPT

YandexGPT — это инновационное решение, используемое в различных продуктах для выполнения множества задач. Нейросеть внедрена в виртуального помощника «Алису» и функционирует в приложениях «Яндекс» и «Яндекс Старт», в «Яндекс Браузере», на устройствах «Яндекс Станция», а также на умных телевизорах с «Алисой».

YandexGPT задействован на главной странице «Яндекса», в «Поисковой системе Яндекса»[2], «Маркет», «Лавка»[3], «Практикуме», «Учебнике», «Авто.ру» и нескольких других сервисах компании. Компания предоставляет бизнесу доступ к API нейронной сети через Yandex Cloud и разрабатывает свои В2В-продукты на её базе.

С июля 2023 года 800 организаций приняли участие в закрытых испытаниях YandexGPT[4]. ИТ-специалисты, финансовые учреждения, магазины и различные компании имеют возможность применять эту технологию в двух форматах: через API и Playground (интерфейс внутри консоли Yandex Cloud для испытания модели и экспериментов с гипотезами)[5].

Для бизнеса доступны два варианта модели: первая функционирует в асинхронном режиме, лучше подходя для решения сложных задач, в то время как вторая предназначена для оперативного создания ответов в режиме реального времени. Испытания YandexGPT были проведены в различных сценариях: для задач, связанных с контентом, технической поддержкой, генерацией чат-ботов, созданием виртуальных ассистентов и многим другим.

В июне 2024 года с применением YandexGPT были улучшены функции машинного перевода в сервисах «Яндекс Переводчик», «Поиск» и в переводе видео в «Яндекс Браузере»[6][7].

История

В феврале 2023 года компания «Яндекс» объявила о создании своей вариации генеративной нейронной сети ChatGPT, с целью усовершенствования языковой модели из серии YaLM (Yet another Language Model)[8]. Проект изначально имел рабочее название YaLM 2.0, которое потом изменили на YandexGPT.

17 мая фирма презентовала нейросеть, известную как YandexGPT (YaGPT), интегрировав в виртуального помощника «Алиса» функцию, позволяющую коммуницировать с новейшей языковой моделью[9]. 5 июня 2023 года пресс-служба «Яндекса» объявила, что их нейросеть теперь способна удерживать в памяти содержание диалога и задавать дополнительные вопросы[10].

15 июня 2023 года компания «Яндекс» включила языковую модель YandexGPT в приложение для создания изображений «Шедеврум»[11]. Это позволило пользователям формировать информативные публикации, состоящие из текста, заголовка и соотносящейся по контексту картинки[12] В середине 2023 года YandexGPT был предложен компаниям как инструмент для создания виртуальных помощников и чат-ботов, а также для генерации и структурирования текстов.

В конце июня в компании «Яндекс» заявили, что их нейросеть освоила навык краткого пересказа статей из интернета. Эта функция позволяет работать с текстами на русском языке объёмом до 30 тысяч знаков[13]. 7 сентября 2023 года на конференции Practical ML Conf компания «Яндекс» презентовала обновленную языковую модель под названием YandexGPT 2[14]. В отличие от предыдущей версии, новая модель охватывает большее количество задач и демонстрирует улучшенное качество ответов[15]. По словам создателей, YandexGPT 2 в 67 % случаев демонстрирует более качественные ответы на запросы пользователей по сравнению с первой версией искусственного интеллекта[16]. 14 сентября 2023 года компания «Яндекс» приступила к тестированию YandexGPT с целью оперативного формирования ответов на запросы в «Поиске»[17]. Система искусственного интеллекта мгновенно ищет несколько самых релевантных источников по запросу пользователя, осуществляет сжатую выжимку каждого найденного, а затем отбирает наиболее полезный ответ из получившихся. Выбранный ответ показывается под поисковой строкой, сопровождаясь ссылкой на источник.

С 6 октября 2023 года YandexGPT способен создавать краткие пересказы видеоматериалов на русском языке в интернете[18]. Она суммирует видеоматериалы продолжительностью от двух минут до четырёх часов, содержащие речь[19]. В последнем месяце 2023 года компания «Яндекс Казахстан» предоставила локальным компаниям возможность использования YandexGPT API[20].

28 марта 2024 года Yandex представил третью серию нейронных сетей YandexGPT. Начальная версия — YandexGPT 3 Pro нацелена на корпоративный сегмент и доступна через Yandex Cloud[21]. По утверждению разработчиков, тестирование YandexGPT 3 Pro показало, что в среднем он отвечает лучше своих предшественников из YandexGPT 2 на 67 % случаев, а при обработке простых пользовательских запросов его эффективность увеличилась на 69 %[22].

28 мая 2024 года была официально выпущена облегчённая версия нейросети YandexGPT Lite[23].

Обучение Yandex GPT

Образовательный процесс включает несколько фаз:

1. Pretraining. На этой стадии модель осваивает языковую структуру и усваивает информацию о мире. В её обучение включены терабайты текстового материала из сети Интернет, книг и прочих открытых источников, которые были отобраны поисковыми алгоритмами «Яндекса» и разделены на небольшие сегменты[24].

2. Итерационная настройка. Профессионалы улучшают миллиарды параметров модели, подготавливая огромный массив данных, включающий сотни тысяч экземпляров различных задач с правильными ответами.

Разработкой высококачественных обучающих примеров занимаются AI-инструкторы «Яндекса»[25]. Это специалисты множества гуманитарных областей: журналисты, преподаватели, лингвисты, корректоры, социологи, психологи и филологи[26]. Компания «Яндекс» вошла в историю России как первая, приглашавшая и обучавшая таких экспертов.

3. Улучшение продуктов. Моделям приписывают «человеческие черты», чтобы они могли отвечать на вопросы о своей личности и делали общение более оживленным[24].

Для тренировки YandexGPT задействованы суперкомпьютеры «Яндекса»[27].

Возможности

В октябре 2023 года YandexGPT 2 удалось сдать ЕГЭ по литературе, набрав 55 баллов[28]. Стоит отметить, что для зачисления в высшее учебное заведение требуется преодоление минимального порога в 40 баллов. Впервые за всю историю России искусственный интеллект достиг такого результата на ЕГЭ, не только корректно решив тестовые задания, но и справившись с творческими вопросами[29].

Критика

В мае 2024 года заместитель председателя Совета безопасности Дмитрий Медведев выразил недовольство в своём телеграм-канале по поводу нейросети YandexGPT, на основе которой функционирует голосовой ассистент «Алиса». Зампред Совбеза подчеркнул:[30] искусственный интеллект, созданный компанией, не предоставляет ответы на вопросы общего характера, которые имеют косвенное отношение к политике. По мнению Медведева, это подрывает доверие к «Яндексу». Представители компании не дали комментариев относительно заявлений политика[31][32]

Примечания

  1. Нейросеть Яндекса YandexGPT: что это, возможности, как пользоваться. РБК Тренды. Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  2. «Яндекс» открыл доступ к тестированию быстрых ответов YandexGPT в «Поиске». Хабр (14 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  3. YandexGPT поможет «Лавке» заполнять карточки товаров по фото этикеток. Хабр (12 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  4. Кейсы с YandexGPT, data-оркестр или бессерверный пайплайн: выбираем самое интересное с Yandex Scale’23. Хабр (29 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  5. «Яндекс» предоставил компаниям доступ к YandexGPT. Коммерсантъ (19 июня 2023). Дата обращения: 9 сентября 2024. Архивировано 29 июня 2023 года.
  6. Гормалева, Наталья «Яндекс» улучшил качество машинного перевода с помощью YandexGPT. rb.ru (7 июня 2024). Дата обращения: 9 сентября 2024.
  7. Гормалева, Наталья «Яндекс» поднял качество автоматического перевода с применением YandexGPT. rb.ru (7 июня 2024). Дата обращения: 9 сентября 2024.
  8. Кодачигов, Валерий Найдется что: «Яндекс» запустит для поисковика сверхсовременную нейросеть. Известия (1 февраля 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  9. «Яндекс» добавил в «Алису» генеративную нейросеть YandexGPT. Forbes.ru (17 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  10. Нейросеть YandexGPT научилась запоминать контекст диалога. Ведомости. Дата обращения: 29 декабря 2023. Архивировано 10 июня 2023 года.
  11. «Яндекс» добавил в «Шедеврум» нейросеть YandexGPT для генерации текста. 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  12. Яндекс встроил нейросеть YandexGPT в приложение Шедеврум. Российская газета (15 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 17 июня 2023 года.
  13. YandexGPT теперь может кратко пересказать текст. Коммерсантъ (27 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 27 июня 2023 года.
  14. "Яндекс" запустил YandexGPT 2. ТАСС. Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  15. Вышла новая версия нейросети от Яндекс — YandexGPT 2. Компьютерра (8 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 13 октября 2023 года.
  16. «Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев. 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 28 октября 2023 года.
  17. «Яндекс» начал тестировать быстрые ответы YandexGPT. Сноб (14 сентября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  18. В "Яндекс.Браузере" появилась функция пересказа видео. ТАСС (6 октября 2023). Дата обращения: 9 сентября 2024. Архивировано 14 января 2024 года.
  19. Нейросеть "Яндекса" научилась кратко пересказывать видеоролики. Российская газета (6 октября 2023). Дата обращения: 9 сентября 2024. Архивировано 6 января 2024 года.
  20. tengrinews.kz Яндекс Казахстан открывает доступ к YandexGPT API для казахстанских компаний. Главные новости Казахстана - Tengrinews.kz (7 декабря 2023). Дата обращения: 9 сентября 2024.
  21. «Яндекс» представил третье поколение нейросетей YandexGPT. РБК (28 марта 2023). Дата обращения: 9 сентября 2024.
  22. 3DNews Daily Digital Digest. Яндекс представил третье поколение нейросетей YandexGPT (28 марта 2024). Дата обращения: 9 сентября 2024.
  23. «Яндекс» запустил третье поколение YandexGPT Lite. Коммерсантъ (28 мая 2024). Дата обращения: 9 сентября 2024.
  24. 24,0 24,1 YandexGPT в Алисе: как мы создаём языковую модель нового поколения. Хабр (5 июня 2023). Дата обращения: 9 сентября 2024. Архивировано 5 января 2024 года.
  25. СМИ: «Яндекс» начал нанимать гуманитариев для обучения своей нейросети YaLM 2.0. Хабр (19 апреля 2023). Дата обращения: 9 сентября 2024. Архивировано 14 января 2024 года.
  26. Нейросеть YandexGPT подключили к виртуальному помощнику "Алиса". Какое будущее ждет искусственный интеллект в России. Российская газета (18 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  27. YandexGPT научилась создавать тексты в режиме реального времени. ТАСС. Дата обращения: 9 сентября 2024. Архивировано 14 января 2024 года.
  28. BFM.ru Нейросеть YandexGPT смогла сдать ЕГЭ по литературе. BFM.ru - деловой портал. Дата обращения: 9 сентября 2024. Архивировано 14 января 2024 года.
  29. Нейросеть Яндекса YandexGPT 2 смогла получить проходной балл ЕГЭ по литературе. Код Дурова (12 октября 2023). Дата обращения: 9 сентября 2024. Архивировано 14 января 2024 года.
  30. Медведев раскритиковал «Яндекс» из-за ответов «Алисы». Коммерсантъ (19 мая 2024). Дата обращения: 21 мая 2024.
  31. Музычук, Анастасия «Яндекс» отказался комментировать претензии Медведева из-за «дурки» от «Алисы». RTVI (19 мая 2024). Дата обращения: 21 мая 2024.
  32. Музычук, Анастасия «Яндекс» ответил на замечания Медведева о «ошибке» Алисы. RTVI (19 мая 2024). Дата обращения: 21 мая 2024.

Ссылки

WLW Checked Off icon.svg Данная статья имеет статус «готовой». Это не говорит о качестве статьи, однако в ней уже в достаточной степени раскрыта основная тема. Если вы хотите улучшить статью — правьте смело!