DeepSeek
DeepSeek (кит. упр. 深度求索, пиньинь Shēndù Qiúsuǒ, палл. Шэньду Цюсо) — китайская компания, занимающаяся искусственным интеллектом и большими языковыми моделями. Штаб-квартира компании находится в районе Гуншу города Ханчжоу, который является административным центром провинции Чжэцзян. Компания была основана китайским хедж-фондом High-Flyer из Нинбо. Основателем и главным исполнительным директором является Лян Вэньфэн.
В 2025 году компания выпустила языковую модель, которая имеет то же название, что и компания. DeepSeek вызвал кратковременное, но резкое снижение акций западных технологических компаний, поскольку разработчики китайской модели заявили о намного более меньших инвестициях в обучение своего ИИ в сравнении с западными аналогами, при этом результат получился сопоставимый.
История
До официального выхода
Ещё в 2008 году Лян Вэньфэн начал руководить командой по изучению полностью автоматической количественной торговли с использованием машинного обучения и других технологий. В 2015 году Лян с коллегами основал компании в сфере количественного стоимостного инвестирования Huanfang Quantitative («Хуаньфан Куантатив»), большинство членов-основателей которой были выпускниками Чжэцзянского университета. В 2017 году «Хуаньфан Куантатив» заявила, что полностью разработала стратегию стратегии инвестирования в искусственный интеллект.
В 2021 году компания инвестировала 1 миллиард юаней в запуск суперкомпьютера «Firefly 2», оснащённого примерно 10 тысячами видеокарт Nvidia A100. Позже это решение было оценено мировыми экспертами как очень дальновидное инвестирование, предпринятое ещё до запрета на экспорт высоких технологий в КНР, наложенное правительством США.
17 июля 2023 года была основана компания Hangzhou Deep Exploration («Ханчжоу Дип Эксплорейшн»).
2025 год
В начале 2025 года DeepSeek подверглась кибератаке. Она началась примерно 3 января. Изначально это была DDoS-атака, но 27 и 28 числа их количество резко возросло, и это сопровождалось атаками с использованием взлома пароля пользователя и получения пользовательской информации. Из-за последствий кибератаки многие пользователи не смогли войти в систему, зарегистрироваться или воспользоваться сервисом. Согласно анализу, проведённому китайской компанией по кибербезопасности Qi Anxin («Ци Аньсинь»), все IP-адреса для атак методом перебора поступали из США[1].
После кибератаки 27 января DeepSeek запретил в материковом Китае регистрироваться новым пользователям через такие сервисы, как телефон, электронная почта и вход через аккаунт Google. 28 января DeepSeek сообщила, что для продолжения предоставления услуг она временно ограничила регистрацию за пределами материкового Китая[2].
Вскоре после официального запуска модели DeepSeek R1 27 января 2025 года приложение китайского интеллектуального ассистента превзошло ChatGPT в списке загрузок онлайн-магазина Apple в США, возглавив список бесплатных приложений в App Store. Также DeepSeek возглавил список загрузок в Google Play.
28 января 2025 года DeepSeek подала заявку на регистрацию товарного знака в Ведомство по патентам и товарным знакам США, но, как выяснилось, её опередили. Компания из штата Делавэр, Delson Group Inc., за 36 часов до обращения китайцев, сама подала заявку на товарный знак DeepSeek. По их утверждению, они продают IT-решения под названием DeepSeek с 2020 года, тогда как китайская компания появилась только в 2023 году[3].
29 января израильско-американская корпорация по обеспечению безопасности облачных вычислений Wiz заявила, что компания обнаружила базу данных ClickHouse, связанную с DeepSeek, к которой можно было получить доступ без аутентификации, случайно раскрыв более 1 миллион строк конфиденциальных данных. Технический директор Wiz сказал, что после отправки предупреждения DeepSeek защитила данные в течение часа[4].
9 февраля 2025 года DeepSeek объявил об окончании льготного периода использования, и цены на входные и выходные токены для расширенных возможностей API выросли на 100 % и 300 % соответственно[5].
Главной особенностью DeepSeek является его открытый исходный код под лицензией свободного программного обеспечения MIT. Это позволяет разработчикам использовать технологию в коммерческих целях, адаптировать инструмент под нужные задачи. Первоначально для обучения модели потребовалось 14,8 трлн токенов, а затраты компании на разработку составили порядка 6 млн долларов. При этом на разработку главного конкурента — GPT-4 — пришлось потратить почти в 17 раз больше — 100 миллионов долларов[6].
На протяжении 2025 года ИИ постоянно дорабатывался. Так, в августе вышла версия DeepSeek V3.1 — пользователь получил возможность выбирать режимы «мышления» (то есть видеть «рассуждения» программы о вопросе или задаче, которую поставил человек) и обычной работы. Согласно данным сравнительных испытаний, DeepSeek на 40 % превосходит главных конкурентов. Тестирование проводилось на решениях SWE-bench (улучшенная работа с кодом и репозиториями) и Terminal-bench (повышение эффективности при работе с командной строкой)[7]. В октябре была запущена возможность визуального распознавания текста[8].
После бурного развития DeepSeek в КНР в интернете появилось множество учебных курсов по применению DeepSeek в электронной коммерции, саморазвитии, образовании, программировании и других областях. Пользователям рассказывают о том, как развернуть локальную версию модели, дают распространённые подсказки по алгоритмам запросов и так далее. Некоторые курсы бесплатны, в то время как за другие просят довольно крупные суммы денег, достигающих тысяч юаней. Качество обучения неравномерно, и у пользователей неоднозначные отзывы. Многие так называемые тренинги на деле оказывались бесполезными. Это явление имело место и во время бума ChatGPT, что тоже вызвало беспокойство представителей отрасли. Представители компании DeepSeek выступили с призывом ориентироваться только на ту информацию, которая появляется в их официальных источниках, в том числе в соцсетях[9].
Оценки
По мнению американских репортёров из The New York Times и ABC News, DeepSeek, будучи стартапом малоизвестной компании, успешно бросил вызов более сильным и известным конкурентам, заставив «содрогнуться технологических гигантов США». DeepSeek сделал первый шаг в глобальном соревновании в области искусственного интеллекта[10][11]. Forbes отмечает открытый исходный код и его алгоритмы; модели и детали обучения генеративного искусственного интеллекта позволяют использовать, изменять, просматривать и создавать код совершенно бесплатно[12].
Относительно небольшая стоимость, но очень конкурентоспособная производительность DeepSeek считается достаточной для того, чтобы бросить вызов доминирующему положению в области искусственного интеллекта в США. Многие СМИ назвали это «кризисом интеллектуальных помощников» в области искусственного интеллекта в США. Модель R1 считается сопоставимой с последней моделью OpenAI в решении математических задач, программировании и рассуждениях на естественном языке. 26 января 2025 года американский венчурный капиталист Марк Андреессен написал в сети X, что модель DeepSeek R1 по значимости сопоставима с запуском СССР первого в истории человечества искусственного спутника, что вызвало панику на Западе и спровоцировало космическую гонку[13].
Основателя DeepSeek Ляна Вэньфэна сравнили с генеральным директором OpenAI Сэмом Альтманом. CNN назвал Ляна «Китайским Альтманом» и «проповедником» искусственного интеллекта[14].
Руководители компаний, участвующих в поддерживаемой правительством США программе «Звёздные врата» (The Stargate Project), , в частнности, Сэм Альтман и генеральный директор Microsoft Сатья Наделла, сказали, что DeepSeek R1 — впечатляющая модель, особенно учитывая, что она предоставляет такой продукт по такой невысокой цене[15][16]. Александр Ван, генеральный директор Scale AI, и Илон Маск скептически относятся к возможностям DeepSeek[17]. Другие компании, включая Amazon Cloud computing services, Toyota и Stripe, используют DeepSeek в предоставляемых ими сервисных программах[18].
Турецко-американский лауреат Нобелевской премии по экономике из Массачусетского технологического института Дарон Аджемоглу считает, что DeepSeek в настоящее время является всего лишь «игрушкой, удовлетворяющей любопытство клиентов» и не оказал революционного влияния на корпоративные приложения. Однако его появление подчеркивает коллективную иллюзию Кремниевой долины в развитии искусственного интеллекта[19]. В статье о DeepSeek, написанной специалистами Сбербанка в рамках проекта «Сбер Про» отмечается, что русский язык является одним из приоритетных для китайской нейросети. Благодаря гибридной структуре сеть может переключаться на решение узкоспециализированных задач. Например, если требуется сгенерировать код, то сеть включает режим эксперта по Python, а если требуется проанализировать юридический текст, DeepSeek «становится» специалистом по праву. В статье также отмечается удобство встраивания модели в сторонние приложения[20].
Сооснователь онлайн-университета Zerocoder Кирилл Пшинник в интервью РИА Новости отметил: «Субъективно DeepSeek работает быстрее и выдает более точные ответы. Однако важно учитывать, что ChatGPT — это не просто языковая модель, а целая экосистема сервисов, встроенных в нейросеть»[21].
Американский предприниматель тайваньского происхождения, создатель и руководитель Nvidia Дженсен Хуанг (Хуан Жэньсюнь) в июле 2025 года заявил, что DeepSeek «определённо является научным и инженерным проектом класса A+». Он считает, что модель очень хорошо написана, за что выразил признательность его создателям[22].
17 сентября 2025 года британский журнал Nature опубликовал статью DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning, написанную командой DeepSeek и Лян Вэньфэном в качестве автора-корреспондента. Это стало первым в мире массовым исследованием крупномасштабной языковой модели, прошедшим полную экспертную оценку и опубликованным в международно авторитетном журнале. Также это первый случай, когда крупномасштабное исследование китайской языковой модели появилось на обложке журнала Nature[23][24].
Влияние
Президент США Дональд Трамп заявил, что DeepSeek недорогой, но при этом не низкокачественный искусственный интеллект — это оказывает положительное влияние, поскольку позволяет компаниям Кремниевой долины внедрять инновации с меньшими затратами. В то же время, DeepSeek стал тревожным звонком для промышленности США, а это значит, что американским компаниям, по утверждению Трампа, нужно приложить все усилия, чтобы конкурировать с китайскими компаниями[25].
Способность DeepSeek оптимизировать модель с ограниченными ресурсами подчёркивает ограниченное влияние санкций США на развитие сферы искусственного интеллекта в Китае. К таковым санкциям относятся ограничения на экспорт передовых интегральных схем искусственного интеллекта. Успех этой модели вызвал шок на фондовом рынке и привёл к стремительному падению акций крупнейших технологических компаний мира 27 января 2025 года. Акции Nvidia упали на 17-18 %, а рыночная капитализация упала почти на 660 млрд долларов, и это снижение установило рекорд потери рыночной капитализации за один день для компании, зарегистрированной на бирже в США[26]. Акции других технологических компаний, таких как Microsoft, упали на 2,5 %; Alphabet (материнская компания Google), упала на 4 %. ASML, нидерландский производитель литографического оборудования для микроэлектронной промышленности, упал на 7 %. Общая рыночная капитализация технологических компаний, зарегистрированных на бирже в США, потеряла в конце января 2025 года 1 трлн долларов США[27].
DeepSeek не только оказывает давление на зарубежных конкурентов, но и формирует конкуренцию внутри Китая. 29 января 2025 года Alibaba Group выпустила новую версию семейства больших языковых моделей Qwen (также известен как Tongyi Qianwen — «Тунъи Цяньвэнь») — «Qwen 2.5», заявив, что модель превзошла DeepSeek-V3 и опережает GPT-4o от OpenAI и Llama-3.1-405B[28] от Meta практически по всем параметрам[29].
TikTok также запустила обновление своей флагманской модели искусственного интеллекта, заявив, что её производительность лучше, чем у модели OpenAI o1, поддерживаемой Microsoft. В феврале того же года Ernie Bot (Wenxin Yiyan — «Вэньсинь Иянь», принадлежит Baidu), Tencent Yuanbao и другие компании и проекты, занимающиеся разработкой нейросетей, один за другим объявили о своём подключении к работе с DeepSeek R1[30].
С февраля 2025 года многие правительственные ведомства Китая последовательно подключили DeepSeek к системе государственных услуг для написания официальных документов и выполнения ряда других автоматизированных процессов[31]. 8 февраля Служба по связям с правительством округа Лунган (Шэньчжэнь) уже внедрили модель DeepSeek R1 в правительственный экстранет. 16 февраля Шэньчжэнь официально предоставил услуги по применению модели DeepSeek всем районам города[32].
Примечания
- ↑ 范佳来 (Фань Цзялай). DeepSeek遭受大量海外攻击,奇安信:面临前所未有安全考验,攻击将持续 (кит.). thepaper.cn (29 января 2025). Дата обращения: 27 октября 2025. Архивировано 14 февраля 2025 года.
- ↑ 攻击DeepSeek数量激增 中国网安专家:IP均来自美国 (кит.). «Ляньхэ Цзаобао» (28 января 2025). Дата обращения: 27 октября 2025. Архивировано 31 января 2025 года.
- ↑ Kyle Wiggers. DeepSeek might have a trademark problem in the US (англ.). techcrunch.com (29 января 2025). Дата обращения: 27 октября 2025. Архивировано 4 августа 2025 года.
- ↑ Raphael Satter. Sensitive DeepSeek data exposed to web, cyber firm says (англ.). Reuters (30 января 2025). Дата обращения: 27 октября 2025.
- ↑ Дони Джабборов. Популярность DeepSeek вынудила разработчиков отключить платные функции ИИ. Газета.ру (6 февраля 2025). Дата обращения: 27 октября 2025. Архивировано 15 апреля 2025 года.
- ↑ Мария Решетникова. Что такое нейросеть DeepSeek: чат-бот с опцией поиска в интернете. РБК (28 июля 2025). Дата обращения: 27 октября 2025. Архивировано 14 июля 2025 года.
- ↑ DeepSeek официально представила модель V3.1 — недорогой ИИ с улучшенными функциями агентов. abc-av.ru (21 августа 2025). Дата обращения: 27 октября 2025.
- ↑ DeepSeek представила мультимодальную модель ИИ, использующую визуальное восприятие для сжатия входного текста. «Компьютерра» (21 октября 2025). Дата обращения: 27 октября 2025.
- ↑ DeepSeek火,“培训课”更火 付费教程“真实用”还是“割韭菜”? (кит.). epaper.cqcb.com (7 февраля 2025). Дата обращения: 27 октября 2025. Архивировано 14 февраля 2025 года.
- ↑ Cade Metz. What to Know About DeepSeek and How It Is Upending A.I. (англ.). The New York Times (27 января 2025). Дата обращения: 28 октября 2025. Архивировано 30 сентября 2025 года.
- ↑ Max Zahn. Nvidia, Microsoft shares tumble as China-based AI app DeepSeek hammers tech giants (англ.). ABC News (27 января 2025). Дата обращения: 28 октября 2025. Архивировано 12 августа 2025 года.
- ↑ Luis E. Romero. ChatGPT, DeepSeek, Or Llama? Meta’s LeCun Says Open-Source Is The Key (англ.). Forbes (27 января 2025). Дата обращения: 28 октября 2025. Архивировано 4 августа 2025 года.
- ↑ Sinéad Carew, Amanda Cooper, Ankur Banerjee. DeepSeek sparks AI stock selloff; Nvidia posts record market-cap loss (англ.). Reuters (28 января 2025). Дата обращения: 28 октября 2025. Архивировано 28 января 2025 года.
- ↑ David Goldman. What is DeepSeek, the Chinese AI startup that shook the tech world? (англ.). CNN (27 января 2025). Дата обращения: 28 октября 2025.
- ↑ OpenAI首席执行官:DeepSeek-R1是一款令人印象深刻的模型,有这样的新竞争对手令人振奋 (кит.). «Хуаньцю шибао» (28 января 2025). Дата обращения: 28 октября 2025. Архивировано 3 февраля 2025 года.
- ↑ Kevin Okemwa. Microsoft CEO Satya Nadella touts DeepSeek's open-source AI as "super impressive": "We should take the developments out of China very, very seriously" (англ.). windowscentral.com (28 января 2025). Дата обращения: 28 октября 2025. Архивировано 17 июля 2025 года.
- ↑ Manoj Sharma. Musk dismisses, Altman applauds: What leaders say on DeepSeek's disruption (англ.). Fortune India (28 января 2025). Дата обращения: 28 октября 2025. Архивировано 28 января 2025 года.
- ↑ Eugene Kim. Big AWS customers, including Stripe and Toyota, are hounding the cloud giant for access to DeepSeek AI models (англ.). businessinsider.com (31 января 2025). Дата обращения: 28 октября 2025. Архивировано 27 августа 2025 года.
- ↑ 梁采蘩 (Лян Цайфань). 诺奖得主评DeepSeek:目前算玩具 但仍戳破硅谷开发AI盲点 (кит.). worldjournal.com (7 февраля 2025). Дата обращения: 28 октября 2025. Архивировано 14 февраля 2025 года.
- ↑ Deepseek — что это такое? Как применять новый китайский DeepSeek бизнесу и его отличия от ChatGPT. Сбербанк (3 марта 2025). Дата обращения: 28 октября 2025.
- ↑ Нейросеть DeepSeek: что умеет, как пользоваться, отличия от ChatGPT. РИА Новости (31 января 2025). Дата обращения: 28 октября 2025. Архивировано 1 сентября 2025 года.
- ↑ Nvidia Boss Praises DeepSeek and Chinese AI in Beijing Visit (англ.). Bloomberg (17 июля 2025). Дата обращения: 28 октября 2025. Архивировано 30 августа 2025 года.
- ↑ 破天荒 DeepSeek梁文鋒論文登「自然」封面 (кит.). worldjournal.com (19 сентября 2025). Дата обращения: 28 октября 2025.
- ↑ Guo, D., Yang, D., Zhang, H. et al. DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning (англ.) // Nature. — 2025. — 18 September (iss. 645). — P. 633–638. — doi:10.1038/s41586-025-09422-z.
- ↑ Aimee Picchi. What is DeepSeek, and why is it causing Nvidia and other stocks to slump? (англ.). CBS News (28 января 2025). Дата обращения: 28 октября 2025. Архивировано 20 сентября 2025 года.
- ↑ Trump: DeepSeek's AI should be a 'wakeup call' to US industry (англ.). Reuters (28 января 2025). Дата обращения: 28 октября 2025. Архивировано 24 февраля 2025 года.
- ↑ Андрей Суржанский. "Момент спутника": поставила ли DeepSeek под вопрос лидерство США в сфере ИИ. ТАСС (28 января 2025). Дата обращения: 28 октября 2025.
- ↑ Принадлежит компании Meta, запрещённой на территории Российской Федерации.
- ↑ Alibaba выпустила свою модель ИИ и заявила о том, что она мощнее DeepSeek. Из-за DeepSeek богатейшие люди мира потеряли $108 млрд. РБК (29 января 2025). Дата обращения: 28 октября 2025. Архивировано 8 августа 2025 года.
- ↑ 打不过就加入!大模型六小虎已有一半接入DeepSeek (кит.). Baidu (19 февраля 2025). Дата обращения: 28 октября 2025.
- ↑ 赵文涵 (Чжао Вэньхань). 多地政务系统接入DeepSeek意味着什么? (кит.). «Синьхуа» (19 февраля 2025). Дата обращения: 28 октября 2025. Архивировано 6 августа 2025 года.
- ↑ 陈琰 (Чэнь Янь). 广州、深圳政务系统接入DeepSeek (кит.). news.sina.com.cn (16 февраля 2025). Дата обращения: 28 октября 2025. Архивировано 29 августа 2025 года.
Ссылки
- deepseek.com — официальный сайт DeepSeek (англ.) (кит.)
- chat.deepseek.com — чат-бот от DeepSeek
- Nvidia потеряла более $600 млрд капитализации на фоне успеха китайского DeepSeek
- DeepSeek R1: модель с производительностью o1 от OpenAI
- Знание.Вики:Cite web (не указан язык)
- Компании Ханчжоу
- Появились в 2023 году в Китае
- Исследование искусственного интеллекта
- Производители программного обеспечения
- Интернет-компании Китая
- Нейронные сети
- Машинное обучение
- Глубокое обучение
- Обработка естественного языка
- Виртуальные собеседники
- Большие языковые модели