ChatGPT два года оставался недосягаемым. Многие компании представили свои генеративные ИИ, но по большому счёту все они не были столь хороши, как решение OpenAI.
На то было много причин, но сейчас это неважно. Китайская компания DeepSeek выпустила свой чат-бот с одноимённым названием и сделала его бесплатным для всех, а в России он работает без ограничений.
Она утверждает, что он во многом лучше, чем ChatGPT, и при этом дешевле в обслуживании. 20 января DeepSeek представила новую языковую модель R1, которая научилась рассуждать, как GPT-o1 от OpenAI.
После этого о DeepSeek, кажется, заговорили все. Сейчас это самое скачиваемое приложение в США и во многих других странах, пользователи в шоке, а капитализация Nvidia сократилась почти на $400 млрд.
Как интернет принял DeepSeek
Приложение DeepSeek сегодня возглавило американский App Store, сместив с первого места ChatGPT
Пользователи, которые протестировали DeepSeek, в большинстве случаев довольны работой ИИ, особенно учитывая, что он полностью бесплатный.
В DeepSeek есть минимальная цензура, которая проявляется, когда пользователи пытаются задать каверзный вопрос, связанный с китайским правительством. Интересно, что ИИ сначала пытается написать ответ, но затем срабатывает фильтр, который стирает ответ. Но это специфика всех китайских ИИ.
В остальном же DeepSeek справляется со своими задачами ничуть не хуже, чем ChatGPT. DeepSeek знает русский язык и работает в России без ограничений, что для современного зарубежного ИИ большая редкость. Этого достаточно, чтобы рассматривать его как замену ChatGPT.
Успех DeepSeek породил очень много мемов. Приведу пару вариантов, которые мне понравились больше всего:
Но нельзя не отметить, что есть много скептиков, которые считают, что DeepSeek — это лишь хайп. Так ли это на самом деле, покажет только время.
В чём преимущество DeepSeek перед OpenAI
ChatGPT o1 Pro против DeepSeek R1: реализация вращающегося треугольника с красным шаром
Помимо того, что языковые модели DeepSeek не хуже, а по некоторым тестам лучше, чем решения OpenAI, есть ещё несколько факторов, из-за которых к китайской компании приковано очень большое внимание.
Разработка DeepSeek стоит намного дешевле, чем ChatGPT. Обучение языковой модели V3 обошлось DeepSeek в $5,58 млн. Для этого ей потребовалось 2048 чипов Nvidia H800 (не самые современные на текущий момент). И это при условии, что в компании работает менее 200 человек.
В OpenAI работает 4,5 тысячи человек. На обучение GPT-4 было потрачено $100 млн. Сколько именно процессоров было использовано, неизвестно. The New York Times отмечает, что ведущие мировые компании используют для обучения ИИ суперкомпьютеры, которые насчитывают 16 тысяч чипов Nvidia.
Второе ключевое преимущество DeepSeek — это эффективность. Для его работы нужно меньше ресурсов, а следовательно, он дешевле.
1 млн токенов OpenAI GPT-4o стоит $2,5. Аналогичное количество токенов DeepSeek R1 обойдется в 17 раз дешевле — $0,14. При этом DeepSeek R1 является более продвинутой моделью, чем GPT-4o.
Успех DeepSeek — это огромный удар для Nvidia
https://t.me/iphonesru/25034?embed=1
27 января, когда DeepSeek заняла первую строчку американского App Store, акции Nvidia упали на 15%.
Nvidia является самым большим победителем в гонке ИИ, поскольку для обучения используются её чипы. Самые дорогие процессоры Nvidia для ИИ стоят по $40 тыс., и от них во многом зависят продажи компании.
С ростом популярности ИИ компании придерживались позиции, что лучше закупить больше чипов, чем оптимизировать ресурсы. DeepSeek изменил подход, доказав, что хороший ИИ можно создать на небольшом количестве чипов.
Если другие компании последуют его примеру и начнут уделять больше внимания сокращению «прожорливости» ИИ (а они, вероятно, уже начали это делать), то для Nvidia это может стать большой проблемой.
Конечно, она не перестанет в одночасье продавать чипы по $40 тыс. Они по-прежнему будут нужны, но в будущем спрос на них может замедлиться, что не очень хорошо скажется на финансовых показателях Nvidia.
Как появился DeepSeek
DeepSeek на главной странице сразу заявляет о своих преимуществах перед всеми остальными ИИ
Компания DeepSeek была основана в мае 2023 года китайским предпринимателем Лян Вэньфэном, который давно увлекается искусственным интеллектом и имеет собственный хедж-фонд High-Flyer.
Интересно, что Вэньфэн начал скупать чипы Nvidia ещё в 2021 году. На тот момент бум ИИ не начался, и США ещё не запретили Nvidia продавать свои самые топовые чипы китайским компаниям. High-Flyer приобрёл более 10 тысяч графических чипов Nvidia A100 до того, как США ввели санкции.
DeepSeek изначально был побочным проектом. Первым крупным инвестором DeepSeek стал хедж-фонд High-Flyer. Однако другие не спешили вкладываться в новую компанию Вэньфэня, считая, что невозможно за короткое время создать качественный ИИ. Для понимания: OpenAI была основана 10 лет назад и разрабатывала ChatGPT 7 лет.
Сравнение последних языковых моделей DeepSeek и OpenAI в популярных тестах
Первая версия DeepSeek вышла 2 ноября 2023 года. Она соответствовала GPT-4, но имела проблемы с эффективностью.
В мае 2024 года вышла DeepSeek V2. Она стала умнее, но главное — инженеры исправили проблемы, которые были в первой версии.
В декабре 2024 года вышла DeepSeek V3. Эта модель намного умнее, чем V2. В тестах она показала себя лучше, чем GPT-4o и другие американские языковые модели. Обучение V3 заняло 55 дней, и это при том, что она имеет 671 миллиард параметров.
20 января 2025 года вышла самая актуальная на данный момент версия DeepSeek R1. Её ключевое преимущество заключается в умении «рассуждать» во время построения ответов. Во многих бенчмарках DeepSeek R1 сравнима с OpenAI GPT-o1 — самой актуальной языковой моделью компании.
И самое главное: все языковые модели DeepSeek выпускаются с открытым исходным кодом. Вы можете скачать и запустить их на своём компьютере, чтобы не зависеть от интернета.
Но для этого понадобится не просто мощный ПК, а ОЧЕНЬ мощный ПК либо связка из нескольких компьютеров. Вот, например, DeepSeek запустили на 7 Mac mini с M4 Pro и одном MacBook Pro с M4 Max. Это для понимания, какая примерно мощность нужна для локального ИИ.
Как работает DeepSeek
DeepSeek может показывать ход своих мыслей, когда ищет ответ на вопрос
DeepSeek сейчас выглядит как урезанная версия ChatGPT. Интерфейсы чат-ботов похожи друг на друга, однако у ChatGPT больше настроек, что неудивительно. Но всё это неважно.
DeepSeek — это полностью бесплатный ИИ. Пока что здесь вообще нет платных опций, и это огромное преимущество.
Для тех, кто не в курсе: доступ к самым последним языковым моделям OpenAI возможен только при наличии платной подписки.
DeepSeek отвечает очень быстро. На один и тот же вопрос DeepSeek выдает ответ быстрее, чем ChatGPT 4o. Качество ответов DeepSeek не хуже, чем у ChatGPT.
Я использовал DeepSeek в качестве поисковика, для создания поздравления, проверки текста, и со всеми этими задачами он справился отлично. Преимущественно я использую ChatGPT для поиска информации, и я был очень удивлен, когда обнаружил, что DeepSeek делает это не хуже.
Но это, конечно же, не всё, на что способен ИИ. В X есть отличный тред, в котором показано, как DeepSeek справляется с написанием кода, созданием простых игр и решением сложных математических задач.
Есть даже инструкция, как с помощью DeepSeek создать аналог OpenAI Operator — ИИ-агента, который за вас будет работать на сайтах. Operator стоит $200 в месяц, а с DeepSeek его можно создать самому бесплатно и без знания кода: ИИ напишет его сам.
DeepSeek открывает новую гонку ИИ
Успех DeepSeek поднял очень важную проблему, к которой пока что не готовы американские компании и правительство.
Дело в том, что американские санкции на продажу чипов Nvidia китайским компаниям должны были замедлить гонку ИИ, но получилось ровно наоборот. Ограничения заставили китайских инженеров изменить подход к созданию ИИ, чтобы оптимизировать его работу под небольшой кластер чипов.
Традиционный ИИ — это как записывать каждое число с 32 знаками после запятой. DeepSeek подумал: «А что, если мы просто используем 8? Это всё равно достаточно точно!» Бум — требуется на 75% меньше памяти.
Морган Браун, вице-президент по продукту и развитию ИИ в Dropbox
По словам Брауна, чтобы уменьшить требования к ресурсам, DeepSeek применил новый и более продвинутый подход к обработке пользовательских запросов.
Обычный ИИ читает как первоклассник: «Кошка… сидела…». DeepSeek читает сразу целые фразы. В 2 раза быстрее, на 90% точнее. Когда вы обрабатываете миллиарды слов, это имеет значение.
Морган Браун, вице-президент по продукту и развитию ИИ в Dropbox
В результате DeepSeek можно запустить даже на игровых видеокартах. Вероятно, вам понадобится не одна карточка, но тот факт, что это вообще возможно, уже заслуживает уважения.
Конечно, большинство людей не будет этим заниматься. Зато для компаний это огромный плюс, поскольку стоимость затрат кратно снижается.
С тех пор как в 2022 году OpenAI спровоцировала бум искусственного интеллекта, выпустив ChatGPT, многие эксперты и инвесторы пришли к выводу, что ни одна компания не сможет конкурировать с лидерами рынка, не потратив сотни миллионов долларов на специализированные чипы. Теперь ситуация изменилась.
Количество компаний, у которых есть 6 миллионов долларов на расходы, значительно превышает количество компаний, у которых есть 100 миллионов или 1 миллиард долларов на расходы.
Крис Николсон, инвестор венчурной компании Page One Ventures, специализирующейся на ИИ
Глава DeepSeek Лян Вэньфэнь также отмечает, что для его компании главное — минимизация ресурсов.
Нам [большинству китайских компаний] приходится потреблять вдвое больше вычислительной мощности, чтобы достичь тех же результатов. В сочетании с пробелами в эффективности данных это может означать необходимость в четыре раза большего количества вычислительной мощности. Наша цель — постоянно сокращать эти пробелы.
Лян Вэньфэнь, основатель DeepSeek
Вероятно, снижение ресурсов станет новым трендом в ИИ. Но пока что это пустая поляна, где есть только DeepSeek.
Краткие итоги
DeepSeek удалось создать успешный аналог ChatGPT, который во многом лучше американского аналога.
Но самое главное — он полностью бесплатный и не требует значительных ресурсов. Последний факт является большой проблемой для всех разработчиков ИИ и для Nvidia, потому что DeepSeek изменила подход к разработке ИИ, отодвинув необходимость в огромных ресурсах на второй план. тыц