Мир искусственного интеллекта переживает тектонические сдвиги. Китайская компания DeepSeek представила свою новейшую модель DeepSeek-R1, которая, по заявлению разработчиков, не только сопоставима по производительности с ChatGPT от американской OpenAI, но и превосходит ее в экономической эффективности, ставя под сомнение доминирование США в этой стратегически важной области. Об этом пишет издание Deutsche Welle.
DeepSeek-R1 — это не просто очередная ИИ-модель, это, по сути, вызов традиционным представлениям о разработке таких систем. Компания утверждает, что их разработка обошлась значительно дешевле, чем у американских конкурентов, и использует гораздо меньше дорогостоящих чипов Nvidia.
Более того, в отличие от секретных алгоритмов OpenAI, DeepSeek открыла исходный код своей модели, предоставив подробную информацию о процессе разработки и бюджете, что вызвало резонанс в технологическом сообществе.
Этот прорыв не остался незамеченным на финансовых рынках. Выход DeepSeek-R1 спровоцировал резкое падение акций американских технологических компаний, занятых в сфере ИИ. Особенно ощутимый удар пришелся по акциям Nvidia, чья стоимость рухнула на 17 процентов, приведя к потере рыночной капитализации в $600 миллиардов. Такая реакция рынка свидетельствует о том, что инвесторы теперь сомневаются в неоспоримом лидерстве американских ИИ-компаний, столкнувшихся с серьезной конкуренцией.
Технологическая гонка
DeepSeek-R1, как и ChatGPT, — чат-бот, основанный на больших языковых моделях (LLM). Для обучения таких моделей требуются огромные вычислительные мощности и мощные чипы. Однако DeepSeek смогла достичь впечатляющих результатов, используя, по их словам, чипы Nvidia H800, а не более дорогие H100, ставшие недоступными из-за санкций США.
Одним из ключевых отличий DeepSeek-R1 от ChatGPT является открытость ее исходного кода. В то время как OpenAI хранит в секрете свои наработки, китайские разработчики предоставили подробную информацию о принципах работы своей модели и озвучили бюджет, который, как утверждается, составляет лишь небольшую часть затрат OpenAI на достижение аналогичных результатов. Это, по мнению аналитиков, может кардинально изменить правила игры в области ИИ.
Цена вопроса
Компания DeepSeek утверждает, что затраты на обучение их модели составили всего $5,6 миллиона, что на 95 процентов меньше, чем у OpenAI. Однако технический аналитик Ричард Виндзор из Radio Free Mobile выражает сомнения в точности этих данных, предполагая, что DeepSeek, возможно, получала скрытую поддержку от китайского правительства в виде субсидий на электроэнергию, зарплату и другие расходы.
Политический подтекст
Интересным совпадением является то, что публикация подробностей о DeepSeek-R1 произошла в день инаугурации президента США Дональда Трампа. Это, по мнению Ричарда Виндзора, может свидетельствовать о политической подоплеке данного события и стремлении КНР продемонстрировать свои достижения в технологической сфере.
Лян Вэньфэн, основатель DeepSeek, уже стал национальным героем в Китае и приглашен на встречу с премьер-министром страны.
DeepSeek возник как исследовательский проект хедж-фонда High Flyer и позже преобразован в самостоятельную компанию. Анджела Чжан, профессор права в Университете Южной Калифорнии, считает, что успех DeepSeek обусловлен тем, что фирма не преследовала исключительно коммерческие цели.
Она также не верит в тесную связь компании с китайским правительством, утверждая, что настоящие инновации в КНР исходят от частного сектора. «Тем не менее успех DeepSeek, безусловно, находится в поле зрения китайских властей», — добавила Анджела Чжан.
Ричард Виндзор считает: успех китайской компании может привести к тому, что другие организации начнут копировать их методы, что может сделать обучение ИИ-систем более доступным. Это может привести к резкому увеличению количества обученных ИИ-моделей и поставить под сомнение потребность в огромных центрах обработки данных для работы искусственного интеллекта.