Китайський стартап DeepSeek оновив свій потужний ШІ-модуль R1 і виклав його на Hugging Face

Компанія DeepSeek з Китаю оприлюднила оновлену версію свого інтелектуального reasoning-моделя R1 на платформі Hugging Face. Про це стало відомо зі свіжого повідомлення в офіційному WeChat-акаунті компанії, опублікованого у середу вранці.

Оновлення R1 описується як "незначне", але важливе. Модель поширюється під ліцензією MIT, що дозволяє їй вільне використання, включно з комерційним застосуванням. У репозиторії на Hugging Face наразі містяться лише конфігураційні файли моделі - її ключові внутрішні параметри, які визначають поведінку ШІ.

Розмір оновленого R1 вражає - 685 мільярдів параметрів, що робить його одним із найпотужніших відкритих ШІ-рішень. Така модель не може працювати на звичайному споживчому обладнанні без додаткових оптимізацій.

DeepSeek привернула увагу на початку 2025 року, коли початкова версія R1 показала високі результати, які змагалися з моделями від OpenAI. Успіх стартапу викликав занепокоєння з боку регуляторів у США, які вважають технології DeepSeek потенційною загрозою національній безпеці.