Китайський стартап DeepSeek презентував новий бот на основі штучного інтелекту, який потребує значно менше ресурсів і при цьому суттєво перевершує провідні американські рішення.
Джерело. Про це повідомляє Reuters.
Світова спільнота у сфері штучного інтелекту звернула увагу на компанію після публікації дослідження, в якому було вказано витрати на навчання DeepSeek-V3: вартість використаних обчислювальних потужностей на базі чіпів Nvidia H800 склала менше $6 млн.
У понеділок DeepSeek обійшов свого конкурента ChatGPT і зайняв перше місце за кількістю завантажень серед безкоштовних додатків у магазині App Store Apple у США.
Це поставило під сумнів доцільність інвестицій мільярдів доларів деяких американських технологічних компаній у штучний інтелект.
На фоні цих новин акції ряду великих технологічних гравців, включаючи Nvidia, знизилися.
Після виходу чат-бота ChatGPT від OpenAI наприкінці 2022 року китайські технологічні компанії почали активно розробляти власні рішення на базі штучного інтелекту.
Випуск першого китайського аналога ChatGPT, розробленого пошуковим гігантом Baidu, викликав масове розчарування в Китаї через низьку якість продукту.
Проте DeepSeek має значно кращі перспективи: за даними стартапу, дві моделі – DeepSeek-V3 і DeepSeek-R1, які отримали високу оцінку як від керівників Кремнієвої долини, так і від інженерів американських технологічних компаній, не поступаються передовим моделям від OpenAI і Meta.
Використання цих моделей також є економічно вигіднішим. Модель DeepSeek-R1, представлена минулого тижня, в залежності від завдання, вимагає в 20-50 разів менше витрат, ніж модель o1 від OpenAI.
При цьому DeepSeek вже зіткнулася із звинуваченнями з боку американських конкурентів.
Генеральний директор Scale AI Олександр Ван у інтерв'ю CNBC заявив, що DeepSeek має 50 000 чіпів американської Nvidia – H100, однак не надав жодних доказів. На його думку, компанія приховує цей факт, оскільки це могло б свідчити про порушення заборони Вашингтона на продаж таких передових чіпів китайським компаніям.
Аналітики Bernstein в понеділок підкреслили, що загальні витрати на навчання моделі V3 компанії DeepSeek невідомі, але насправді перевищують $5,58 млн, про які повідомив стартап.
DeepSeek – це стартап, що базується в Ханчжоу, контрольним акціонером якого, згідно з китайськими корпоративними документами, є Лян Веньфен, один із співзасновників хедж-фонду High-Flyer.
Успіх DeepSeek вже помітили у найвищих політичних колах Китаю. За даними державного інформаційного агентства Сіньхуа, 20 січня, в день публічного запуску DeepSeek-R1, засновник компанії Лян Веньфен брав участь у закритому симпозіумі для підприємців під головуванням прем'єр-міністра Китаю Лі Цяна.
Присутність Ляна на цьому заході може свідчити про те, що успіх DeepSeek має важливе значення для політики КНР, спрямованої на подолання експортних обмежень Вашингтона та досягнення незалежності у стратегічних галузях, включаючи штучний інтелект.
Бекграунд. Як повідомлялося, OpenAI представила першого автоматизованого ШІ-агента – він здатний самостійно відвідувати різні вебсторінки й виконувати завдання.