
Она што го прави DeepSeek посебен е тоа што е, очигледно, многу поевтин. Додека индустрискиот лидер OpenAI потрошил повеќе од 100 милиони долари за развој на GPT-4, DeepSeek го развил својот модел од 6 милиони долари. Оваа предност во трошоците беше постигната со употреба на врвни Nvidia A100 чипови во комбинација со други релативно поевтини процесори.
Експертите тврдат дека оваа бројка е погрешна бидејќи не ги зема предвид пошироките трошоци за истражување и развој, стекнување на податоци, персонални трошоци, трошоци за инфраструктура и инвестиции во хардвер.
Перформанси и карактеристики
Исто како ChatGPT, DeepSeek работи со обезбедување одговори на прашања, и е споредлив со o1 моделот на OpenAI во математиката и кодирањето. Тоа е модел на “расудување” кој размислува и одговара како човечките суштества, што го прави особено корисен за бизнис и услуги на клиентите.

Performance compared Source: Artificial Analysis Graphic: Jasmine Cui and Joe Murphy / NBC News
Системот е особено добар во демонстрирањето на својот процес на расудување во решавањето на проблемот со разложување на процесот на расудување во чекори. Исто така, како човек кој решава загатка, може да ја следи својата логика и да ги исправи претходните чекори ако е потребно.
Овој транспарентен пристап им овозможува на корисниците да знаат како доаѓа до неговите препораки.
DeepSeek покренува етички грижи
Подемот на DeepSeek во пејзажот на ВИ покренува важни прашања за последиците од неговата технологија, особено со оглед на тоа што е обучен на ‘рбетот на скапиот хардвер кој можеби бил развиен за да ги пробие американските контроли за извоз.
Додека перформансите на R1 моделот, кој е способен да ја реплицира функционалноста на OpenAI o1, но за дел од цената, се импресивни, исто така ја открива можноста за ненадгледувани или неетички практики во развојот на ВИ во остатокот од светот.
Капацитетот на компанијата за успешно вметнување на Nvidia A100 чипови, кои претходно беа ограничени од страна на американските прописи, е црвено знаме за автентичноста на компанијата и како таквите технологии можат да се користат за рушење на меѓународниот поредок.
Покрај тоа, согласноста на одговорите на DeepSeek за чувствителните историски настани со цензурата на кинеската влада е загрижувачка, бидејќи покажува дека моделот може да се користи за поддршка на приказни контролирани од државата, што би можело да ја ограничи корисноста и кредибилитетот на моделот на глобално ниво.
Така, како што пазарите одговараат на оваа закана за американската технолошка надмоќ, пошироките импликации на стратегијата на DeepSeek, иновативни, но морално здрави, треба темелно да бидат анализирани.