Nvidia reagovala na úspech Deepseek: Reakcia vás prekvapí!

Nvidia oceňuje technológiu Deepseek

Spoločnosť Nvidia označila nový model DeepSeek R1 za „vynikajúci pokrok v oblasti umelej inteligencie“, aj napriek tomu, že jeho predstavenie spôsobilo masívny prepad akcií firmy o 17%.

DeepSeek, startup z Číny, minulý týždeň predstavil open-source model R1, ktorý údajne prekonal najlepšie modely od amerických gigantov, ako je OpenAI a ich model o1.

Tento model si údajne vyžiadal len približne 6 miliónov dolárov na vývoj, čo je zlomok nákladov, ktoré do svojich modelov investujú firmy zo Silicon Valley.

Napriek negatívnemu vplyvu na akcie Nvidia vyjadrila podporu technológii.

„“DeepSeek je vynikajúci pokrok v oblasti AI a dokonalý príklad škálovania v čase testovania. Práca DeepSeek ilustruje, ako môžu byť vytvorené nové modely pomocou tejto techniky, pričom využíva široko dostupné modely a výpočty, ktoré sú plne v súlade s kontrolou exportu. Inferencia vyžaduje značný počet GPU NVIDIA a vysokovýkonné sieťovanie. Teraz máme tri zákony škálovania: predtréning (pre-training) a po tréning (post training), ktoré pokračujú, a nové škálovanie v čase testovania.““ uviedol hovorca Nvidie pre Investing.com.

NVIDIA $NVDA issued the following comments to https://t.co/HMaYPuSux7 on DeepSeek:

"DeepSeek is an excellent AI advancement and a perfect example of Test Time Scaling. DeepSeek’s work illustrates how new models can be created using that technique, leveraging widely-available…

— Investing.com (@Investingcom) January 27, 2025

Firma navyše zdôraznila, že GPU použité DeepSeekom sú plne v súlade s exportnými obmedzeniami, čím spochybnili tvrdenia, že Deepseek zavádal v tom, koľko GPU od Nvidia potreboval na vytrénovanie svojho modelu.

Test-time scaling mení pravidlá hry

Predstavitelia Nvidie a OpenAI, vrátane CEO Jensena Huanga a Sama Altmana, diskutujú posledné mesiace o novom prístupe v škálovaní AI, známeho ako test-time scaling.

Tento koncept umožňuje modelom počas predikcií využívať extra výpočtový výkon, čím zlepšujú svoje výsledky.

Podobné techniky využíva aj model DeepSeek R1, ktorý dokáže konkurovať modelom amerických technologických gigantov.

Dopad na americké firmy a trh

Nový model R1 vyvolal obavy analytikov a investorov, či obrovské investície amerických firiem do AI infraštruktúry nie sú plytvaním.

Napríklad Microsoft plánuje v roku 2025 minúť na AI infraštruktúru až 80 miliárd dolárov, zatiaľ čo Meta očakáva výdavky v rozmedzí 60 až 65 miliárd dolárov.

Analytik Justin Post z BofA Securities však uviedol, že ak sa potvrdia nižšie náklady na tréning modelov, môžu cloudové AI služby priniesť krátkodobé výhody pre spotrebiteľské spoločnosti.

TIP na článok: Návod ako kúpiť ETF na index S&P500 u brokera XTB

Budúcnosť AI: Čína a USA v technologickom súboji

Model R1 od DeepSeek vyvolal ohlas nielen svojou technológiou, ale aj geopolitickým významom.

Hoci Nvidia zdôrazňuje, že využité GPU boli určené pre čínsky trh, situácia posilňuje technologickú rivalitu medzi Čínou a USA. Tento pokrok môže zmeniť dynamiku na trhu umelej inteligencie, kde doteraz dominovali americké firmy.