Прејди на содржината

DeepSeek

Од Википедија — слободната енциклопедија
Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.
Матично име
杭州深度求索人工智能基础技术研究有限公司
Видприватна
Дејностинформатичка технологија
Основаномај 2023; пред 2 години (2023-05)
Основач
СедиштеХангџоу, Џеџјианг, Кина
Клучни личности
  • Лианг Венфенг (извршен директор)
СопственикHigh-Flyer
Мреж. местоdeepseek.com

DeepSeek (се чита: Дипсик, кинески: трад. 深度求索) — кинеска компанија за вештачка интелигенција со седиште во Хангџоу, Кина, која се сосредоточува на создавање напредни модели на големи јазични модели (ГЈМ). Основана и поддржана од кинескиот хеџ-фонд High-Flyer, DeepSeek ги објавил своите модели како отворен код, што значи дека секој може да ги користи и надградува.

Во февруари 2016 г., ентузијастот за вештачка интелигенција Лианг Венфенг го основал High-Flyer. Тој тргувал од финансиската криза 2007-2008 додека студирал на Универзитетот Џеџјианг.[1] До 2019 г., тој го претворил High-Flyer во хеџ-фонд сосредоточен на создавање и користење алгоритми за тргување со вештачка интелигенција. До 2021 г., фондот целосно се потпирал на ВИ за тргување.[2]

Според 36Kr, Лианг собрал над 10.000 графички процесори Nvidia A100 пред САД да го ограничат извозот на чипови со вештачка интелигенција во Кина. Некои проценки дури претполагаат дека тој имал до 50.000 графички процесори.

Во април 2023 г., High-Flyer започнал истражувачка лабораторија за вештачка интелигенција за да развие алатки одвоени од нејзината финансиска работа. До мај 2023 г., со поддршка на High-Flyer, лабораторијата станала своја компанија, DeepSeek. Фирмите за ризичен капитал се колебале да инвестираат бидејќи се сомневале во брзите приноси.[2][3]

Во мај 2024 г., DeepSeek го објавил DeepSeek-V2, високоефективен модел со вештачка интелигенција и ниска цена. Ова предизвикало ценовна војна на кинескиот пазар за вештачка интелигенција, поради што DeepSeek го добил прекарот „Pinduoduo на вештачката интелигенција“. Конкурентните технолошки гиганти како ByteDance, Tencent, Baidu и Alibaba ги намалиле своите цени за да го продолжат темпото. И покрај ниските цени, DeepSeek останал доходен, за разлика од многу конкуренти.

Засега, DeepSeek е сосредоточен на истражување и нема јасни планови за комерцијализација.[4] Кога вработува, DeepSeek им дава приоритет на техничките вештини пред искуството, често најмувајќи неодамнешни дипломци или помалку етаблирани развивачи на вештачка интелигенција.[5]

  1. Chen, Caiwei (2025-01-24). „How a top Chinese AI model overcame US sanctions“. MIT Technology Review (англиски). Архивирано од изворникот 25 January 2025.
  2. 2,0 2,1 Ottinger, Lily (9 December 2024). „Deepseek: From Hedge Fund to Frontier Model Maker“. ChinaTalk (англиски). Архивирано од изворникот 28 December 2024. Посетено на 28 December 2024.
  3. Ottinger, Lily (9 December 2024). „Deepseek: From Hedge Fund to Frontier Model Maker“. ChinaTalk (англиски). Архивирано од изворникот 28 December 2024. Посетено на 28 December 2024.
  4. Schneider, Jordan (27 November 2024). „Deepseek: The Quiet Giant Leading China's AI Race“. ChinaTalk (англиски). Посетено на 28 December 2024.
  5. Jiang, Ben; Perezi, Bien (1 January 2025). „Meet DeepSeek: the Chinese start-up that is changing how AI models are trained“. South China Morning Post (англиски). Архивирано од изворникот 22 January 2025. Посетено на 1 January 2025.

Надворешни врски

[уреди | уреди извор]