深夜福利网-深夜福利网站大全,国产一区二区三区久久精品,99re6热在线精品视频播放,日韩中文字幕视频免费,影院一区二区小说性鲍视频

知名百科  > 所屬分類  >  商業(yè)百科   

DeepSeek

DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,中文簡稱為深度求索,是一家專注于先進大語言模型(LLM)及相關(guān)技術(shù)研發(fā)的試驗與發(fā)展型企業(yè)。該公司由量化資管領(lǐng)域的知名巨頭幻方量化于2023年7月17日創(chuàng)立,注冊地位于浙江省杭州市拱墅區(qū)環(huán)城北路169號匯金國際大廈西1幢1201室,法定代表人為裴湉。

2024年1月5日,DeepSeek正式推出了其首個大型模型——DeepSeek LLM。同年5月,該公司宣布開源第二代MoE大模型DeepSeek-V2,憑借其卓越的性能與親民的價格,DeepSeek贏得了“AI界拼多多”的綽號。12月26日,DeepSeek宣布DeepSeek-V3模型的首個版本正式上線并同步開源。

進入2025年,DeepSeek于1月20日正式發(fā)布了DeepSeek-R1模型,該模型在性能上與OpenAI的GPT-1正式版不相上下。1月31日,DeepSeek R1 671b作為英偉達NIM微服務(wù)的預(yù)覽版在build.nvidia.com平臺上發(fā)布。2月,DeepSeek-R1、V3、Coder等系列模型相繼上線國家超算互聯(lián)網(wǎng)平臺。同時,DeepSeek的日活躍用戶數(shù)于2月1日突破3000萬大關(guān),創(chuàng)下了達成這一里程碑的最快記錄。

截至2025年2月2日,DeepSeek已攀升至140個國家蘋果App Store下載排行榜的首位,并在美國的Android Play Store中也位居榜首。截至2月9日,DeepSeek App的累計下載量已超過1.1億次,周活躍用戶規(guī)模最高接近9700萬。2月21日,DeepSeek宣布將陸續(xù)開源5個代碼庫。2月26日,該公司開源了DeepGEMM。次日,DeepSeek發(fā)布了其“開源周”第四日的內(nèi)容,即優(yōu)化的并行策略。據(jù)IndiaTimes于3月31日報道,DeepSeek在2月錄得了5.247億次新的網(wǎng)站訪問量,超越了ChatGPT,在整體規(guī)模上仍位列第三。4月30日,DeepSeek在AI開源社區(qū)Hugging Face上發(fā)布了一個名為DeepSeek-Prover-V2-671B的模型。然而,7月根據(jù)國際半導(dǎo)體研究機構(gòu)Semianalysis的最新報告,DeepSeek的全球用戶使用率從2025年1月的50%急劇下降至7月的3%,官網(wǎng)訪問量在2月至5月期間也下滑了63%。

目錄

發(fā)展歷程 編輯本段

早期發(fā)展階段

于2023年4月,幻方量化正式發(fā)布公告,宣告其全面進軍人工智能技術(shù)領(lǐng)域,并宣布成立獨立的科研實體——深度求索公司。同年7月17日,DeepSeek在杭州市拱墅區(qū)市場監(jiān)督管理局順利完成注冊登記。8月2日,公司注冊資本調(diào)整至1000萬元,并完成章程備案手續(xù),同時投資人變更為寧波程恩企業(yè)管理咨詢合伙企業(yè)(有限合伙),企業(yè)類型變更為其他有限責(zé)任公司。2023年10月,DeepSeek成功完成由幻方量化主導(dǎo)的Pre-A輪融資,所獲資金主要用于大型語言模型的研發(fā)及團隊規(guī)模的擴張。

進入2024年,DeepSeek于1月5日正式推出首個大型語言模型DeepSeek LLM,該模型擁有670億參數(shù),基于一個包含2萬億token的中英文數(shù)據(jù)集進行訓(xùn)練。同年5月,DeepSeek宣布開源第二代基于混合專家(Mixture of Experts, MoE)架構(gòu)的大型語言模型DeepSeek-V2。該模型在性能上與GPT-4Turbo相當(dāng),但成本僅為GPT-4的百分之一,因此被業(yè)界譽為“AI界的拼多多”。

2024年9月5日,DeepSeek官方更新了API支持文檔,并宣布將DeepSeek Coder V2與DeepSeek V2 Chat兩個模型合并,升級為全新的DeepSeek V2.5模型。API用戶可通過deepseek-coder或deepseek-chat接口訪問新模型,該模型在寫作任務(wù)及指令遵循等方面進行了顯著優(yōu)化。11月20日,DeepSeek宣布推理模型DeepSeek-R1-Lite預(yù)覽版正式上線。同年12月26日,DeepSeek宣布DeepSeek-V3首個版本正式上線,并同步開放源代碼。

模型熱度飆升

2025年1月11日,DeepSeek官方App正式面世,并同步登陸iOS與安卓應(yīng)用市場。緊接著,1月20日,DeepSeek隆重推出DeepSeek-R1模型,該模型在數(shù)學(xué)運算、代碼生成及自然語言推理等任務(wù)上的表現(xiàn),已媲美OpenAI o1正式版。1月24日,據(jù)國外大模型排名Arena顯示,DeepSeek-R1在基準(zhǔn)測試中躍升至全類別大模型第三位,尤其在風(fēng)格控制類模型(StyleCtrl)分類中,與OpenAI o1并列榜首,其競技場得分高達1357分,略勝一籌于OpenAI o1的1352分。

至1月27日,DeepSeek應(yīng)用在蘋果應(yīng)用商店免費APP下載排行榜上,成功登頂15個國家和地區(qū)。同時,在美國區(qū)域,DeepSeek從1月26日的第六位躍居至首位,超越了ChatGPT、Meta旗下的社交媒體Threads,以及Google Gemini、Microsoft Copilot等美國科技巨頭的生成式AI產(chǎn)品,實現(xiàn)了中國應(yīng)用在中國及美國蘋果App Store同時占據(jù)榜首的歷史性突破。

1月31日,DeepSeek R1 671b版本作為英偉達NIM微服務(wù)預(yù)覽版,在build.nvidia.com平臺發(fā)布。該微服務(wù)在單個英偉達HGX H200系統(tǒng)上,每秒最高可處理3872個token。開發(fā)人員得以對API進行測試與實驗,預(yù)計該API將很快作為英偉達AI Enterprise軟件平臺的一部分,以可下載的NIM微服務(wù)形式正式推出。

進入2月,DeepSeek-R1、V3、Coder等系列模型,陸續(xù)上線國家超算互聯(lián)網(wǎng)平臺。截至2月2日,DeepSeek應(yīng)用迅速占據(jù)140個國家蘋果App Store下載排行榜首位,并在美國Android Play Store同樣奪得榜首。然而,2月6日,因服務(wù)器資源緊張,DeepSeek暫停了API服務(wù)充值,直至同月25日方重新開放。

4月4日,DeepSeek攜手清華大學(xué)研究團隊,聯(lián)合發(fā)布了題為《獎勵模型的推理時Scaling方法及其在大規(guī)模語言模型中的應(yīng)用》的學(xué)術(shù)論文,提出了自我原則點評調(diào)優(yōu)(SPCT)與元獎勵模型(Meta Reward Model)兩項核心技術(shù),為提升大語言模型(LLM)推理能力提供了創(chuàng)新性的方法論。該論文已在arXiv平臺公開(https://arxiv.org/abs/2504.02495 ),相關(guān)代碼與部分模型權(quán)重正逐步開源。

開源代碼庫

2025年2月21日,DeepSeek正式對外宣布,將分階段公開其五個核心代碼庫。緊接著,在2月24日,該公司啟動了備受矚目的“開源周”活動,并率先推出了針對Hopper GPU特別優(yōu)化的FlashMLA代碼庫。該解碼內(nèi)核以高效MLA架構(gòu)為核心,專為處理復(fù)雜多變長度的序列數(shù)據(jù)而設(shè)計。

DeepSeekDeepSeek

2月26日,Deepseek繼續(xù)其開源步伐,正式公布了DeepGEMM代碼庫。隨后,在2月27日上午10點05分,DeepSeek發(fā)布了“開源周”第四日的重大進展:一系列優(yōu)化的并行策略,涵蓋DualPipe這一創(chuàng)新的雙向管道并行算法,該算法旨在V3/R1訓(xùn)練中實現(xiàn)計算與通信的高效重疊。同時,還推出了EPLB,一種專為V3/R1設(shè)計的專家并行負(fù)載均衡解決方案。此外,DeepSeek還慷慨地分享了其訓(xùn)練和推理框架的性能分析數(shù)據(jù),旨在為開源社區(qū)提供深入了解通信與計算重疊策略及其底層實現(xiàn)細(xì)節(jié)的寶貴資源。

2月28日,作為“開源周”的壓軸之日,DeepSeek宣布開源其全數(shù)據(jù)訪問加速引擎——3FS(Fire-Flyer文件系統(tǒng))。3FS作為一款高性能的并行文件系統(tǒng),全面支持V3/R1版本中的訓(xùn)練數(shù)據(jù)預(yù)處理、數(shù)據(jù)集高效加載、檢查點的保存與重載,以及推理階段的向量嵌入搜索和KVCache快速查找功能。

進入4月30日,DeepSeek在AI開源社區(qū)的標(biāo)桿平臺Hugging Face上,發(fā)布了一款名為DeepSeek-Prover-V2-671B的先進模型。該模型采用了更為高效的safetensors文件格式,并支持多元化的計算精度,從而極大提升了模型訓(xùn)練與部署的速度和資源利用率。其參數(shù)規(guī)模高達6710億,或可視為2024年發(fā)布的Prover-V1.5數(shù)學(xué)模型的重大升級版。同日,Deepseek還推出了DeepSeek-Prover-V2-7B(增強版)模型,以及配套的DeepSeek-ProverBench數(shù)據(jù)集。DeepSeek-Prover-V2-671B在MiniF2F-test數(shù)據(jù)集上展現(xiàn)了卓越的性能,通過率高達88.9%,專注于形式化定理證明領(lǐng)域。結(jié)合DeepSeek-Prover-V2-7B模型在子目標(biāo)搜索方面的優(yōu)化,以及ProverBench基準(zhǔn)數(shù)據(jù)集的發(fā)布,DeepSeek正有力推動數(shù)學(xué)AI領(lǐng)域的蓬勃發(fā)展。

業(yè)務(wù)拓展 編輯本段

2025年3月,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司正式提交了多枚DeepSeek Chat商標(biāo)的注冊申請,其國際分類涵蓋了教育娛樂、廣告銷售等多個領(lǐng)域。截至3月17日,相關(guān)商標(biāo)的注冊申請狀態(tài)仍處于審核階段。同年4月1日,該公司,作為DeepSeek的關(guān)聯(lián)企業(yè),所申請的“一種廣度數(shù)據(jù)采集的方法及其系統(tǒng)”專利獲得公布。

業(yè)務(wù)數(shù)據(jù)

據(jù)某權(quán)威AI產(chǎn)品榜單統(tǒng)計,DeepSeek應(yīng)用在上線后的短短20天內(nèi),日活躍用戶數(shù)(DAU)迅速攀升至2215萬。2025年2月8日,根據(jù)QuestMobile的數(shù)據(jù),DeepSeek在1月28日的日活躍用戶數(shù)首次超越豆包,并在2月1日成功突破3000萬大關(guān),創(chuàng)造了應(yīng)用史上達成此里程碑的最快記錄。截至2月9日,DeepSeek App的累計下載量已超過1.1億次,周活躍用戶規(guī)模最高接近9700萬。其中,1月20日至1月26日期間,該應(yīng)用的周下載量達到226萬次,而次周的下載量更是飆升至6300萬次,環(huán)比增長超過2700%。3月31日,IndiaTimes報道指出,DeepSeek在2月期間錄得了5.247億次新的網(wǎng)站訪問量,超越了ChatGPT,盡管在整體規(guī)模上仍位列第三。然而,7月時,根據(jù)國際半導(dǎo)體研究機構(gòu)Semianalysis的最新報告,DeepSeek的全球用戶使用率已從2025年1月的50%顯著下降至7月的3%,官網(wǎng)訪問量在2月至5月期間也下滑了63%。另一家AI模型集成平臺Poe的統(tǒng)計數(shù)據(jù)顯示,其核心模型R1的使用率在2月至4月間減半,從7%跌至3%。進入2025年二季度,DeepSeek的月均下載量從第一季度的8111.3萬大幅下降至2258.9萬,降幅高達72.2%。

定價收益模式

DeepSeek API的定價策略為:每百萬輸入Tokens收費1元,每百萬輸出Tokens收費2元。該優(yōu)惠期截至北京時間2025年2月8日24:00。優(yōu)惠結(jié)束后,價格調(diào)整為每百萬輸入Tokens 2元,每百萬輸出Tokens 8元。而deepseek-reasoner模型自上線起即采用每百萬輸入Tokens 4元,每百萬輸出Tokens 16元的計費標(biāo)準(zhǔn)。2月26日,DeepSeek API開放平臺宣布實施錯峰優(yōu)惠定價策略,每日優(yōu)惠時段為北京時間00:30至08:30,其余時間則按標(biāo)準(zhǔn)價格計費。在優(yōu)惠時段內(nèi),API調(diào)用價格大幅下調(diào):DeepSeek-V3降至原價的50%,DeepSeek-R1更是降至25%。

合作機構(gòu)概覽

2025年3月,上海消防與DeepSeek攜手,針對三類特定場景展開了深入應(yīng)用。在日常辦公類政務(wù)應(yīng)用場景中,DeepSeek憑借其快速文本分析能力,精準(zhǔn)識別警情關(guān)鍵信息,為科學(xué)高效的決策提供了有力支撐。在數(shù)據(jù)治理專項工作應(yīng)用場景中,DeepSeek的深度學(xué)習(xí)和數(shù)據(jù)分析算法在數(shù)據(jù)分類標(biāo)注、清洗去重、關(guān)聯(lián)整合等三大主攻方向上發(fā)揮了強大作用,有效融合了分散在不同系統(tǒng)和部門的數(shù)據(jù),為消防業(yè)務(wù)提供了全面且準(zhǔn)確的數(shù)據(jù)支持。在網(wǎng)絡(luò)安全AI智能體應(yīng)用場景中,DeepSeek的數(shù)據(jù)分析和模式識別能力被應(yīng)用于訓(xùn)練“網(wǎng)絡(luò)安全智能體”,使其能夠及時識別異常行為和潛在的入侵威脅,有效防范網(wǎng)絡(luò)攻擊對消防業(yè)務(wù)造成的影響。

獲得榮譽 編輯本段

2025年5月11日,DeepSeek入選2025福布斯中國人工智能科技企業(yè)TOP50。

附件列表


0

詞條內(nèi)容僅供參考,如果您需要解決具體問題
(尤其在法律、醫(yī)學(xué)等領(lǐng)域),建議您咨詢相關(guān)領(lǐng)域?qū)I(yè)人士。

如果您認(rèn)為本詞條還有待完善,請 編輯

上一篇 紅果短劇    下一篇 小米汽車業(yè)務(wù)爆發(fā)式增長:二季度收入突破206億元

標(biāo)簽

同義詞

暫無同義詞