DeepSeek
DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司。DeepSeek 是一家創(chuàng)新型科技公司,成立于2023年7月17日,使用數(shù)據(jù)蒸餾技術(shù),得到更為精煉、有用的數(shù)據(jù)。由知名私募巨頭幻方量化孕育而生,專注于開(kāi)發(fā)先進(jìn)的大語(yǔ)言模型(LLM)和相關(guān)技術(shù)。

簡(jiǎn)介
2024年1月5日,發(fā)布DeePSeek LLM(深度求索的第一個(gè)大模型)。1月25日,發(fā)布DeEPSeek-Coder。2月5日,發(fā)布DeepSeekMath。 3月11日,發(fā)布DeepSeek-VL。5月7日,發(fā)布DeepSeek-V2。6月17日,發(fā)布DeepSeek-Coder-V2 。9月5日,更新 API 支持文檔,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat ,推出 DeepSeek V2.5。12月13日,發(fā)布DeepSeek-VL2。12月26日晚,正式上線DeepSeek-V3首個(gè)版本并同步開(kāi)源。2025年1月31日,英偉達(dá)宣布DeepSeek-R1模型登陸NVIDIANIM。同一時(shí)段內(nèi),亞馬遜和微軟也接入DeepSeek-R1模型。英偉達(dá)稱,DeepSeek-R1是最先進(jìn)的大語(yǔ)言模型。
發(fā)展歷程
DeepSeek成立于2023年7月17日,由知名量化資管巨頭幻方量化創(chuàng)立。 [4]DeepSeek 是一家創(chuàng)新型科技公司,長(zhǎng)久以來(lái)專注于開(kāi)發(fā)先進(jìn)的大語(yǔ)言模型(LLM)和相關(guān)技術(shù),作為大廠外唯一一家儲(chǔ)備萬(wàn)張 A100 芯片的公司,幻方量化為DeepSeek的技術(shù)研發(fā)提供了強(qiáng)大的硬件支持。
2023年8月2日,注冊(cè)資本變更為1000萬(wàn)元,章程備案,投資人變更為寧波程恩企業(yè)管理咨詢合伙企業(yè),市場(chǎng)主體類型變更為其他有限責(zé)任公司。
2024年5月7日,DeepSeek發(fā)布了MoE架構(gòu)的DeepSeek V2。兩天后,第一財(cái)經(jīng)技術(shù)中心就對(duì)DeepSeek發(fā)布的技術(shù)報(bào)告和模型進(jìn)行了深度分析與研究。經(jīng)過(guò)嚴(yán)謹(jǐn)?shù)脑u(píng)估,團(tuán)隊(duì)認(rèn)為DeepSeek V2在架構(gòu)設(shè)計(jì)、性能表現(xiàn)等方面與財(cái)經(jīng)垂類大模型的需求高度契合,于是果斷決定將基座模型遷移至DeepSeek V2,并迅速啟動(dòng)了以DeepSeek V2為主力基座模型的財(cái)經(jīng)垂類大模型的訓(xùn)練與應(yīng)用研發(fā)工作。
2024年9月5日,DeepSeek 官方更新 API 支持文檔,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 兩個(gè)模型,升級(jí)推出全新的 DeepSeek V2.5 新模型。官方表示為向前兼容,API 用戶通過(guò) deepseek-coder 或 deepseek-chat 均可以訪問(wèn)新的模型。
2024年12 月,一份關(guān)于DeepSeek發(fā)布?xì)v程、優(yōu)化方向的專家會(huì)議紀(jì)要文件在業(yè)內(nèi)流傳。對(duì)此,DeepSeek 回應(yīng)稱,公司未授權(quán)任何人員參與券商投資者交流會(huì),所謂“DeepSeek 專家”非公司人員,所交流信息不實(shí)。DeepSeek 表示,公司內(nèi)部制定有嚴(yán)格的規(guī)章制度,明令禁止員工接受外部訪談、參與投資者交流等市場(chǎng)上各類面向投資者的機(jī)構(gòu)信息交流會(huì)。相關(guān)事項(xiàng)均以公開(kāi)披露信息為準(zhǔn)。
2025年1月27日,DeepSeek應(yīng)用登頂蘋果美國(guó)地區(qū)應(yīng)用商店免費(fèi)App下載排行榜,在美區(qū)下載榜上超越了ChatGPT。同日,蘋果中國(guó)區(qū)應(yīng)用商店免費(fèi)榜顯示,DeepSeek成為中國(guó)區(qū)第一。根據(jù)公開(kāi)報(bào)道,DeepSeek的員工規(guī)模不及OpenAI的1/5,百人出頭的公司中,算子、推理框架、多模態(tài)等研發(fā)工程師以及深度學(xué)習(xí)方面的研究人員共有約70人,主要在北京分部,其余30多人在杭州總部,多為前端、產(chǎn)品以及商務(wù)人員。
2025年1月28日消息,DeepSeek于服務(wù)狀態(tài)頁(yè)面公告稱:近期DeepSeek線上服務(wù)受到大規(guī)模惡意攻擊,為持續(xù)提供服務(wù),暫時(shí)限制了+86手機(jī)號(hào)以外的注冊(cè)方式,已注冊(cè)用戶可以正常登錄。
2025年1月,DeepSeek在GitHub平臺(tái)發(fā)布了Janus-Pro多模態(tài)大模型,進(jìn)軍文生圖領(lǐng)域。
2025年1月31日,英偉達(dá)宣布DeepSeek-R1模型登陸NVIDIANIM。同一時(shí)段內(nèi),亞馬遜和微軟也接入DeepSeek-R1模型。英偉達(dá)稱,DeepSeek-R1是最先進(jìn)的大語(yǔ)言模型。
2025年2月消息,DeepSeek-R1大模型一鍵部署至騰訊云「HAI」上,開(kāi)發(fā)者僅需3分鐘就能接入調(diào)用。
2023年8月2日,注冊(cè)資本變更為1000萬(wàn)元,章程備案,投資人變更為寧波程恩企業(yè)管理咨詢合伙企業(yè),市場(chǎng)主體類型變更為其他有限責(zé)任公司。
2024年5月7日,DeepSeek發(fā)布了MoE架構(gòu)的DeepSeek V2。兩天后,第一財(cái)經(jīng)技術(shù)中心就對(duì)DeepSeek發(fā)布的技術(shù)報(bào)告和模型進(jìn)行了深度分析與研究。經(jīng)過(guò)嚴(yán)謹(jǐn)?shù)脑u(píng)估,團(tuán)隊(duì)認(rèn)為DeepSeek V2在架構(gòu)設(shè)計(jì)、性能表現(xiàn)等方面與財(cái)經(jīng)垂類大模型的需求高度契合,于是果斷決定將基座模型遷移至DeepSeek V2,并迅速啟動(dòng)了以DeepSeek V2為主力基座模型的財(cái)經(jīng)垂類大模型的訓(xùn)練與應(yīng)用研發(fā)工作。
2024年9月5日,DeepSeek 官方更新 API 支持文檔,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 兩個(gè)模型,升級(jí)推出全新的 DeepSeek V2.5 新模型。官方表示為向前兼容,API 用戶通過(guò) deepseek-coder 或 deepseek-chat 均可以訪問(wèn)新的模型。
2024年12 月,一份關(guān)于DeepSeek發(fā)布?xì)v程、優(yōu)化方向的專家會(huì)議紀(jì)要文件在業(yè)內(nèi)流傳。對(duì)此,DeepSeek 回應(yīng)稱,公司未授權(quán)任何人員參與券商投資者交流會(huì),所謂“DeepSeek 專家”非公司人員,所交流信息不實(shí)。DeepSeek 表示,公司內(nèi)部制定有嚴(yán)格的規(guī)章制度,明令禁止員工接受外部訪談、參與投資者交流等市場(chǎng)上各類面向投資者的機(jī)構(gòu)信息交流會(huì)。相關(guān)事項(xiàng)均以公開(kāi)披露信息為準(zhǔn)。
2025年1月27日,DeepSeek應(yīng)用登頂蘋果美國(guó)地區(qū)應(yīng)用商店免費(fèi)App下載排行榜,在美區(qū)下載榜上超越了ChatGPT。同日,蘋果中國(guó)區(qū)應(yīng)用商店免費(fèi)榜顯示,DeepSeek成為中國(guó)區(qū)第一。根據(jù)公開(kāi)報(bào)道,DeepSeek的員工規(guī)模不及OpenAI的1/5,百人出頭的公司中,算子、推理框架、多模態(tài)等研發(fā)工程師以及深度學(xué)習(xí)方面的研究人員共有約70人,主要在北京分部,其余30多人在杭州總部,多為前端、產(chǎn)品以及商務(wù)人員。
2025年1月28日消息,DeepSeek于服務(wù)狀態(tài)頁(yè)面公告稱:近期DeepSeek線上服務(wù)受到大規(guī)模惡意攻擊,為持續(xù)提供服務(wù),暫時(shí)限制了+86手機(jī)號(hào)以外的注冊(cè)方式,已注冊(cè)用戶可以正常登錄。
2025年1月,DeepSeek在GitHub平臺(tái)發(fā)布了Janus-Pro多模態(tài)大模型,進(jìn)軍文生圖領(lǐng)域。
2025年1月31日,英偉達(dá)宣布DeepSeek-R1模型登陸NVIDIANIM。同一時(shí)段內(nèi),亞馬遜和微軟也接入DeepSeek-R1模型。英偉達(dá)稱,DeepSeek-R1是最先進(jìn)的大語(yǔ)言模型。
2025年2月消息,DeepSeek-R1大模型一鍵部署至騰訊云「HAI」上,開(kāi)發(fā)者僅需3分鐘就能接入調(diào)用。
主要產(chǎn)品
2024年1月5日,發(fā)布DeepSeek LLM,這是深度求索的第一個(gè)大模型。DeepSeek LLM包含670億參數(shù),從零開(kāi)始在一個(gè)包含2萬(wàn)億token的數(shù)據(jù)集上進(jìn)行了訓(xùn)練,數(shù)據(jù)集涵蓋中英文。全部開(kāi)源DeepSeek LLM 7B/67B Base和DeepSeek LLM 7B/67B Chat,供研究社區(qū)使用。DeepSeek LLM 67B Base在推理、編碼、數(shù)學(xué)和中文理解等方面超越了Llama2 70B Base。DeepSeek LLM 67B Chat在編碼和數(shù)學(xué)方面表現(xiàn)出色。它還展現(xiàn)了顯著的泛化能力,在匈牙利國(guó)家高中考試中取得了65分的成績(jī)。當(dāng)然,它還精通中文:DeepSeek LLM 67B Chat在中文表現(xiàn)上超越了GPT-3.5。
2024年1月25日,發(fā)布DeepSeek-Coder,DeepSeek Coder由一系列代碼語(yǔ)言模型組成,每個(gè)模型均從零開(kāi)始在2萬(wàn)億token上訓(xùn)練,數(shù)據(jù)集包含87%的代碼和13%的中英文自然語(yǔ)言。代碼模型尺寸從1B到33B版本不等。每個(gè)模型通過(guò)在項(xiàng)目級(jí)代碼語(yǔ)料庫(kù)上進(jìn)行預(yù)訓(xùn)練,采用16K的窗口大小和額外的填空任務(wù),以支持項(xiàng)目級(jí)代碼補(bǔ)全和填充。DeepSeek Coder在多種編程語(yǔ)言和各種基準(zhǔn)測(cè)試中達(dá)到了開(kāi)源代碼模型的最先進(jìn)性能。
2024年2月5日,發(fā)布DeepSeekMath,DeepSeekMath以DeepSeek-Coder-v1.5 7B為基礎(chǔ),繼續(xù)在從Common Crawl中提取的數(shù)學(xué)相關(guān)token以及自然語(yǔ)言和代碼數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,訓(xùn)練規(guī)模達(dá)5000億token。DeepSeekMath 7B在競(jìng)賽級(jí)MATH基準(zhǔn)測(cè)試中取得了51.7%的優(yōu)異成績(jī),且未依賴外部工具包和投票技術(shù),接近Gemini-Ultra和GPT-4的性能水平。
2024年3月11日,發(fā)布DeepSeek-VL,DeepSeek-VL是一個(gè)開(kāi)源的視覺(jué)-語(yǔ)言(VL)模型,采用了混合視覺(jué)編碼器,能夠在固定的token預(yù)算內(nèi)高效處理高分辨率圖像(1024 x 1024),同時(shí)保持相對(duì)較低的計(jì)算開(kāi)銷。這一設(shè)計(jì)確保了模型在各種視覺(jué)任務(wù)中捕捉關(guān)鍵語(yǔ)義和細(xì)節(jié)信息的能力。DeepSeek-VL系列(包括1.3B和7B模型)在相同模型尺寸下,在廣泛的視覺(jué)-語(yǔ)言基準(zhǔn)測(cè)試中達(dá)到了最先進(jìn)或可競(jìng)爭(zhēng)的性能。
2024年5月7日,發(fā)布第二代開(kāi)源Mixture-of-Experts(MoE)模型——DeepSeek-V2。DeepSeek-V2是一個(gè)強(qiáng)大的混合專家(MoE)語(yǔ)言模型,以經(jīng)濟(jì)高效的訓(xùn)練和推理為特點(diǎn)。它包含2360億個(gè)總參數(shù),其中每個(gè)token激活210億個(gè)參數(shù)。與DeepSeek 67B相比,DeepSeek-V2不僅實(shí)現(xiàn)了更強(qiáng)的性能,同時(shí)還節(jié)省了42.5%的訓(xùn)練成本,將KV緩存減少了93.3%,并將最大生成吞吐量提升至5.76倍。在一個(gè)包含8.1萬(wàn)億token的多樣化且高質(zhì)量的語(yǔ)料庫(kù)上對(duì)DeepSeek-V2進(jìn)行了預(yù)訓(xùn)練。在完成全面的預(yù)訓(xùn)練后,通過(guò)監(jiān)督微調(diào)(SFT)和強(qiáng)化學(xué)習(xí)(RL)進(jìn)一步釋放了模型的潛力。評(píng)估結(jié)果驗(yàn)證了方法的有效性,DeepSeek-V2在標(biāo)準(zhǔn)基準(zhǔn)測(cè)試和開(kāi)放式生成評(píng)估中均取得了顯著的表現(xiàn)。 DeepSeek V2模型因在中文綜合能力評(píng)測(cè)中的出色表現(xiàn),且以極低的推理成本引發(fā)行業(yè)關(guān)注,被稱為“AI界的拼多多”。
2024年6月17日,發(fā)布DeepSeek-Coder-V2,DeepSeek-Coder-V2是一個(gè)開(kāi)源的混合專家(MoE)代碼語(yǔ)言模型,在代碼特定任務(wù)中達(dá)到了與GPT4-Turbo相當(dāng)?shù)男阅。DeepSeek-Coder-V2是從DeepSeek-V2的一個(gè)中間檢查點(diǎn)開(kāi)始,進(jìn)一步預(yù)訓(xùn)練了額外的6萬(wàn)億token,顯著增強(qiáng)了DeepSeek-V2的編碼和數(shù)學(xué)推理能力,同時(shí)在通用語(yǔ)言任務(wù)中保持了相當(dāng)?shù)男阅。并在代碼相關(guān)任務(wù)、推理能力和通用能力等多個(gè)方面都取得了顯著進(jìn)步。此外,DeepSeek-Coder-V2將支持的編程語(yǔ)言從86種擴(kuò)展到338種,并將上下文長(zhǎng)度從16K擴(kuò)展到128K。在標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中,DeepSeek-Coder-V2在編碼和數(shù)學(xué)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,超越了GPT4-Turbo、Claude 3 OPUs和Gemini 1.5 Pro等閉源模型。
2024年12月13日,發(fā)布用于高級(jí)多模態(tài)理解的專家混合視覺(jué)語(yǔ)言模型——DeepSeek-VL2,DeepSeek-VL2是一個(gè)先進(jìn)的大型混合專家(MoE)視覺(jué)-語(yǔ)言模型系列,相較于其前身DeepSeek-VL有了顯著改進(jìn)。DeepSeek-VL2在多種任務(wù)中展現(xiàn)了卓越的能力,包括但不限于視覺(jué)問(wèn)答、光學(xué)字符識(shí)別、文檔/表格/圖表理解以及視覺(jué)定位。模型系列由三個(gè)變體組成:DeepSeek-VL2-Tiny、DeepSeek-VL2-Small和DeepSeek-VL2,分別具有10億、28億和45億激活參數(shù)。與現(xiàn)有的開(kāi)源密集模型和基于MoE的模型相比,DeepSeek-VL2在相似或更少的激活參數(shù)下實(shí)現(xiàn)了具有競(jìng)爭(zhēng)力或最先進(jìn)的性能。
2024年12月26日晚,AI公司深度求索(DeepSeek)正式上線全新系列模型DeepSeek-V3首個(gè)版本并同步開(kāi)源。 DeepSeek-V3在知識(shí)類任務(wù)(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5顯著提升,接近當(dāng)前表現(xiàn)最好的模型Anthropic公司于10月發(fā)布的Claude-3.5-Sonnet-1022。在美國(guó)數(shù)學(xué)競(jìng)賽(AIME 2024, MATH)和全國(guó)高中數(shù)學(xué)聯(lián)賽(CNMO 2024)上,DeepSeek-V3大幅超過(guò)了其他所有開(kāi)源閉源模型。另外,在生成速度上,DeepSeek-V3的生成吐字速度從20TPS(Transactions Per Second每秒完成的事務(wù)數(shù)量)大幅提高至60TPS,相比V2.5模型實(shí)現(xiàn)了3倍的提升,能夠帶來(lái)更加流暢的使用體驗(yàn)。
2025年1月20日,DeepSeek正式發(fā)布 DeepSeek-R1 模型,并同步開(kāi)源模型權(quán)重。DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。 DeepSeek-V3和DeepSeek-R1兩款大模型,成本價(jià)格低廉,性能與OpenAI相當(dāng),讓硅谷震驚,甚至引發(fā)了Meta內(nèi)部的恐慌,工程師們開(kāi)始連夜嘗試復(fù)制DeepSeek的成果。
2024年1月25日,發(fā)布DeepSeek-Coder,DeepSeek Coder由一系列代碼語(yǔ)言模型組成,每個(gè)模型均從零開(kāi)始在2萬(wàn)億token上訓(xùn)練,數(shù)據(jù)集包含87%的代碼和13%的中英文自然語(yǔ)言。代碼模型尺寸從1B到33B版本不等。每個(gè)模型通過(guò)在項(xiàng)目級(jí)代碼語(yǔ)料庫(kù)上進(jìn)行預(yù)訓(xùn)練,采用16K的窗口大小和額外的填空任務(wù),以支持項(xiàng)目級(jí)代碼補(bǔ)全和填充。DeepSeek Coder在多種編程語(yǔ)言和各種基準(zhǔn)測(cè)試中達(dá)到了開(kāi)源代碼模型的最先進(jìn)性能。
2024年2月5日,發(fā)布DeepSeekMath,DeepSeekMath以DeepSeek-Coder-v1.5 7B為基礎(chǔ),繼續(xù)在從Common Crawl中提取的數(shù)學(xué)相關(guān)token以及自然語(yǔ)言和代碼數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,訓(xùn)練規(guī)模達(dá)5000億token。DeepSeekMath 7B在競(jìng)賽級(jí)MATH基準(zhǔn)測(cè)試中取得了51.7%的優(yōu)異成績(jī),且未依賴外部工具包和投票技術(shù),接近Gemini-Ultra和GPT-4的性能水平。
2024年3月11日,發(fā)布DeepSeek-VL,DeepSeek-VL是一個(gè)開(kāi)源的視覺(jué)-語(yǔ)言(VL)模型,采用了混合視覺(jué)編碼器,能夠在固定的token預(yù)算內(nèi)高效處理高分辨率圖像(1024 x 1024),同時(shí)保持相對(duì)較低的計(jì)算開(kāi)銷。這一設(shè)計(jì)確保了模型在各種視覺(jué)任務(wù)中捕捉關(guān)鍵語(yǔ)義和細(xì)節(jié)信息的能力。DeepSeek-VL系列(包括1.3B和7B模型)在相同模型尺寸下,在廣泛的視覺(jué)-語(yǔ)言基準(zhǔn)測(cè)試中達(dá)到了最先進(jìn)或可競(jìng)爭(zhēng)的性能。
2024年5月7日,發(fā)布第二代開(kāi)源Mixture-of-Experts(MoE)模型——DeepSeek-V2。DeepSeek-V2是一個(gè)強(qiáng)大的混合專家(MoE)語(yǔ)言模型,以經(jīng)濟(jì)高效的訓(xùn)練和推理為特點(diǎn)。它包含2360億個(gè)總參數(shù),其中每個(gè)token激活210億個(gè)參數(shù)。與DeepSeek 67B相比,DeepSeek-V2不僅實(shí)現(xiàn)了更強(qiáng)的性能,同時(shí)還節(jié)省了42.5%的訓(xùn)練成本,將KV緩存減少了93.3%,并將最大生成吞吐量提升至5.76倍。在一個(gè)包含8.1萬(wàn)億token的多樣化且高質(zhì)量的語(yǔ)料庫(kù)上對(duì)DeepSeek-V2進(jìn)行了預(yù)訓(xùn)練。在完成全面的預(yù)訓(xùn)練后,通過(guò)監(jiān)督微調(diào)(SFT)和強(qiáng)化學(xué)習(xí)(RL)進(jìn)一步釋放了模型的潛力。評(píng)估結(jié)果驗(yàn)證了方法的有效性,DeepSeek-V2在標(biāo)準(zhǔn)基準(zhǔn)測(cè)試和開(kāi)放式生成評(píng)估中均取得了顯著的表現(xiàn)。 DeepSeek V2模型因在中文綜合能力評(píng)測(cè)中的出色表現(xiàn),且以極低的推理成本引發(fā)行業(yè)關(guān)注,被稱為“AI界的拼多多”。
2024年6月17日,發(fā)布DeepSeek-Coder-V2,DeepSeek-Coder-V2是一個(gè)開(kāi)源的混合專家(MoE)代碼語(yǔ)言模型,在代碼特定任務(wù)中達(dá)到了與GPT4-Turbo相當(dāng)?shù)男阅。DeepSeek-Coder-V2是從DeepSeek-V2的一個(gè)中間檢查點(diǎn)開(kāi)始,進(jìn)一步預(yù)訓(xùn)練了額外的6萬(wàn)億token,顯著增強(qiáng)了DeepSeek-V2的編碼和數(shù)學(xué)推理能力,同時(shí)在通用語(yǔ)言任務(wù)中保持了相當(dāng)?shù)男阅。并在代碼相關(guān)任務(wù)、推理能力和通用能力等多個(gè)方面都取得了顯著進(jìn)步。此外,DeepSeek-Coder-V2將支持的編程語(yǔ)言從86種擴(kuò)展到338種,并將上下文長(zhǎng)度從16K擴(kuò)展到128K。在標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中,DeepSeek-Coder-V2在編碼和數(shù)學(xué)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,超越了GPT4-Turbo、Claude 3 OPUs和Gemini 1.5 Pro等閉源模型。
2024年12月13日,發(fā)布用于高級(jí)多模態(tài)理解的專家混合視覺(jué)語(yǔ)言模型——DeepSeek-VL2,DeepSeek-VL2是一個(gè)先進(jìn)的大型混合專家(MoE)視覺(jué)-語(yǔ)言模型系列,相較于其前身DeepSeek-VL有了顯著改進(jìn)。DeepSeek-VL2在多種任務(wù)中展現(xiàn)了卓越的能力,包括但不限于視覺(jué)問(wèn)答、光學(xué)字符識(shí)別、文檔/表格/圖表理解以及視覺(jué)定位。模型系列由三個(gè)變體組成:DeepSeek-VL2-Tiny、DeepSeek-VL2-Small和DeepSeek-VL2,分別具有10億、28億和45億激活參數(shù)。與現(xiàn)有的開(kāi)源密集模型和基于MoE的模型相比,DeepSeek-VL2在相似或更少的激活參數(shù)下實(shí)現(xiàn)了具有競(jìng)爭(zhēng)力或最先進(jìn)的性能。
2024年12月26日晚,AI公司深度求索(DeepSeek)正式上線全新系列模型DeepSeek-V3首個(gè)版本并同步開(kāi)源。 DeepSeek-V3在知識(shí)類任務(wù)(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5顯著提升,接近當(dāng)前表現(xiàn)最好的模型Anthropic公司于10月發(fā)布的Claude-3.5-Sonnet-1022。在美國(guó)數(shù)學(xué)競(jìng)賽(AIME 2024, MATH)和全國(guó)高中數(shù)學(xué)聯(lián)賽(CNMO 2024)上,DeepSeek-V3大幅超過(guò)了其他所有開(kāi)源閉源模型。另外,在生成速度上,DeepSeek-V3的生成吐字速度從20TPS(Transactions Per Second每秒完成的事務(wù)數(shù)量)大幅提高至60TPS,相比V2.5模型實(shí)現(xiàn)了3倍的提升,能夠帶來(lái)更加流暢的使用體驗(yàn)。
2025年1月20日,DeepSeek正式發(fā)布 DeepSeek-R1 模型,并同步開(kāi)源模型權(quán)重。DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。 DeepSeek-V3和DeepSeek-R1兩款大模型,成本價(jià)格低廉,性能與OpenAI相當(dāng),讓硅谷震驚,甚至引發(fā)了Meta內(nèi)部的恐慌,工程師們開(kāi)始連夜嘗試復(fù)制DeepSeek的成果。
經(jīng)營(yíng)范圍
公司經(jīng)營(yíng)范圍包括一般項(xiàng)目:工程和技術(shù)研究和試驗(yàn)發(fā)展;技術(shù)服務(wù)、技術(shù)開(kāi)發(fā)、技術(shù)咨詢、技術(shù)交流、技術(shù)轉(zhuǎn)讓、技術(shù)推廣;軟件開(kāi)發(fā);計(jì)算機(jī)系統(tǒng)服務(wù);信息系統(tǒng)集成服務(wù);人工智能應(yīng)用軟件開(kāi)發(fā);信息技術(shù)咨詢服務(wù);電子產(chǎn)品銷售;通訊設(shè)備銷售;儀器儀表銷售;數(shù)據(jù)處理服務(wù);互聯(lián)網(wǎng)數(shù)據(jù)服務(wù);計(jì)算機(jī)軟硬件及輔助設(shè)備零售;人工智能硬件銷售;專業(yè)設(shè)計(jì)服務(wù)(除依法須經(jīng)批準(zhǔn)的項(xiàng)目外,憑營(yíng)業(yè)執(zhí)照依法自主開(kāi)展經(jīng)營(yíng)活動(dòng))。
事件
2024年12月,DeepSeek開(kāi)源大模型DeepSeek-V2的關(guān)鍵開(kāi)發(fā)者之一羅福莉?qū)⒓尤胄∶?或供職于小米AI實(shí)驗(yàn)室,領(lǐng)導(dǎo)小米大模型團(tuán)隊(duì)。
2025年1月,DeepSeek的R1模型發(fā)布一周之后,DeepSeek刷屏美國(guó)各大主流媒體和社交網(wǎng)站。其中一部分原因?yàn)?TMT Breakout在與網(wǎng)友的討論中,隱隱將英偉達(dá)周五下跌的原因指向DeepSeek的爆火。即R1的成功可能削弱了市場(chǎng)對(duì)英偉達(dá)AI芯片需求的預(yù)期,導(dǎo)致交易員做空英偉達(dá)股票,進(jìn)而引發(fā)股價(jià)下跌。 1月22日,美國(guó)媒體Business Insider報(bào)道稱,DeepSeek-R1模型秉承開(kāi)放精神,完全開(kāi)源,為美國(guó)AI玩家?guī)?lái)了麻煩。開(kāi)源的先進(jìn)AI可能挑戰(zhàn)那些試圖通過(guò)出售技術(shù)賺取巨額利潤(rùn)的公司。
2025年1月26日,有網(wǎng)友反應(yīng),DeepSeek崩了,提示服務(wù)器繁忙。 新浪科技詢問(wèn)DeepSeek今天下午是否有閃崩時(shí),DeepSeek回應(yīng)稱:1月26日下午DeepSeek確實(shí)出現(xiàn)了局部服務(wù)波動(dòng),但問(wèn)題在數(shù)分鐘內(nèi)得到解決。此次事件可能與新模型發(fā)布后的訪問(wèn)量激增有關(guān),而官方狀態(tài)頁(yè)未將其標(biāo)記為事故。
2025年1月27日,DeepSeek服務(wù)狀態(tài)頁(yè)面顯示,DeepSeek網(wǎng)頁(yè)/API不可用,目前正在調(diào)查該問(wèn)題。 對(duì)于DeepSeek網(wǎng)頁(yè)/API不可用的原因,DeepSeek回應(yīng)稱,可能和服務(wù)維護(hù)、請(qǐng)求限制等因素有關(guān)。
2025年1月27日晚,DeepSeek服務(wù)再次“宕機(jī)”,DeepSeek服務(wù)狀態(tài)頁(yè)面顯示,DeepSeek網(wǎng)頁(yè)不可用,公司正在調(diào)查這一問(wèn)題。 1月27日,DeepSeek服務(wù)狀態(tài)頁(yè)面顯示,20點(diǎn)55分,DeepSeek對(duì)話服務(wù)已恢復(fù),賬號(hào)服務(wù)仍存在問(wèn)題,用戶或無(wú)法登錄及注冊(cè)。21點(diǎn)05分,DeepSeek更新稱,將繼續(xù)監(jiān)測(cè)故障。
當(dāng)?shù)貢r(shí)間1月27日,納斯達(dá)克股指出現(xiàn)3%下跌,原因是中國(guó)人工智能公司DeepSeek模型引發(fā)美國(guó)投資者關(guān)注。央視記者在納斯達(dá)克交易所現(xiàn)場(chǎng)對(duì)納斯達(dá)克副主席麥柯奕進(jìn)行了采訪。麥柯奕表示,他認(rèn)為,DeepSeek將是人工智能領(lǐng)域革命的重要組成部分。
當(dāng)?shù)貢r(shí)間2025年1月27日晚,美國(guó)總統(tǒng)特朗普在佛羅里達(dá)州邁阿密發(fā)表講話時(shí),對(duì)中國(guó)人工智能初創(chuàng)公司DeepSeek攪動(dòng)納斯達(dá)克一事表示,DeepSeek的出現(xiàn)“給美國(guó)相關(guān)產(chǎn)業(yè)敲響了警鐘”,美國(guó)“需要集中精力贏得競(jìng)爭(zhēng)”。特朗普同時(shí)表示,他認(rèn)為,DeepSeek的模型高效且經(jīng)濟(jì),其出現(xiàn)是一種積極的發(fā)展。 1月27日,英國(guó)《金融時(shí)報(bào)》發(fā)表評(píng)論文章說(shuō),中國(guó)初創(chuàng)企業(yè)深度求索(DeepSeek)最近在人工智能領(lǐng)域獲得重大突破,其發(fā)布的開(kāi)源模型DeepSeek-R1對(duì)全球用戶產(chǎn)生極大吸引力,有利于推動(dòng)人工智能技術(shù)的開(kāi)發(fā)和應(yīng)用。 1月27日,中國(guó)深度求索(DeepSeek)公司發(fā)布的最新開(kāi)源模型引起熱議。美國(guó)媒體報(bào)道稱,這是人工智能領(lǐng)域的一場(chǎng)“地震”,“從華盛頓到華爾街再到硅谷都感受到了震動(dòng)”。美國(guó)經(jīng)濟(jì)學(xué)家布萊恩·雅各布森表示,這可能會(huì)改變?nèi)斯ぶ悄艿臄⑹?“我們確實(shí)需要擔(dān)心這一趨勢(shì)可能帶來(lái)的影響。”布萊恩·雅各布森同時(shí)表示,這說(shuō)明美國(guó)對(duì)華出口芯片限制顯然沒(méi)有那么有效,或許能看到美國(guó)政府的一些政策發(fā)生變化,從關(guān)稅、禁運(yùn)和限制方面轉(zhuǎn)向更多地補(bǔ)貼和激勵(lì)美國(guó)國(guó)內(nèi)技術(shù)的發(fā)展。
當(dāng)?shù)貢r(shí)間2025年1月28日,據(jù)央視新聞報(bào)道,美國(guó)新任白宮新聞秘書卡羅琳·萊維特(KarolineLeavitt)進(jìn)行了她的首次簡(jiǎn)報(bào)會(huì),其中提及了中國(guó)人工智能初創(chuàng)公司深度求索(DeepSeek)。關(guān)于DeepSeek,萊維特表示,特朗普認(rèn)為該公司發(fā)布的人工智能模型是對(duì)美國(guó)人工智能行業(yè)的一個(gè)警鐘。她同時(shí)稱,白宮正在努力“確保美國(guó)人工智能的主導(dǎo)地位”,特朗普此前簽署行政命令撤銷了對(duì)人工智能行業(yè)的一些繁瑣監(jiān)管。
2025年1月28日,深度求索(DeepSeek)官網(wǎng)顯示,其線上服務(wù)受到大規(guī)模惡意攻擊,譚主向奇安信安全專家咨詢并獨(dú)家了解到,DeepSeek這次受到的網(wǎng)絡(luò)攻擊,IP地址都在美國(guó)。 同日,美國(guó)多名官員回應(yīng)DeepSeek對(duì)美國(guó)的影響,表示DeepSeek是“偷竊”,正對(duì)其影響開(kāi)展國(guó)家安全調(diào)查。1月29日,360集團(tuán)創(chuàng)始人周鴻祎表示,如果DeepSeek有需要,360愿意提供網(wǎng)絡(luò)安全方面的全力支持。中國(guó)紅客聯(lián)盟發(fā)布公告,DeepSeek遭受攻擊關(guān)乎整個(gè)國(guó)家的網(wǎng)絡(luò)安全以及技術(shù)創(chuàng)新環(huán)境。
2025年1月29日消息, 美國(guó)全國(guó)廣播公司商業(yè)頻道援引其獲得的美國(guó)海軍的通知報(bào)道,美國(guó)海軍要求其工作人員不得使用中國(guó)聊天機(jī)器人Deepseek。報(bào)道說(shuō):“海軍表示,Deepseek的人工智能不能以‘以任何方式’被使用,因原因是“與該模型的來(lái)源和使用有關(guān)的潛在安全問(wèn)題和道德考慮”。根據(jù)通知,所有美國(guó)海軍工作人員不得下載、安裝或以任何其他方式使用該聊天機(jī)器人。 同日消息,意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)周二表示,正在向中國(guó)人工智能 (AI) 模型DeepSeek尋求有關(guān)其使用個(gè)人數(shù)據(jù)的解釋。 意大利監(jiān)管機(jī)構(gòu)Garante表示,希望了解收集了哪些個(gè)人數(shù)據(jù)、從哪些來(lái)源收集、用于什么目的、基于什么法律依據(jù),以及是否存儲(chǔ)在中國(guó)。 Garante 在一份聲明中表示,DeepSeek 及其附屬公司有 20 天的時(shí)間答復(fù),這是針對(duì)這家中國(guó)初創(chuàng)公司的首批監(jiān)管舉措之一。 在美國(guó),白宮新聞秘書表示官員們正在調(diào)查該應(yīng)用程序?qū)?guó)家安全的影響。
2025年1月28日,意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)表示,正在向中國(guó)人工智能 (AI) 模型DeepSeek尋求有關(guān)其使用個(gè)人數(shù)據(jù)的解釋。意大利監(jiān)管機(jī)構(gòu)Garante表示,希望了解收集了哪些個(gè)人數(shù)據(jù)、從哪些來(lái)源收集、用于什么目的、基于什么法律依據(jù),以及是否存儲(chǔ)在中國(guó)。 1月29日,在意大利當(dāng)局要求DeepSeek提供有關(guān)該公司如何處理用戶數(shù)據(jù)的信息數(shù)小時(shí)后,DeepSeek已不再意大利地區(qū)蘋果的App Store和谷歌的PLAy Store上提供。
2025年1月30日消息,微軟CEO納德拉在電話會(huì)上強(qiáng)調(diào),DeepSeek R1模型目前已可通過(guò)微軟的AI平臺(tái)Azure AI Foundry和GitHub獲取,并且很快就能在Copilot+電腦上運(yùn)行。納德拉稱DeepSeek“有一些真的創(chuàng)新”,AI成本下降是趨勢(shì):“縮放定律(Scaling Law)在預(yù)訓(xùn)練和推理時(shí)間計(jì)算中不斷積累。多年來(lái),我們已經(jīng)看到了AI訓(xùn)練和推理方面的效率顯著提高。在推理方面,我們通常看到每一代硬件的性價(jià)比提高2倍以上,每一代模型的性價(jià)比提高10倍以上!
2025年1月,美國(guó)商務(wù)部長(zhǎng)提名人霍華德·盧特尼克認(rèn)為,中國(guó)DeepSeek公司在創(chuàng)建人工智能聊天機(jī)器人時(shí)使用了竊取的美國(guó)技術(shù)。
2025年1月,愛(ài)爾蘭數(shù)據(jù)保護(hù)委員會(huì)副主席格雷厄姆·多勒(Graham Doyle)表示,該委員會(huì)要求中國(guó)公司DeepSeek提供有關(guān)其如何收集愛(ài)爾蘭用戶個(gè)人數(shù)據(jù)的信息。
2025年1月30日凌晨,奇安信Xlab實(shí)驗(yàn)室監(jiān)測(cè)發(fā)現(xiàn),針對(duì)DeepSeek線上服務(wù)的攻擊烈度突然升級(jí),其攻擊指令較1月28日暴增上百倍。Xlab實(shí)驗(yàn)室觀察到至少有2個(gè)“僵尸網(wǎng)絡(luò)”參與攻擊,共發(fā)起了兩波次攻擊。 針對(duì)DeepSeek的網(wǎng)絡(luò)攻擊一直在層層加碼,攻擊手段越來(lái)越多,防范難度越來(lái)越大,使得DeepSeek面臨的安全考驗(yàn)愈發(fā)嚴(yán)峻。
2025年1月,DeepSeek的出現(xiàn),打破了“大模型”、美國(guó)股市的神話,還顛覆了傳統(tǒng)“大模型需要大算力”無(wú)可匹敵的美國(guó)主流地位,進(jìn)一步挑戰(zhàn)了“巨型數(shù)據(jù)集”作為人工智能成功的唯一途徑的普遍認(rèn)知。
2025年1月30日,美國(guó)國(guó)會(huì)眾議院首席行政事務(wù)官向國(guó)會(huì)辦公室發(fā)出通知,警告國(guó)會(huì)辦公室不要使用中國(guó)的人工智能應(yīng)用DeepSeek(深度求索)的服務(wù)。通知中稱“DeepSeek正在接受首席行政事務(wù)官的審查,目前尚未授權(quán)眾議院正式使用該模型。”同日,法國(guó)監(jiān)管機(jī)構(gòu)國(guó)家信息與自由委員會(huì)表示,將對(duì)杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司進(jìn)行問(wèn)詢,以便了解這家中國(guó)初創(chuàng)企業(yè)的人工智能系統(tǒng)是如何運(yùn)行的,以及可能存在的隱私風(fēng)險(xiǎn)。
2025年1月31日消息,據(jù)《日本經(jīng)濟(jì)新聞》網(wǎng)站1月30日?qǐng)?bào)道,關(guān)于中國(guó)杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek)開(kāi)發(fā)的生成式人工智能(AI)服務(wù),日本內(nèi)閣官房長(zhǎng)官林芳正在30日的記者會(huì)上表示:“未聽(tīng)說(shuō)個(gè)人信息保護(hù)委員會(huì)確定特別應(yīng)對(duì)方針!睋(jù)報(bào)道,他還指出:“將密切關(guān)注AI相關(guān)國(guó)際開(kāi)發(fā)動(dòng)向等,采取妥善應(yīng)對(duì)措施!标P(guān)于生成式AI服務(wù),林芳正再次表示:“同時(shí)促進(jìn)創(chuàng)新和應(yīng)對(duì)風(fēng)險(xiǎn)非常重要! 同日消息,美國(guó)政府在調(diào)查有關(guān)DeepSeek公司涉嫌通過(guò)新加坡的中間商購(gòu)買先進(jìn)的NVIDIA芯片以規(guī)避美國(guó)制裁。
2025年2月1日,據(jù)臺(tái)灣“中央社”報(bào)道,大陸初創(chuàng)公司杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek)推出的人工智能(AI)模型引發(fā)“資安疑慮”。臺(tái)灣地區(qū)數(shù)字發(fā)展主管部門部1月31日表示,基于安全考量,特別警示公務(wù)機(jī)關(guān)與關(guān)鍵基礎(chǔ)設(shè)施應(yīng)限制使用DeepSeek的AI產(chǎn)品,以避免用戶相關(guān)數(shù)據(jù)或信息被有“資安疑慮”的產(chǎn)品傳送。
2025年2月1日,據(jù)埃菲社報(bào)道,新加坡也感受到了中國(guó)應(yīng)用程序“深度求索”(DeepSeek)所引發(fā)的地震。新加坡當(dāng)局否認(rèn)了關(guān)于中國(guó)杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司可能通過(guò)新加坡購(gòu)買先進(jìn)的英偉達(dá)芯片,以規(guī)避美國(guó)對(duì)其向亞洲大國(guó)銷售芯片的限制的說(shuō)法。另?yè)?jù)新加坡《聯(lián)合早報(bào)》網(wǎng)站2月1日?qǐng)?bào)道,美國(guó)政府正在調(diào)查中國(guó)人工智能公司DeepSeek是否使用受管制芯片,而且這些芯片或通過(guò)包括新加坡在內(nèi)的多個(gè)國(guó)家轉(zhuǎn)出口至中國(guó)。針對(duì)此事,新加坡貿(mào)工部2月1日發(fā)布文告。
2025年2月2日消息,據(jù)美聯(lián)社報(bào)道,美國(guó)得克薩斯州的州長(zhǎng)、共和黨籍政客格雷格·阿博特于當(dāng)?shù)貢r(shí)間周五簽署行政令,宣布從當(dāng)?shù)卣畵碛械碾娮釉O(shè)備中封殺近日在美國(guó)爆火的中國(guó)的人工智能服務(wù)DeepSeek。
2025年1月,DeepSeek的R1模型發(fā)布一周之后,DeepSeek刷屏美國(guó)各大主流媒體和社交網(wǎng)站。其中一部分原因?yàn)?TMT Breakout在與網(wǎng)友的討論中,隱隱將英偉達(dá)周五下跌的原因指向DeepSeek的爆火。即R1的成功可能削弱了市場(chǎng)對(duì)英偉達(dá)AI芯片需求的預(yù)期,導(dǎo)致交易員做空英偉達(dá)股票,進(jìn)而引發(fā)股價(jià)下跌。 1月22日,美國(guó)媒體Business Insider報(bào)道稱,DeepSeek-R1模型秉承開(kāi)放精神,完全開(kāi)源,為美國(guó)AI玩家?guī)?lái)了麻煩。開(kāi)源的先進(jìn)AI可能挑戰(zhàn)那些試圖通過(guò)出售技術(shù)賺取巨額利潤(rùn)的公司。
2025年1月26日,有網(wǎng)友反應(yīng),DeepSeek崩了,提示服務(wù)器繁忙。 新浪科技詢問(wèn)DeepSeek今天下午是否有閃崩時(shí),DeepSeek回應(yīng)稱:1月26日下午DeepSeek確實(shí)出現(xiàn)了局部服務(wù)波動(dòng),但問(wèn)題在數(shù)分鐘內(nèi)得到解決。此次事件可能與新模型發(fā)布后的訪問(wèn)量激增有關(guān),而官方狀態(tài)頁(yè)未將其標(biāo)記為事故。
2025年1月27日,DeepSeek服務(wù)狀態(tài)頁(yè)面顯示,DeepSeek網(wǎng)頁(yè)/API不可用,目前正在調(diào)查該問(wèn)題。 對(duì)于DeepSeek網(wǎng)頁(yè)/API不可用的原因,DeepSeek回應(yīng)稱,可能和服務(wù)維護(hù)、請(qǐng)求限制等因素有關(guān)。
2025年1月27日晚,DeepSeek服務(wù)再次“宕機(jī)”,DeepSeek服務(wù)狀態(tài)頁(yè)面顯示,DeepSeek網(wǎng)頁(yè)不可用,公司正在調(diào)查這一問(wèn)題。 1月27日,DeepSeek服務(wù)狀態(tài)頁(yè)面顯示,20點(diǎn)55分,DeepSeek對(duì)話服務(wù)已恢復(fù),賬號(hào)服務(wù)仍存在問(wèn)題,用戶或無(wú)法登錄及注冊(cè)。21點(diǎn)05分,DeepSeek更新稱,將繼續(xù)監(jiān)測(cè)故障。
當(dāng)?shù)貢r(shí)間1月27日,納斯達(dá)克股指出現(xiàn)3%下跌,原因是中國(guó)人工智能公司DeepSeek模型引發(fā)美國(guó)投資者關(guān)注。央視記者在納斯達(dá)克交易所現(xiàn)場(chǎng)對(duì)納斯達(dá)克副主席麥柯奕進(jìn)行了采訪。麥柯奕表示,他認(rèn)為,DeepSeek將是人工智能領(lǐng)域革命的重要組成部分。
當(dāng)?shù)貢r(shí)間2025年1月27日晚,美國(guó)總統(tǒng)特朗普在佛羅里達(dá)州邁阿密發(fā)表講話時(shí),對(duì)中國(guó)人工智能初創(chuàng)公司DeepSeek攪動(dòng)納斯達(dá)克一事表示,DeepSeek的出現(xiàn)“給美國(guó)相關(guān)產(chǎn)業(yè)敲響了警鐘”,美國(guó)“需要集中精力贏得競(jìng)爭(zhēng)”。特朗普同時(shí)表示,他認(rèn)為,DeepSeek的模型高效且經(jīng)濟(jì),其出現(xiàn)是一種積極的發(fā)展。 1月27日,英國(guó)《金融時(shí)報(bào)》發(fā)表評(píng)論文章說(shuō),中國(guó)初創(chuàng)企業(yè)深度求索(DeepSeek)最近在人工智能領(lǐng)域獲得重大突破,其發(fā)布的開(kāi)源模型DeepSeek-R1對(duì)全球用戶產(chǎn)生極大吸引力,有利于推動(dòng)人工智能技術(shù)的開(kāi)發(fā)和應(yīng)用。 1月27日,中國(guó)深度求索(DeepSeek)公司發(fā)布的最新開(kāi)源模型引起熱議。美國(guó)媒體報(bào)道稱,這是人工智能領(lǐng)域的一場(chǎng)“地震”,“從華盛頓到華爾街再到硅谷都感受到了震動(dòng)”。美國(guó)經(jīng)濟(jì)學(xué)家布萊恩·雅各布森表示,這可能會(huì)改變?nèi)斯ぶ悄艿臄⑹?“我們確實(shí)需要擔(dān)心這一趨勢(shì)可能帶來(lái)的影響。”布萊恩·雅各布森同時(shí)表示,這說(shuō)明美國(guó)對(duì)華出口芯片限制顯然沒(méi)有那么有效,或許能看到美國(guó)政府的一些政策發(fā)生變化,從關(guān)稅、禁運(yùn)和限制方面轉(zhuǎn)向更多地補(bǔ)貼和激勵(lì)美國(guó)國(guó)內(nèi)技術(shù)的發(fā)展。
當(dāng)?shù)貢r(shí)間2025年1月28日,據(jù)央視新聞報(bào)道,美國(guó)新任白宮新聞秘書卡羅琳·萊維特(KarolineLeavitt)進(jìn)行了她的首次簡(jiǎn)報(bào)會(huì),其中提及了中國(guó)人工智能初創(chuàng)公司深度求索(DeepSeek)。關(guān)于DeepSeek,萊維特表示,特朗普認(rèn)為該公司發(fā)布的人工智能模型是對(duì)美國(guó)人工智能行業(yè)的一個(gè)警鐘。她同時(shí)稱,白宮正在努力“確保美國(guó)人工智能的主導(dǎo)地位”,特朗普此前簽署行政命令撤銷了對(duì)人工智能行業(yè)的一些繁瑣監(jiān)管。
2025年1月28日,深度求索(DeepSeek)官網(wǎng)顯示,其線上服務(wù)受到大規(guī)模惡意攻擊,譚主向奇安信安全專家咨詢并獨(dú)家了解到,DeepSeek這次受到的網(wǎng)絡(luò)攻擊,IP地址都在美國(guó)。 同日,美國(guó)多名官員回應(yīng)DeepSeek對(duì)美國(guó)的影響,表示DeepSeek是“偷竊”,正對(duì)其影響開(kāi)展國(guó)家安全調(diào)查。1月29日,360集團(tuán)創(chuàng)始人周鴻祎表示,如果DeepSeek有需要,360愿意提供網(wǎng)絡(luò)安全方面的全力支持。中國(guó)紅客聯(lián)盟發(fā)布公告,DeepSeek遭受攻擊關(guān)乎整個(gè)國(guó)家的網(wǎng)絡(luò)安全以及技術(shù)創(chuàng)新環(huán)境。
2025年1月29日消息, 美國(guó)全國(guó)廣播公司商業(yè)頻道援引其獲得的美國(guó)海軍的通知報(bào)道,美國(guó)海軍要求其工作人員不得使用中國(guó)聊天機(jī)器人Deepseek。報(bào)道說(shuō):“海軍表示,Deepseek的人工智能不能以‘以任何方式’被使用,因原因是“與該模型的來(lái)源和使用有關(guān)的潛在安全問(wèn)題和道德考慮”。根據(jù)通知,所有美國(guó)海軍工作人員不得下載、安裝或以任何其他方式使用該聊天機(jī)器人。 同日消息,意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)周二表示,正在向中國(guó)人工智能 (AI) 模型DeepSeek尋求有關(guān)其使用個(gè)人數(shù)據(jù)的解釋。 意大利監(jiān)管機(jī)構(gòu)Garante表示,希望了解收集了哪些個(gè)人數(shù)據(jù)、從哪些來(lái)源收集、用于什么目的、基于什么法律依據(jù),以及是否存儲(chǔ)在中國(guó)。 Garante 在一份聲明中表示,DeepSeek 及其附屬公司有 20 天的時(shí)間答復(fù),這是針對(duì)這家中國(guó)初創(chuàng)公司的首批監(jiān)管舉措之一。 在美國(guó),白宮新聞秘書表示官員們正在調(diào)查該應(yīng)用程序?qū)?guó)家安全的影響。
2025年1月28日,意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)表示,正在向中國(guó)人工智能 (AI) 模型DeepSeek尋求有關(guān)其使用個(gè)人數(shù)據(jù)的解釋。意大利監(jiān)管機(jī)構(gòu)Garante表示,希望了解收集了哪些個(gè)人數(shù)據(jù)、從哪些來(lái)源收集、用于什么目的、基于什么法律依據(jù),以及是否存儲(chǔ)在中國(guó)。 1月29日,在意大利當(dāng)局要求DeepSeek提供有關(guān)該公司如何處理用戶數(shù)據(jù)的信息數(shù)小時(shí)后,DeepSeek已不再意大利地區(qū)蘋果的App Store和谷歌的PLAy Store上提供。
2025年1月30日消息,微軟CEO納德拉在電話會(huì)上強(qiáng)調(diào),DeepSeek R1模型目前已可通過(guò)微軟的AI平臺(tái)Azure AI Foundry和GitHub獲取,并且很快就能在Copilot+電腦上運(yùn)行。納德拉稱DeepSeek“有一些真的創(chuàng)新”,AI成本下降是趨勢(shì):“縮放定律(Scaling Law)在預(yù)訓(xùn)練和推理時(shí)間計(jì)算中不斷積累。多年來(lái),我們已經(jīng)看到了AI訓(xùn)練和推理方面的效率顯著提高。在推理方面,我們通常看到每一代硬件的性價(jià)比提高2倍以上,每一代模型的性價(jià)比提高10倍以上!
2025年1月,美國(guó)商務(wù)部長(zhǎng)提名人霍華德·盧特尼克認(rèn)為,中國(guó)DeepSeek公司在創(chuàng)建人工智能聊天機(jī)器人時(shí)使用了竊取的美國(guó)技術(shù)。
2025年1月,愛(ài)爾蘭數(shù)據(jù)保護(hù)委員會(huì)副主席格雷厄姆·多勒(Graham Doyle)表示,該委員會(huì)要求中國(guó)公司DeepSeek提供有關(guān)其如何收集愛(ài)爾蘭用戶個(gè)人數(shù)據(jù)的信息。
2025年1月30日凌晨,奇安信Xlab實(shí)驗(yàn)室監(jiān)測(cè)發(fā)現(xiàn),針對(duì)DeepSeek線上服務(wù)的攻擊烈度突然升級(jí),其攻擊指令較1月28日暴增上百倍。Xlab實(shí)驗(yàn)室觀察到至少有2個(gè)“僵尸網(wǎng)絡(luò)”參與攻擊,共發(fā)起了兩波次攻擊。 針對(duì)DeepSeek的網(wǎng)絡(luò)攻擊一直在層層加碼,攻擊手段越來(lái)越多,防范難度越來(lái)越大,使得DeepSeek面臨的安全考驗(yàn)愈發(fā)嚴(yán)峻。
2025年1月,DeepSeek的出現(xiàn),打破了“大模型”、美國(guó)股市的神話,還顛覆了傳統(tǒng)“大模型需要大算力”無(wú)可匹敵的美國(guó)主流地位,進(jìn)一步挑戰(zhàn)了“巨型數(shù)據(jù)集”作為人工智能成功的唯一途徑的普遍認(rèn)知。
2025年1月30日,美國(guó)國(guó)會(huì)眾議院首席行政事務(wù)官向國(guó)會(huì)辦公室發(fā)出通知,警告國(guó)會(huì)辦公室不要使用中國(guó)的人工智能應(yīng)用DeepSeek(深度求索)的服務(wù)。通知中稱“DeepSeek正在接受首席行政事務(wù)官的審查,目前尚未授權(quán)眾議院正式使用該模型。”同日,法國(guó)監(jiān)管機(jī)構(gòu)國(guó)家信息與自由委員會(huì)表示,將對(duì)杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司進(jìn)行問(wèn)詢,以便了解這家中國(guó)初創(chuàng)企業(yè)的人工智能系統(tǒng)是如何運(yùn)行的,以及可能存在的隱私風(fēng)險(xiǎn)。
2025年1月31日消息,據(jù)《日本經(jīng)濟(jì)新聞》網(wǎng)站1月30日?qǐng)?bào)道,關(guān)于中國(guó)杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek)開(kāi)發(fā)的生成式人工智能(AI)服務(wù),日本內(nèi)閣官房長(zhǎng)官林芳正在30日的記者會(huì)上表示:“未聽(tīng)說(shuō)個(gè)人信息保護(hù)委員會(huì)確定特別應(yīng)對(duì)方針!睋(jù)報(bào)道,他還指出:“將密切關(guān)注AI相關(guān)國(guó)際開(kāi)發(fā)動(dòng)向等,采取妥善應(yīng)對(duì)措施!标P(guān)于生成式AI服務(wù),林芳正再次表示:“同時(shí)促進(jìn)創(chuàng)新和應(yīng)對(duì)風(fēng)險(xiǎn)非常重要! 同日消息,美國(guó)政府在調(diào)查有關(guān)DeepSeek公司涉嫌通過(guò)新加坡的中間商購(gòu)買先進(jìn)的NVIDIA芯片以規(guī)避美國(guó)制裁。
2025年2月1日,據(jù)臺(tái)灣“中央社”報(bào)道,大陸初創(chuàng)公司杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek)推出的人工智能(AI)模型引發(fā)“資安疑慮”。臺(tái)灣地區(qū)數(shù)字發(fā)展主管部門部1月31日表示,基于安全考量,特別警示公務(wù)機(jī)關(guān)與關(guān)鍵基礎(chǔ)設(shè)施應(yīng)限制使用DeepSeek的AI產(chǎn)品,以避免用戶相關(guān)數(shù)據(jù)或信息被有“資安疑慮”的產(chǎn)品傳送。
2025年2月1日,據(jù)埃菲社報(bào)道,新加坡也感受到了中國(guó)應(yīng)用程序“深度求索”(DeepSeek)所引發(fā)的地震。新加坡當(dāng)局否認(rèn)了關(guān)于中國(guó)杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司可能通過(guò)新加坡購(gòu)買先進(jìn)的英偉達(dá)芯片,以規(guī)避美國(guó)對(duì)其向亞洲大國(guó)銷售芯片的限制的說(shuō)法。另?yè)?jù)新加坡《聯(lián)合早報(bào)》網(wǎng)站2月1日?qǐng)?bào)道,美國(guó)政府正在調(diào)查中國(guó)人工智能公司DeepSeek是否使用受管制芯片,而且這些芯片或通過(guò)包括新加坡在內(nèi)的多個(gè)國(guó)家轉(zhuǎn)出口至中國(guó)。針對(duì)此事,新加坡貿(mào)工部2月1日發(fā)布文告。
2025年2月2日消息,據(jù)美聯(lián)社報(bào)道,美國(guó)得克薩斯州的州長(zhǎng)、共和黨籍政客格雷格·阿博特于當(dāng)?shù)貢r(shí)間周五簽署行政令,宣布從當(dāng)?shù)卣畵碛械碾娮釉O(shè)備中封殺近日在美國(guó)爆火的中國(guó)的人工智能服務(wù)DeepSeek。
社會(huì)影響
2025年2月2日,據(jù)彭博社報(bào)道,由DeepSeek開(kāi)發(fā)的人工智能助手在全球范圍內(nèi)掀起了一股熱潮。這款推理型AI聊天機(jī)器人自2025年初發(fā)布以來(lái),迅速攀升至140個(gè)國(guó)家的蘋果App Store下載排行榜首位,并在美國(guó)的Android Play Store中同樣占據(jù)榜首位置。
相關(guān)評(píng)價(jià)
“DeepSeek新一代模型的發(fā)布意味著AI大模型的應(yīng)用將逐步走向普惠,助力AI應(yīng)用廣泛落地;同時(shí)訓(xùn)練效率大幅提升,亦將助力推理算力需求高增。我們持續(xù)看好AI產(chǎn)業(yè)鏈的加速落地機(jī)遇,建議重點(diǎn)關(guān)注AI應(yīng)用、AI Infra、AI算力三大主線!保ㄖ行抛C券研報(bào) 評(píng))
DeepSeek-V3是中國(guó)科技界帶給美國(guó)的苦澀教訓(xùn)!爱(dāng)美國(guó)休息時(shí),中國(guó)(科技界)在工作,以更低的成本、更快的速度和更強(qiáng)的實(shí)力趕上!保ˋlexander Wang 評(píng))
DeepSeek可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果。(游戲科學(xué)創(chuàng)始人、CEO,《黑神話:悟空》制作人馮驥 2025年1月26日評(píng))
DeepSeek-R1是一款令人印象深刻的模型,尤其是考慮到它能夠以這個(gè)價(jià)格提供(這樣的產(chǎn)品)。(美國(guó)開(kāi)放人工智能研究中心(OpenAI)首席執(zhí)行官薩姆·奧爾特曼 評(píng))
DeepSeek-V3是中國(guó)科技界帶給美國(guó)的苦澀教訓(xùn)!爱(dāng)美國(guó)休息時(shí),中國(guó)(科技界)在工作,以更低的成本、更快的速度和更強(qiáng)的實(shí)力趕上!保ˋlexander Wang 評(píng))
DeepSeek可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果。(游戲科學(xué)創(chuàng)始人、CEO,《黑神話:悟空》制作人馮驥 2025年1月26日評(píng))
DeepSeek-R1是一款令人印象深刻的模型,尤其是考慮到它能夠以這個(gè)價(jià)格提供(這樣的產(chǎn)品)。(美國(guó)開(kāi)放人工智能研究中心(OpenAI)首席執(zhí)行官薩姆·奧爾特曼 評(píng))
DeepSeek相關(guān)產(chǎn)品
為您推薦
關(guān)于我們 | 聯(lián)系我們 | 合作代理 | 客服中心 | 幫助信息 | 誠(chéng)聘英才 | 網(wǎng)站地圖 | 加入收藏夾 | 意見(jiàn)反饋 | 快遞查詢 | 漢字轉(zhuǎn)換 | RSS訂閱
©2013-2015h665.cn 版權(quán)所有 粵ICP備14027189號(hào)-5 湘公網(wǎng)安備 43052302000106號(hào)
互聯(lián)網(wǎng)違法和不良信息24小時(shí)舉報(bào)電話:13437489760 admin@h665.cn