短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1。這兩款模型成本低廉,性能卻與OpenAI相當,引發(fā)了硅谷的震動,甚至讓meta內(nèi)部陷入恐慌,工程師們開始連夜嘗試復制DeepSeek的成果。
Scale AI創(chuàng)始人Alexander Wang在采訪中表示,DeepSeek在他們的測試中表現(xiàn)最佳,與美國最好的模型相當。他之前曾評價說,DeepSeek-V3是中國科技界帶給美國的一個苦澀教訓,指出當美國休息時,中國科技界以更低的成本、更快的速度和更強的實力迎頭趕上。
中國AI的新進展也引起了國外媒體的關(guān)注,他們認為這些新進展為硅谷敲響了警鐘。特別是在5000億美元的“星際之門”計劃公布之際,DeepSeek以極低的價格建立了一個突破性的AI模型,且沒有使用尖端芯片,這讓人們質(zhì)疑巨額資本投入是否真的是最有效的方法。
一名meta員工在匿名平臺teamblind上發(fā)帖稱,由于DeepSeek-V3的表現(xiàn),meta已經(jīng)進入恐慌模式。DeepSeek-V3在基準測試中超越了Llama 4,而其訓練預(yù)算僅為550萬美元。meta工程師們正爭分奪秒地分析DeepSeek的技術(shù),試圖復制其成果。管理層則因GenAI研發(fā)部門的巨額投入感到焦慮,因為一個高管的薪資就超過了整個DeepSeek V3的訓練成本。
? 版權(quán)聲明