OpenAI稱DeepSeek“數據蒸餾”侵犯其知識產權的證據 |
送交者: 雷歌747 2025年01月29日14:48:10 於 [天下論壇] 發送悄悄話 |
OpenAI稱發現DeepSeek通過 “數據蒸餾”侵犯其知識產權 雷歌 2025年1月29日 DeepSeek橫空出世帶來的衝擊還在繼續發酵。 與充斥簡中圈那種慣有的“厲害了我的國”的誇張論調不同,美國AI大公司都在緊鑼密鼓地分析DeepSeek的低成本模式到底怎麼做到的,也在爭論其實際意義和行業影響。 今天阿里巴巴也發布了AI大模型的新版本,即通義千問旗艦版模型Qwen2.5-Max,稱該模型超越了DeepSeek於去年12月底發現的V3版模型。這有明顯的蹭熱度嫌疑。 我在昨天的文章中重點分析了DeepSeek使用“數據蒸餾”方法降低訓練成本,給DeepSeek最終產品帶來的Bug,就是產品本質上還是個山寨版。而今天許多專業媒體也在紛紛聚集DeepSeek的“數據蒸餾”。 今天,川普任命的AI沙皇戴維·薩克斯(David Sacks)在接受FoxNews採訪時表示, DeepSeek違規使用了OpenAI的內容訓練自己的新模型。目前,OpenAI和微軟正在調查此事。而OpenAI則向《金融時報》表示,他們已經掌握了DeepSeek違規使用OpenAI數據的證據。 薩克斯表示,DeepSeek使用了一種名為蒸餾的過程,就是一個新的人工智能模型向一個現有模型提出數百萬個問題,以便學習其知識並模仿其推理過程。 “蒸餾”是一種常見的開發手段,開發者通過從成熟的大模型中提取數據來訓練自己的 AI 模型。這種技術能夠以遠低於原創模型(如 OpenAI 的ChatGPT)的訓練成本,高效地訓練出新模型。蒸餾技術已經被AI開發者使用多年,但從未像DeepSeek那樣取得如此巨大的成功。 “有充分的證據表明,DeepSeek在這裡所做的就是從OpenAI的模型中提取知識,” 薩克斯是硅谷資深風險投資家,他說:“我認為OpenAI對此不太高興。” 而彭博社和華爾街日報等多家財經專業媒體今天也報道稱,OpenAI 和微軟正在調查 DeepSeek 是否通過 OpenAI 的 API 將 OpenAI 的 AI 模型整合到 DeepSeek 自有的模型中。消息人士稱,微軟的安全研究人員在 2024 年底發現,大量數據通過 OpenAI 開發者賬戶被導出,而這些賬戶被認為與 DeepSeek 有關聯。 OpenAI 則向《金融時報》表示,他們發現了 DeepSeek 違規使用“蒸餾”技術的證據。 按照用戶使用協議,開發者可以通過 OpenAI 的 API 接口將其 AI 技術整合到自己的應用程序中,但利用輸出數據來構建競爭模型則違反了 OpenAI 的服務條款。 OpenAI 在一份聲明中表示:“我們深知,中國等國家的公司以及其他一些企業一直在試圖蒸餾美國領先 AI 公司的模型。作為 AI 領域的領軍者,我們採取了反制措施來保護我們的知識產權,這包括在發布模型時謹慎選擇哪些前沿功能可以包含在內。我們相信,未來與美國政府密切合作,以防止對手和競爭對手竊取美國技術,保護最先進的模型,是至關重要的。” DeepSeek在蒸餾技術上的成功在硅谷引發了廣泛擔憂,大家擔心那些花費數以千萬甚至數以億計美元開發尖端人工智能的公司,不會比競爭對手有多少優勢。 薩克斯表示,他認為美國人工智能公司將採取措施,試圖保護他們的模型不被蒸餾。他說:“這肯定會減緩這些山寨模型的發展速度,” DeepSeek是一家中國AI開發公司,它於1月20日發布了自己的最新AI語言模型DeepSeek-R1。經測試其性能可以與OpenAI兩年前推出的ChatGPT4相媲美,而其訓練成本則遠低於美國同類AI大模型。 DeepSeek稱,該公司於12月底發布的DeepSeek-V3模型,僅使用了2048塊英偉達H800GPU芯片,訓練55天就成型,整個訓練費用不到558萬美元。這一消息極大震撼了美國硅谷和華爾街,由此掀起了一場關注AI成本革命的風暴。 DeepSeek於今年1月20日發布的最新版本R1與此前的幾個模型版本均為開源版本。DeepSeek同時發布了R1模型背後的“權重”(數值參數),供公眾免費使用、下載和修改。但並沒有發布R1的訓練數據,這導致一些人認為其模型也並非完全“開源”。另外,DeepSeek也未提及R1的訓練費用 。 我在昨天的文章中已經分析了低成本AI大模型DeepSeek的橫空出世對全球AI發展的可能影響,得出了三個結論: 1)如果DeepSeek的低成本模式能夠直接在其它AI平台搭建中複製(這一點目前存疑,可能非常難,尚有待驗證),將直接引發AI領域的一場成本革命,極大降低AI基礎平台建設和應用模型訓練的資金門檻,吸引無數中小公司進入這一領域,使AI開發呈現百花齊放而不只是幾家巨頭公司壟斷的全新局面,將極大提升AI基礎研究和應用領域的擴散速度。 2)如果DeepSeek的低成本模式無法簡單複製,也會給AI大模型建設帶來方法論意義上的衝擊和啟發,將推動各大AI公司借鑑DeepSeek在架構設計和算法優化上的創新,進一步探索降低AI大模型建設成本的多樣化路徑。 3)目前DeepSeek顯示的成果,尚不足以顛覆美國引領全球AI研發的總體格局。由於DeepSeek的低成本快速訓練模式除了其在架構設計和算法優化上的創新外,也離不開其“數據蒸餾”模式。而“數據蒸餾”模式決定了DeepSeek最後推出的產品本質上還是對原創模型的模仿,雖然低成本,但依然是山寨版。“數據蒸餾”方法的應用場景只局限在複製原創模型,也就是模仿範圍。而所有的AI平台原創模型從目前看依然離不開大算力、大數據和高投入。因此,AI開發的總體格局和基本模式沒有改變。 我們期待DeepSeek帶來的方法論啟發,能在未來的AI開發中獲得進一步技術突破,能在原創AI大模型建設中大顯身手。 同時也可以預見,DeepSeek在“數據蒸餾”中可能存在的違規操作,必將引發美國原創AI平台的開發公司和美國政府進一步收緊防範措施。在中美競爭乃至對抗的大格局下,這將成為必然。 更多精彩內容請看: 1)萬維博客“雷歌視角”: https://blog.creaders.net/uindex.php 2)油管頻道“雷歌視角”: https://www.youtube.com/channel/UClfm_D5GrSVn59znfs8JD1g 歡迎關注“雷歌視角”,幫你挖掘新聞背後的新聞。 歡迎訂閱、轉發和點讚。謝謝! |
|
|
![]() |
![]() |
實用資訊 | |