下载APP | 繁體版 | 发布广告 |常用工具

Meta工程师正争分夺秒 分析复制DeepSeek

京港台:2025-1-27 01:46| 来源:联合报 | 评论( 25 )  | 我来说几句


Meta工程师正争分夺秒 分析复制DeepSeek

来源:倍可亲(backchina.com)

  总部位于杭州的中国AI新创公司“深度求索”(DeepSeek),去年底、1月20日先后发布了“DeepSeek-V3”和“DeepSeek-R1”两款大模型,由于成本低廉,性能与OpenAI相当,陆媒指此举引发硅谷震惊,甚至引发Meta内部焦虑, 工程师开始连夜尝试复制DeepSeek的成果。

  陆媒“每日经济新闻”26日报道,在美国总统川普宣布5000亿美元的“星际之门”(Stargate)发展人工智能基础建设计划之际,DeepSeek以极低的价格建立了突破性的AI模型,且未使用尖端芯片,让人们质疑,AI行业数千亿美元资本的巨额投入,是否真为最有效的方法?

  报道回顾,去年12月27日,DeepSeek推出开源模型“DeepSeek-V3”。 AI系统排名网站“聊天机器人竞技场”(Chatbot Arena)显示,“DeepSeek-V3”在所有模型中排名第7,在开源模型排第1。 且“DeepSeek-V3”是全球前十中,性价比最高的模型。

  不到1个月,今年1月20日,DeepSeek再推出“DeepSeek-R1”,24日,“DeepSeek-R1”在聊天机器人竞技场综合榜单上排名第3,与顶尖推理模型、OpenAI推出的o1并列。 同时,测评机构“Artificial-Analysis”对“DeepSeek-R1”的初始基准测试结果也显示,“DeepSeek-R1”在AI分析质量指数中取得第2高分,价格则是o1的约30之1。

  “每日经济新闻”称,24日,一篇发布在匿名平台teamblind上的文章疯传,一位自称是Meta员工称,Meta内部因为DeepSeek模型进入恐慌模式,该文员工写道,“DeepSeek-V3”在基准测试中,已经让(Meta推出的)Llama 4相形见绌,而更让人难堪的是,一家“仅用550万美元训练预算的中国公司”就做到了这一点。

  该匿名文指,工程师正争分夺秒分析DeepSeek,试图复制其中的一切可能技术。 另外,“DeepSeek-R1”的出现,也让情况更加严峻。

  《金融时报》25日称,中国的小型AI新创公司DeepSeek震惊硅谷,加州(专题)大学柏克莱分校AI政策研究员古普塔(Ritwik Gupta)表示,DeepSeek最近发布的模型,表明“AI能力没有护城河”。 古普塔也提到,中国的系统工程师人才库比美国大得多,懂得如何充分利用计算资源,来更便宜地训练、运行模型。

相关专题:DeepSeek

推荐:美国打折网(21usDeal.com)    >>

        更多科技前沿 文章    >>

【郑重声明】倍可亲刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资或其他建议。转载需经倍可亲同意并注明出处。本网站有部分文章是由网友自由上传,对于此类文章本站仅提供交流平台,不为其版权负责;部分内容经社区和论坛转载,原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除或更新作者。

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2025 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2025-4-26 10:38

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部