下载APP | 繁體版 | 发布广告 |常用工具

世纪骗局?蒸馏技术?传DeepSeek 这些视频被秒删

京港台:2025-1-28 22:07| 来源:推特 | 评论( 115 )  | 我来说几句


世纪骗局?蒸馏技术?传DeepSeek 这些视频被秒删

来源:倍可亲(backchina.com)

  中国国内业界点评DeepSeek抄袭-每当国外出现什么重大的科技变革,中国都会立马有公司宣布遥遥领先。

  中国人工智能公司“深度求索”(DeepSeek)因其标榜“成本低”、性能又与美国OpenAI最领先的AI模型相媲美,近日引起轰动,不过也有台湾财经人士怀疑其中有猫腻。中国国内有专业人士则质疑DeepSeek靠抄袭难走远。

  中国国内业界点评DeepSeek抄袭

  原本默默无名的中国科技公司DeepSeek,号称通过低成本硬件开发出的人工智能大语言模型DeepSeek在性能上和美国最领先的AI模型旗鼓相当,近几天引发轰动。不过,中国国内也有人对DeepSeek的产品提出质疑。

  中国科技博主“水小木”表示:DeepSeek震惊美国科技界,网上消息都说美国人工智能受到威胁,好像DeepSeek已经具备用低成本芯片可以算出突破性模型的能力,因为DeepSeek,2,048张GPU训练了两个月,耗资只有558万美元,而反观GPT4用了25,000块,A100GPU训练一百天,花费一亿美元。这么一对比,可以说DeepSeek已在各方面遥遥领先,但有人可能会觉得不对劲。为什么呢?

  该博主解释说,“如果你把这几十年遥遥领先的新闻放在一起对比会发现一个惊人的规律,每当国外出现什么重大的科技变革,我们这边都会立马有公司宣布遥遥领先。然而过了一段时间以后,你又会发现好像一瞬间再也听不到这些消息了。”

  “每日经济新闻刚刚做了一个调研,他们发现如果你问DeepSeek你是谁?它会回答我是GPT4。如果你问他自己的编程接口是什么?它甚至会把OpenAI的编程接口使用说明给到你。如果你深入了解的话,就会发现就连笑话的笑点DeepSeek和GPT4都是一模一样。有国外专家是这么说的,大概率是DeepSeek使用了GPT4蒸馏。简单说,如果你是一个学生,老师已经给了你这道题的答案,你只需要让自己的推理过程,等于这个答案就可以,就省了大量的思考和运算,等于省去了大量的时间和成本,这种学习方法不是不行,但是会出现一个问题,导致学生永远不可能超越老师。因为当没有老师给你提供答案时,你就没有办法工作了。”该博主说

  该博主表示,就像平时考试一样,人家努力学习大量思考,做出一道题,你只需要提高抄袭水平,偷瞄一眼,也能做出这道题。问题是高考不让你抄了,你怎么办?“现在你知道为什么这几十年来我们有那么多的公司遥遥领先,但到最后都只是昙花一现了吧。因为这么多年来,他们努力的方向都是做蒸馏技术,蒸馏技术是条捷径,但是这条路走得越深,离核心科技其实也就越远。”

  另一位本身是国内AI领域创业者的博主表示:“我作为一个非常普通的用户,用DeepSeek和ChatGPT回答了一道逻辑推理题。结果DeepSeek的回答是错误的,ChatGPT是正确的。很多人私信给我说,我在黑DeepSeek。我想我作为一个中国的国内的AI领域的创业者,我黑它对我有什么好处?”

  她认为对DeepSeek的评价,不要去捧杀,“我们目前和OpenAI的差距在逐渐地缩小。但是你说超过它,没有可能,到现在为止,你就算是让DeepSeek的创始人梁文峰出来说,他自己都不敢说‘我已经超过了OpenAI’。”

  新美国安全中心(CNAS)助理研究员卢比?斯坎伦(Ruby Scanlon)对美国之音说,DeepSeek之所以可以用较低端的硬件和成本打造出这一产品,涉及模型蒸馏(Modell Distillation)。她解释说,假设一个模型中有5%是在从事整个模型里最重要的工作,“如果你将所有计算能力和训练资源集中在模型中最有用的那5%上──这就是模型蒸馏的原理──那么你可以真正专注于最关键的部分,从而得到更好的答案。”

  DeepSeek标榜“低成本” 遭疑有猫腻

  DeepSeek是中国科技公司幻方量化旗下的子公司“深度求索”打造的一系列人工智能大型语言模型。深度求索2023年7月才成立,2024年12月就发布开源模型DeepSeek-V3。今年1月20日,深度求索又发布了专门适用于数学、编码和逻辑等任务的DeepSeek-R1。

  根据“深度求索”发布的数据,DeepSeek的训练使用的是英伟达的H800型GPU,开发耗资仅不到558万美元,远低于其西方竞争对手的投入。由于美国的出口管制,H800是英伟达专门针对中国市场发售的性能较低的芯片。

  DeepSeek发布惊人的低成本AI模型后,美国科技公司股价大幅下挫。1月27日收盘时,英伟达在美国的股价大幅度下跌近17%,市值蒸发5,890亿美元,创下美股单日市值损失的历史记录。

  

  

截至1月27日,DeepSeek的应用程序分别在美国和中国的苹果商店登上了免费应用榜榜首。

  美国创业公司Scale AI的执行长(Alexandr Wang)第一时间就在电视上表示,DeepSeek有五万颗NVIDIA的H100处理器。“但是很明显他们不能说出来,因为这违反了美国所实施的出口管制,我相信他们拥有比外界想像的更多,他们未来会被芯片管制,和出口管制所限制”。

  台湾知名财经网美胡采苹则在脸书发文直言:“事实上DeepSeek的开发成本必然是谎报的,因为他们没有报上背后语言模型的成本”。

  胡采苹还表示,DeepSeek的母公司幻方量化是最重视芯片军火装备的一家公司,中国媒体过去报道过幻方是如何大量添购GPU、是中国准备最足的一家公司,这种发展逻辑的企业只会装备更强大的军火而已,不会丢盔弃甲空手上阵。

  对于幻方声称他们是用A800、降速芯片开发,胡采苹并表示:“这根本是无从验证的说法,美国社会相信诚实,说谎或诈欺会使公司面临严重的司法后果,因此他们也会假设中国公司说的都是可信的,但是他们跟中国公司打交道的经验太少了。”

  胡采苹提到,“其实上次华为说它突破美国封锁、做出七纳米芯片的时候,台积电也是从560跌到535,跌了快10%,只是当时是跌了一个多礼拜。”

  她说,一堆人都在说看美股反应就知道中国AI爆击了美国,一定是真的,但其实股市投资人往往才是最跟风的。后来经过解释,根本没人再怀疑台积电,然而这种金融攻击就是会有效果的,而且很多人在其中获利。

  台湾政府数位发展部政务次长林宜敬也在贴文后留言称,“目前资讯不完全,但可以确定的是,他们(DeepSeek)的成本绝对不是他们所说的六百万美金。单单是他们拿来训练模型的2,048片nVidia H800就远远不止这个价钱。”

  林宜敬表示,此外,有许多迹象显示,他们应该是拿ChatGPT的输出来训练DeepSeek。

相关专题:全球骗局,DeepSeek

推荐:美国打折网(21usDeal.com)    >>

        更多大千杂闻 文章    >>

【郑重声明】倍可亲刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资或其他建议。转载需经倍可亲同意并注明出处。本网站有部分文章是由网友自由上传,对于此类文章本站仅提供交流平台,不为其版权负责;部分内容经社区和论坛转载,原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除或更新作者。

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2025 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2025-4-17 13:47

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部