近日,DeepSeek发布的R1模型可以说对整个科技圈造成了巨大轰动,尤其是一直处于领先地位的美国AI领域。
R1模型以更低的价格实现超越多个美国头部模型,而且还完全开源,甚至有美国Meta员工爆料称公司“感到恐慌”。
而本周一,DeepSeek带来的冲击仍在持续,具体表现在美股大跌,尤其是半导体股,从盘前到收盘,一路“绿灯”。
英伟达更是创下周一收跌16.79%,市值蒸发5900亿美元,创下美国金融史记录。
周一收盘美股重挫
英伟达股价报118.42美元,跌幅16.97%,单日蒸发市值近6000亿美元,创美股最高纪录
台积电股价报192.52美元,跌幅13.23%
ARM股价报145.96美元,跌幅10.19%
阿斯麦股价报690.15美元,跌幅5.75%
美光科技股价报91.11美元,跌幅11.71%
此外,美股三大指数收盘涨跌不一,道指涨0.65%,标普500指数跌1.46%,纳指跌3.07%。
DeepSeek给了美国科技巨头一点“中国震撼”,英伟达发言人27日表示,“DeepSeek是一项出色的人工智能进步,也是测试时间缩放的完美例子。”“DeepSeek的工作说明了如何使用该技术创建新模型,利用广泛可用的模型和完全符合出口管制的计算。”
再出杀招
进军文生图:发布新开源多模态AI模型
但DeepSeek显然不准备止步于此。
1月28日凌晨,DeepSeek发布了名为Janus-Pro和JanusFlow的一系列开源多模态AI模型。
DeepSeek表示,这款大模型是2024年11月发布的JanusFlow大模型的高级版本;相较前代模型,Janus-Pro优化了训练策略、扩展训练数据,模型也更大。Janus-Pro在多模态理解和文本到图像的指令更总功能方面取得重大进步,还增强了文本到图像生成的稳定性。
DeepSeek的展示图显示,在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,准确率测试结果分别为80%和84.2%,高于包括OpenAI DALL-E 3在内的其他对比模型,Janus的准确率分别为61%和79.7%。
DeepSeek发布了名为Janus-Pro和JanusFlow的一系列开源多模态AI模型
其中,Janus-Pro是统一多模态与生成的创新框架,通过解耦视觉编码的方式,提升模型在不同任务中的适配行与性能。
该模型机可适配视觉问答、图像标注等多模态场景。
而JanusFlow是通过生成流与自回归语言模型融合实现统一框架;不仅能处理理解任务,还能够生成高质量图像。
这标志着DeepSeek将进军文生图领域。
DeepSeek 创始人梁文锋:中国AI不可能永远处在跟随位置
之所以DeepSeek的R1模型能让美国众科技公司关注,而且还对美股造成巨大影响,主要有两个核心原因。
一是在目前中美都在AI赛道发力的前提下,DeepSeek撼动了美国一直以来保持领先的地位。
自2022年底GPT3.5发布以来,无论是OpenAI,还是谷歌、苹果,美国科技公司在大模型领域都是引领者姿态;而中国的科技公司虽然也紧随其后地开发出多个大模型,且也有一定的实际应用,但一直处于追赶者地位似乎是圈里共识。
图为DeepSeek创始人梁文锋
而DeepSeek打破了这种“刻板印象”,其R1模型在第三方测试中,表现全部优于美国一众头部模型。
因此,Meta等公司对此“表现紧张”不难理解。
第二个核心原因则是,当前受美国制裁影响,中国公司无法使用高端芯片,在算力资源上处于劣势。
然而,就是在这种情况下,DeepSeek仍然能够开发出领先模型,一定程度上说明当前AI大模型所需的算力资源被高估了。
举个例子,此前被认为需要1万块顶级GPU才能开发的产品,而现在100块“阉割版”GPU也能实现。
DeepSeek为其他科技公司提供了新的选择,即在有限条件下,是可以通过技术优化而非大量购买芯片进行AI研发的。
所以这就对AI高端芯片产品需求造成影响,因此英伟达、台积电、阿斯麦等芯片产业链企业股价和市值下挫。
此前,DeepSeek创始人梁文锋在接受36氪旗下“暗涌”团队采访时表示,中国AI不可能永远处在跟随的位置。经常说中国AI跟美国有一两年差距,但真实的差距是原创和模仿之差。如果这个不改变,中国永远只是追随者,所以有些探索也是逃不掉的。
英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国 AI 的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。
相关新闻
近日,中国人工智能公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和算力,实现了足以匹敌美国顶尖AI模型的效果。昨天,DeepSeek还在苹果App Store应用商店美国区登顶,超越了长期霸榜的ChatGPT。
但中国企业取得的成果让美国一些反华政客急了,他们又动起了设置障碍、打压中国的歪心思。据美国彭博社1月27日报道,部分美国国会议员正呼吁美国总统特朗普实施更严格的出口限制,试图进一步遏制中国在AI领域的发展。
美国国会众议院“美中战略竞争特别委员会”主席、密歇根州共和党众议员约翰·莫莱纳尔(John Moolenaar)27日发布声明,妄称DeepSeek等中国AI模型“威胁美国国家安全”,鼓吹对“AI基础设施的关键技术”实施更严格的出口管制。
美国共和党众议员约翰·莫莱纳尔 彭博社
前美国商务部官员唐纳德·皮尔斯(Donald Pearce)等人士也呼吁特朗普政府加强出口管制。皮尔斯声称:“越早发现瓶颈技术,美国政府就能越快地与盟友和合作伙伴以多边方式实施有效的控制。”
彭博社称,DeepSeek-R1的发布使得刚刚上台的特朗普政府面临挑战,新一届美国政府必须决定是否要延续拜登政府的芯片出口管制,以及是否要扩大管制范围。自2022年10月以来,美国不断提高对中国的出口管制,阻止半导体巨头英伟达向中国出口高性能芯片。
但DeepSeek模型的表现证明,美国的出口管制措施并不能阻止中国的技术发展。深度求索在去年12月发布了DeepSeek-V3模型,在仅使用2048颗英伟达H800 GPU的情况下,完成了6710亿参数模型的训练,成本约为560万美元,这远低于其他顶级模型的训练成本。
1月20日发布的DeepSeek-R1则展现出更加强大的性能。深度求索表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,其性能比肩美国OpenAI o1正式版。
DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比较 DeepSeek微信公众号
彭博社指出,美国政府已从2023年10月起禁止向中国出口英伟达H800等芯片,但中国依然是英伟达的重要市场,该公司已为中国市场提供了算力更弱一些的H20芯片。
越来越多的人对美国政府的制裁和管制提出质疑,他们认为,美国这一举措不仅无法遏制中国,反而激发了中国科研人员的创造力。前英特尔首席执行官帕特里克·格尔辛格表示:“出口管制限制了可用资源,因此中国工程师需要发挥创造力——他们做到了。”
DeepSeek-R1模型的表现也让投资者质疑,美国的顶尖AI公司是否有必要囤积GPU,在硬件上投入数十亿美元的资金。路透社报道称,当地时间27日,全球投资者抛售科技股,使得英伟达股价下跌约17%,市值蒸发5930亿美元,创下华尔街的单日亏损新纪录。
投资者认为,低成本的DeepSeek取得成功,将对英伟达的业务造成影响。美国财富管理公司Annex Wealth Management的经济专家布莱恩·雅各布森(Brian Jacobsen)表示:“这可能打击过去两年推动市场的AI叙事,可能导致芯片需求减少,对大规模电力生产的需求减少,对大型数据中心的需求减少。”
对于DeepSeek的表现,美国总统特朗普27日回应说:“中国公司发布的DeepSeek应该为我们的行业敲响警钟,我们需要专注于竞争以取胜。”特朗普认为,深度求索公司取得了积极的突破,因为这表明AI发展“不需要花那么多钱”。
英伟达公司则发表声明称:“DeepSeek在人工智能领域取得了卓越进展,是‘测试时间缩放’的绝佳范例。DeepSeek的成果展示了如何利用这一技术,借助广泛可得的模型以及完全符合出口管制规定的计算资源,来创建新模型。”
英伟达还表示,AI公司的推理需要大量英伟达GPU和高性能网络,DeepSeek的爆火表明市场对其芯片仍有需求。
数字新闻杂志The Wire China发文指出,美国的出口管制促使中国加速实现技术的自给自足,中美在芯片等领域的技术差距正逐渐缩小,美国的制裁虽然具有破坏性,却可能反过来助推中国的创新能力。“美国越是专注于遏制对手而不解决自身的缺陷,就越有可能加速其领先地位的丧失。”
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.