![]() |
0523项目辅导(262)2025选题范围42:重大社会关切——中美AI竞争将更加白热化?
点击次数:
引 言:春节前夜,中美在AI竞争出现新剧情:国产大模型公司杭州深度求索[一家2023年7月份成立的由一帮“全国产”80后、90后组成的初创公司]开发的Deepseek应用于2025年1月27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT!资本市场首先出现巨震——竞争对手英伟达股价继前日下跌3.12%,当天又下跌16.97%!“这一剧情”到底会对资本市场产生何种持续影响?中美AI竞争会否将更加白热化、有哪些外溢效应、竞争方式会有哪些变化?开源和普及应用将会对技术创新、社会就业和稳定产生何种正负效应?是否会引起科技创新模式和国家支持科技创新方式的重大变革?值得关注并研究。
中国大模型DeepSeek强势崛起?
1.大模型DeepSeek横空出世
★DeepSeek于2024年12月26日(美国时间12月25日)当天发布了一款“震撼性的模型”——DeepSeek-V3,随后又于1月20日推出了一款专注于推理的强大AI模型DeepSeek-R1,对标OpenAI的o1模型。
★DeepSeek利用较少且不够先进的芯片训练出了媲美ChatGPT的模型。DeepSeek在一份技术报告中称,它使用超过2000个英伟达H800芯片集群来训练其参数为6710亿的V3模型,而Meta训练参数量4050亿的Llama 3,用了16384块更强的H100显卡,花了54天。Deepseek的训练效率为Meta的11倍。
★DeepSeek训练其最新模型之一的成本为560万美元(约合人民币4100万元)。相比之下,人工智能开发商Anthropic的首席执行官达里奥·阿莫迪 (Dario Amodei )去年提到的建立一个模型的成本为1亿至10亿美元。
★CNBC曾发文称:“DeepSeek-R1因其性能超越美国顶尖同类模型,且成本更低,算力消耗更少,引发了硅谷的恐慌。”
2,近期的市场反应
★财联社01-27 08:17:由国产大模型公司杭州深度求索开发的Deepseek应用27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。1月20日,该公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。
★金融界2025-01-27 21:18:实测发现,目前DeepSeek无法回答对话问题,提示“当前操作暂时无法完成,如需帮助,请联系我们”,而登录界面则提示“登录失败”。昨日下午,DeepSeek曾经历短暂崩溃。据悉,近日DeepSeek引发市场轰动,欧美科技股势将蒸发万亿美元市值,英伟达、博通、台积电等巨头美股盘前纷纷跌超10%。DeepSeek梁文锋表示,中国AI不可能永远处在跟随的位置。“我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”他认为,英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。
★彭博社2025-01-27 22:21:DeepSeek成为终结美股15年繁荣的催化剂!
★财联社1月28日电,美股三大指数收盘涨跌不一,道指涨0.65%,标普500指数跌1.46%,纳指跌3.07%。费城半导体指数大跌超9%。英伟达跌约17%,单日市值蒸发5890亿美元,创历史上最大单日个股蒸发规模。谷歌跌超4%,特斯拉、微软、英特尔跌超2%,奈飞小幅下跌;苹果涨超3%,再度成为全球市值最高上市公司;Meta涨超1%,亚马逊小幅上涨。Vistra跌超28%,Constellation Energy跌近21%。
★观察者网2025-01-27 18:27:近日,美国人工智能数据基础公司Scale AI创始人兼首席执行官Alexandr Wang在接受CNBC采访时称,DeepSeek拥有大约五万块英伟达H100芯片,但因美国出口管制措施,他们不能公开谈论。王在采访中先夸赞了DeepSeek的性能称,“我们发现,DeepSeek(R1)是目前表现最好的,或者说与美国最好的模型(GPT o1)处于同一水平。”当被问及中美两国在人工智能领域的竞争时,王表示:“长期以来,美国一直处于领先地位。”王认为,“中国实验室在圣诞节发布一款惊天动地的模型具有象征意义,要知道,我们其他人正在庆祝节日。”王将中美之间的人工智能竞赛描述为一场“AI战争”,并补充道,“美国将需要大量的计算能力和基础设施,我们需要释放美国的能量以推动这场AI繁荣。”
★财联社1月27日22:53讯(编辑 夏军雄)高盛发布报告称,随着中国人工智能(AI)大模型DeepSeek的强势崛起,对冲基金已开始观望美国本土培育的AI模式热潮是否能持续。报道称:总部位于中国杭州的DeepSeek(深度求索)公司于12月底发布了DeepSeek-V3模型,其开发时间据称仅用了两月时间,训练成本更是不到600万美元,远低于美国同行。DeepSeek上周又发布了推理模型DeepSeek-R1,该模型能力与AI龙头公司OpenAI的推理模型o1相当。DeepSeek引发了市场对AI开发成本,以及美国在该领域领先地位的质疑。高盛在上周五的报告中指出,对冲基金上周已开始撤离对科技股的押注。此外,对冲基金还继续抛售与科技行业相关的美国股票,包括那些将成为科技行业基础设施的公司。众所周知,在OpenAI的ChatGPT取得成功后,大型科技公司已投入数百亿美元开发更完善的美国AI基础设施。1月21日,OpenAI和日本软银公司分别承诺投资190亿美元,联合成立“星际之门”(Stargate)项目,致力于在美国建设AI数据中心。然而,“像中国AI初创公司DeepSeek这样的全球竞争者的出现,引发了人们对美国在这一领域主导地位可持续性的质疑,尽管国内投资规模巨大,”Erlen Capital Management董事总经理Bruno Schneller表示。对冲基金似乎在与这一行业相关的美国股票上采取了观望态度。“像Stargate这样的AI大型项目带来了复杂的监管问题,而这些问题仍在不断演变。有关这些政策执行和实施的缺乏透明性,使许多投资者感到不安,”Schneller补充道。
3.美国政界的态度
★据美国《国会山报》、英国《卫报》最新报道,美国总统特朗普当地时间27日在佛罗里达州迈阿密举行的共和党会议上对中国人工智能初创公司DeepSeek的崛起表示:“当你听说有人提出了某些新东西,我们总是有想法。”,“所以,我认为这是积极的。这可能是非常积极的发展。因此,与其投入数十亿资金,不如花费更少的(资源),但愿能得出同样的解决方案。”《卫报》还称,特朗普表示,他通过行政令撤销拜登政府人工智能相关规定的决定,将使美国人工智能公司能够“专注于成为最优秀的”,而不是被其他因素分散注意力。
★CNN援引特朗普的支持者,也是全球领先的科技投资者之一马克·安德森的话说, DeepSeek是“我见过的最令人惊叹和最令人印象深刻的突破之一”。CNN写道,“考虑到美国多年来一直以国家安全问题名义限制向中国供应高功率人工智能芯片,这家名不见经传的人工智能初创公司取得的惊人成就就更加令人震惊了。”“归根结底,美国表现优异是由科技和美国公司在人工智能领域的领先地位推动的,”CNN引用储亿银行分析师勒纳的话说,“DeepSeek模型的推出让投资者开始质疑美国公司的领先地位,美国公司在人工智能领域投入了多少资金,以及这些投入是否会带来利润(或超支)。”[Meta上周表示,今年将在人工智能开发上投入高达 650 亿美元。OpenAI 首席执行官奥特曼去年表示,人工智能行业需要数万亿美元的投资来支持开发所需的芯片。刚上台的特朗普宣布投资5000亿美元“星际之门”项目,以支持美国长期的AI领先。DeepSeek让人们对所有这些高额花费计划产生了怀疑。][英伟达在周一开盘时是美国也是全球市值最大的公司,在过去两年中它的市值每年都翻一倍,周一它蒸发了5890亿美元,这比美国股市上前13家公司以外的所有其他公司市值加起来还要多,已经有人怀疑英伟达的故事本身是否存在泡沫。英伟达-OpenAI模式对电能的消耗极大,星座能源、GE Vernova和Vistra等电力公司的股价周一均下跌超过 20%,有的股价扭转了在过去12个月内上涨一倍以上的长期涨势。]盛宝银行首席投资策略师Chanana认为,“DeepSeek的崛起可能会重新激发投资者对被低估的中国人工智能公司的兴趣,从而提供另一种增长故事。”
★美国众议院中国问题特别委员会主席、 众议员穆勒纳尔 (John Moolenaar) 周一表示,他希望看到美国采取行动,加强“出口管制”,放慢 “ DeepSeek ” 的速度。
★众议院议长约翰逊说:“DeepSeek” 对美国经济和安全,是 “一个严重威胁”。他表示,中国是一个 “糟糕的贸易伙伴” ,“总统非常重视这一点,我认为他将以适当的方式处理这一问题。”
4,进一步的动态
★新浪科技讯 1月28日上午消息,深度求索(DeepSeek)创始人梁文锋深夜发文官宣,DeepSeek刚刚发布并开源了一款名为Janus-Pro-7B的多模态AI模型,可以生成图像。据梁文锋介绍,在 GenEval和DPG-Bench基准测试中,Janus-Pro-7B击败了OpenAI的DALL-E3和Stable Diffusion。”
附:延伸阅读
舆是乎|DeepSeek:突破束缚,逆袭全球AI竞赛
作者:特约评论员 沈阳
在AI竞技场中,常常有人认为,巨大的计算资源和雄厚的资金实力是取得领先地位的唯一法宝。美国在技术上的主导地位似乎一度是不可撼动的,但DeepSeek的出现,彻底打破了这一固有认知。在AI的核心领域——大模型训练和AGI(通用人工智能),DeepSeek凭借极其有限的资源,走出了一条与美国截然不同的技术路径,甚至实现了“新道超车”,使中国在AI竞赛中迎头赶上,缩小了与全球领先者的差距。
DeepSeek的逆袭体现了六大价值。
技术价值:独创性与改良性造就AI效能奇迹
DeepSeek的成功标志着技术突破的一个新起点。在资源相对匮乏的情况下,凭借一系列独创性和改进性技术以及精妙的策略,DeepSeek创造了一个低成本的技术奇迹。它通过自研的DualPipe训练框架、8位浮点量化技术,以及改进的MOE和多词预测等创新手段,极大地提升了计算效率,将本应需要数十亿美元的成本压缩至600万美元左右,通过对数据集和训练算法的精心优化,大幅降低了训练成本。这一切使得低资源、高效能的AI模型训练不再遥不可及,堪称“算效跃迁”。在推理性能方面,DeepSeek也表现不凡。其综合推理性能接近当前全球领先的ChatGPT O1 Pro,甚至紧随其后,挑战即将发布的O3。DeepSeek凭借创新的MLA技术、改进的RL和蒸馏技术,在推理时展现出超高效率,与全球最强的AI模型相匹敌。这一突破不仅证明了其技术的先进性,也展示了其广阔的应用潜力。DeepSeek的成功意味着AI训练技术的普及不再仅仅依赖庞大的硬件资源,而更多地依赖于架构和算法的优化。DeepSeek的推理技术将在未来数月成为各类AI平台广泛应用的主流模式。
思想价值:人类命运共同体的AI生动实践
DeepSeek成为全球排名第一的开源大模型,背后不仅仅是技术创新,更是全新理念的体现。美国长期依靠资金和算力优势主导AI大模型的开发,OpenAI推出的O系列推理慢思考模型便是典型例子,虽然强大却未能向用户开源,形成了封闭的技术壁垒。因此,DeepSeek的开源战略具有重大意义。这不仅是技术透明度的突破,更是对AI行业传统规则的深刻挑战。通过开源,DeepSeek为全球开发者提供了一个创新与应用的开放平台,加速了技术的普及,降低了中小企业与开发者进入AI领域的门槛。无论是学术界的研究人员,还是工业界的工程师,都能在这一平台上进行探索与合作,推动全球技术的协同创新。近日,硅谷核心技术圈也在广泛讨论DeepSeek的精神与技术,这无疑影响深远。
经济价值:十万亿人民币的大生意
AI大模型是AGI的基础,也是所有AI应用的底座,其地位甚至高于移动互联网时代的操作系统。就像安卓操作系统所推动的经济规模超过10万亿人民币一样,如果DeepSeek能持续保持开源第一,其经济价值也可能突破10万亿人民币,且通过金融杠杆的放大作用,其经济影响力将更为深远。这也是为什么美国股市因为DeepSeek的出现,出现了对英伟达等半导体芯片公司估值波动的原因。从长期来看,DeepSeek的成功不仅是中国AI行业的突破,更是全球经济的利好消息。
战略价值:中美进入AI博弈相持期
我们要认识到,AI技术的理论和实践主要来源于北美,它们长期主导着全球技术格局。打破这种技术传承,难度极大。美国在技术上的优势对其他国家形成了较强的控制力,长期以来,中国和其他国家更多处于追随式、渐进式创新的状态。中国企业既想参与,迫于资源和算力的限制又很难在原有赛道突破,没有先天优势,只能被逼另辟蹊径。然而,DeepSeek的崛起意味着美国技术控制力的松动,标志着中国可能实现从“基建狂魔”到“制造业狂魔”,再到“新质生产力狂魔”的战略跨越。
DeepSeek强势入局AGI领域,AGI不仅仅是AI技术的巅峰,更是全球科技竞争的核心战场。DeepSeek的成功证明了中国在这一领域的崛起,不仅推动了中国AI技术的自主创新,也引发了全球对中国AI研发能力的重新审视。这一成功将迫使美国技术界修正对中国的认知,中美在AI领域的竞争或将从单纯的追随式博弈,逐步向平等竞争过渡。这种良性竞争将推动AI技术的飞跃发展。DeepSeek的发展告诉我们,我们一只眼睛要盯着美国的技术进展,另外一只眼睛还要看着无人区,去寻找中国的新技术路径。
此外,DeepSeek若与华为技术体系结合,即可开辟中国AI技术体系独立自主的潜力,带来无限想象空间。
人才价值:中国本土人才的世界性贡献
DeepSeek团队主要由年轻的中国应届毕业生和优秀学霸组成,他们迅速成长为AI领域的领军人物。许多团队成员来自清华、北大、浙大等顶尖学府,展现了中国高等教育在培养高科技人才方面的强大实力。这些年轻科学家们不仅在技术上取得突破,还在全球市场展示了中国AI人才的巨大价值。DeepSeek的成就将激发年轻一代对AI和科技创新的热情,尤其是00后,他们将更加注重为理想而战,为价值而活。
产业生态价值:从分众到大众的AI应用大爆发
截至2024年底,中国AI非去重用户已突破亿级规模,这意味着AI应用即将迎来大爆发。DeepSeek的出现,使得国内用户首次能够使用到博士生水平的AI。相比2022年仅相当于高中生水平,2023年接近本科生水平,现在,所有用户都可以自由且免费地使用到博士生水平的AI,这对信息平权至关重要。DeepSeek的成功必将推动全球AI生态的重大变革。
DeepSeek的出现促使封闭的AI技术巨头加速技术更新,也推动了开源企业的进一步努力。在这一点上,AI技术的开放性将更加普及,尤其是针对中小企业和新兴团队,DeepSeek为他们提供了可行的技术路径和解决方案。随着AI技术成本的大幅下降,未来AI应用将覆盖教育、医疗、制造业、金融等多个领域,可能实现飞跃式发展。特别是定制化AI服务的普及,将使得更多中小企业能享受到低成本、高效率的AI技术,全球范围内更多的高效AI模型将涌现,彻底改变各个行业的运作模式。
如果开源AI大模型能够和人形机器人、脑机接口、基因编辑及mRNA疫苗、游戏及元宇宙、可控核聚变、超导材料、量子计算等板块深度融合,则能真正推动碳基文明向硅基文明的技术大跃迁。
随着美国即将发布ChatGPT O3、Grok3等新版本,中美在AI领域的博弈将进入新阶段。我们期待中国AI在这一过程中继续超越,并推动全球开源知识共享的理念实现。(作者是清华大学新闻学院、人工智能学院 双聘教授)
责任编辑:任晓旭