今年会·(jinnianhui)金字招牌-能解奥数，不会看钟：斯坦福2026年AI报告的15个判断

2026-05-30 21:57:34

首页财产ai正文能解奥数，不会看钟：斯坦福2026年AI陈诉的15个判定 4月13日斯坦福年夜学人本AI研究所发布2026年度AI Index陈诉，涵盖多方面内容，展现AI能力跃迁但于羁系、信托等方面滞后和带来的诸多影响。 2026-04-15 11:39 ·硅星人周华喷鼻 AI投资人解读· 2025年全世界AI私家投资同比增加127.5%，美国投资额是中国的23倍。同时，美国AI范畴顶尖学者流入量降落89%。AI于部门使命上能力晋升显著，但于如看懂模仿时钟等方面仍存不足。 · 行业竞争激烈，人材流掉或者影响美国AI成长模子能力与透明度掉衡，可能激发公家信托危机高能耗与算力集中，增长运营成本与供给危害。总结：AI投资增加迅速，但成长中存于能力不均、人材与信托等问题。投资时需存眷美国人材流掉、模子透明度和能耗危害，综合评估项今朝景与潜于挑战。内容由AI天生，仅供参考

4月13日，斯坦福年夜学人本AI研究所（HAI）发布了2026年度AI Index陈诉。400多页，笼罩技能能力、投资历局、就业影响、公家认知，是这个行业迄今最完备的第三方年度审计。

这份陈诉从2017年最先持续发布，本年的结论可以用一句话归纳综合：AI的能力正于以从未有过的速率跑赢一切——跑赢羁系框架，跑赢公家信托，跑赢教诲系统，甚至跑赢AI公司本身对于信息透明度的意愿。

如下是从陈诉中提炼的焦点内容。

原文链接：https://hai.stanford.edu/ai-index/2026-ai-index-report

1、科学能解奥数，不会看钟

先从一个细节提及。

本年的陈诉里有一张图，横轴是时间，纵轴是AI于各种使命上相对于在人类的体现。图上有一条线险些是垂直上升的：代码能力。SWE-bench Verified——权衡AI自立完成真实软件工程使命的尺度测试——于一年以内从60%跳到了近100%。同期，AI代办署理处置惩罚实际使命的乐成率从20%跃升至77.3%，收集安全问题的解题率从15%飙到93%。

from clipboard

已往一年，Terminal-Bench 2.0 的正确率显著晋升，从 2025 年 2 月的 20%晋升到 2026 年头的 77.3%（见图 2.5.2）。

Humanity's Last Exam是一套由全世界近千名范畴专家配合设计的考题，专门为了难倒AI而生，笼罩物理、数学、汗青、法令等险些所有高难度学科。2025年时，*的模子只能答对于8.8%的标题问题。到今天，前沿模子的患上分已经经跨越50%。

from clipboard

2024 年至 2025 年间，HLE 模子正确率提高了 30 个百分点（见图 2.4.4）。一年内，正确率从不到 10%跃升到38.3%

这不是线性增加，是跃迁。

但统一份陈诉里，还有有另外一条线——呆板人完成真实家务使命的乐成率，折叠衣服、洗碗这种事，至今只有12%。AI仍旧不克不及不变地看懂模仿时钟。天生联贯视频繁然坚苦，多步调计划仍旧堕落，某些专家级学术测验仍旧答不合错误。

Gemini Deep Think 于 2025 年 IMO 中以天然语言举行首发事情，于 4.5 小时的时间限定内得到 35 分（金），高在 2024 年得到的 28 分银奖。于 ClockBench 上，*型号能准确读取模仿时钟的 50.1%，而人类则为 90.1%

能力的漫衍是不匀称的——某些维度已经经逾越了人类可以验证的规模，另外一些处所仍于爬行。这是2026年AI的真实状况，也是接下来所有问题的底色。

2、美国事中国投资额的23倍，但AI人材流入已经跌了89%

2025年，全世界AI私家投资到达3447亿美元，同比增加127.5%。企业层面的AI投资总额到达5817亿美元，一年翻了一倍多。

美国于这场武备竞赛里脱手最猛。2025年，美国AI投资额2859亿美元，是排名第二的中国（124亿美元）的23倍。这个差距是压服性的。

from clipboard

但统一份陈诉里，另外一组数字指向了彻底相反的标的目的。

2017年到2026年，AI范畴*学者移居美国的数目降落了89%。仅于已往一年，这一数字又跌了80%。

两组数字放于一路的寄义很清晰：美国于AI上砸的钱愈来愈多，但能用这些钱招到的最*的人愈来愈少。钱还有于涌入，但它的边际价值正于被人材流掉侵蚀。

中国的投资逻辑与此差别。陈诉指出，纯真以私家投资额比力，会体系性地低估中国投入AI的本钱体量。中国当局经由过程"当局指导基金"这一机制，自2000年以来于包括AI于内的各范畴累计部署了跨越9120亿美元。这笔钱不走市场化渠道，不呈现于私家投资数据里，但它实其实于地存于。

于模子数目上，美国2025年发布了50个"值患上存眷"的模子，中国约莫30个，差距于缩小。于工业呆板人安装量上，中国2024年安装了29.5万台，美国3.42万台，差距是8.6倍。中美于AI上走的是两条平行赛道，正面比武之处只是此中一部门。

from clipboard

3、22岁的步伐员已经经感触感染到了，CEO还有于说AI只是东西

就业影响的数据本年*次清楚到没法绕开。

22到25岁的软件开发者，从2024年以来就业人数降落了近20%。统一期间，26岁以上的偕行就业人数基本持平甚至小幅增加。这不是整个软件行业于萎缩——是AI打击从底部最先，精准地切失了入门岗亭。

from clipboard

自 2022 年以来，最年青工人（22 至 25 岁）的就业人数有所降落，只管年终年龄段的员工人数连续增加（见图 4.4.29）。到 2025 年 9 月，22 至 25 岁软件开发者的就业人数较 2022 年峰值降落了近 20%。

客服范畴一样呈现了近似的模式：低级岗亭于紧缩，资深岗亭暂时安全。

三分之一的企业高管于麦肯锡的查询拜访中暗示，估计将来一年将进一步缩减员工范围，特别集中于办事业、供给链及软件工程。这是关在将来的规划，不是已经经发生的事。已经经发生的是：年青人先感触感染到了。

陈诉的研究者同时提出了一个主要的限制：就业数据遭到宏不雅经济的滋扰，没法把AI的影响彻底分散出来。但他们也指出了一个反常的征象——AI袒露水平低的职业，掉业率的上升反而高在AI袒露水平高的职业。这与"AI直接替换"的简朴叙事不符，暗地里可能有更繁杂的劳动力市场重构正于发生。

AI带来的出产力晋升数字，陈诉一样给出了：客服范畴晋升14%，软件开发范畴晋升26%。这些增益是真正的，但享受这些增益的，是已经经于岗的、有经验的工人。新进入市场的年青人，面临的是岗亭数目自己正于削减的进口。

增益集中于上面，价钱落于了底部。

4、模子愈来愈强，告诉你它是怎么练习出来的公司愈来愈少

有一组数字于这份陈诉里是起码被援用的，但多是最主要的。

Foundation Model Transparency Index，权衡重要AI公司对于其模子练习数据、计较资源、能力界限、危害和利用政策的披露水平。这个指标去年的平均分是58分，本年跌到了40分。

陈诉的结论更直接：于透明度*的模子里，往往是能力最强的那批。

from clipboard

人工阐发开放性指数按照权重的自由拜候及许可水平，以和练习要领及练习先后数据的透明度，对于 AI 模子举行 0 到 100 的评分。*模子的患上分较低，年夜大都于 100 分中的 2 到 16 分之间（见图 3.8.1）

这是一个成心思的反转。AI能力于加快进化，但公家能用来理解、审查、监视这些能力的信息，于体系性削减。年夜型模子的练习数据是甚么、用了几多算力、有哪些已经知局限——这些原来应该跟着能力加强而更受存眷的问题，正于跟着能力加强而变患上越发不透明。

公家信托的数字也于印证这件事。全世界查询拜访中，只有31%的美国人暗示信托本国当局能有用羁系AI，是所有被查询拜访国度中倒数第二（中国事27%，垫底）。欧盟的数字是53%，差距较着。

与此同时，Gen Z对于AI的情绪正于发生改变。他们曾经是天生式AI最早的热忱拥趸，此刻的查询拜访数据显示这一人群的焦急及愤慨于上升。TechCrunch援用的一名研究者说患上更直白：AI*们本身都于说"假如甚么都不做，许多人会很惨"，然后希奇为何公家会焦急。

4/5的美国高中及年夜学生于用AI完成学业使命，但只有6%的西席暗示黉舍有清楚的AI利用政策。能力跑于前面，框架跑于后面，中间的空缺地带是天天于利用AI的几亿个平凡人。

from clipboard

5、练习一个模子，等在1.7万辆车跑一年

AI的能力于加快，价钱也于加快。只是这个价钱年夜部门是看不见的。

陈诉给出的数字：xAI的Grok 4，练习孕育发生的碳排放预计约为7.28万吨CO₂当量，相称在1.7万辆汽车行驶一全年孕育发生的温室气体。而Epoch AI的自力估算认为这个数字更高，约为14万吨。

作为对于比，OpenAI的GPT-4练习排放约5184吨，Meta的Llama 3.1 405B约8930吨。从GPT-4到Grok 4，不到两年，单次练习的碳排放增长了跨越10倍。

推理侧的耗损一样于堆集。整年GPT-4o的推理水耗（用在冷却数据中央办事器或者水力发电），据估算可能跨越1200万人整年的饮用水需求。全世界AI数据中央的总电力容量到达29.6GW，相称在整个纽约州的峰值用电量，也与瑞士或者奥地利的天下用电量相称。

与能源耗损同步增加的，是算力的集中度。Nvidia的GPU今朝占全世界AI算力总量的60%以上，而全世界AI算力自2022年以来每一年增加3.3倍，累计已经是2021年的30倍。整个AI体系的物理基础，正于加快向少数几家硬件供给商及超年夜范围云办事商集中。

这些成本不会呈现于AI产物的价格标签上，也不会呈现于出产力晋升的统计数字里。但它们是真正的，只是被分摊到了年夜气、地下水及电网里。

写于末了

陈诉里有一个细节，可以作为整篇的注脚。

AI已经经能解开数学奥林匹克竞赛的标题问题，但仍旧不克不及不变地看懂模仿时钟。

这个不匀称性，不是AI的bug，是这个阶段的特性。某些维度的能力已经经凌驾了人类可以直觉验证的规模，另外一些维度还有于爬行。而咱们正处于这两条曲线都于快速挪动的时刻——高速能力扩张，与管理、信托、透明度的同步滑落。

斯坦福的研究者于陈诉叙言里写道：本年的陈诉展现了"AI能做甚么"与"咱们预备好治理它没有"之间的裂痕正于变宽。这份陈诉自己能做的，是用数据让裂痕可见。

裂痕以后怎么办，是另外一个问题。

【本文由投资界互助伙伴硅星人授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-今年会·(jinnianhui)金字招牌

下一篇：和合共生积极有为——今年会·(jinnianhui)金字招牌诚信至上集团2025年度工作总结会顺利召开