今年会·(jinnianhui)金字招牌-火爆全网的Harness Engineering到底是个啥

2026-05-30 13:06:40

首页财产ai正文火爆全网的Harness Engineering究竟是个啥 2023年起AI协作方式历经三次进化，从Prompt Engineering到Context Engineering再到Harness Engineering，对于应AI脚色进级，其思维方式具普适性。 2026-04-15 13:50 ·微信公家号：数字生命卡兹克数字生命卡兹克 AI投资人解读· 文章先容了 Prompt Engineering、Context Engineering、Harness Engineering 这三个阶段，它们对于应着人类与 AI 协作方式的三次进化，表现了 AI 脚色从谈天呆板人到 AI 助手再到自立 Agent 的进级。此中，Harness Engineering 的焦点是“约束先行”，经由过程指导及检测机制，让强盛的 AI Agent 安全、高效、可控地运行。 · 行业竞争加重可能致使对于 AI 运用的优化需求增长技能更新换代快，Harness Engineering 的理念及要领可能很快过时。总结：Harness Engineering 为 AI 运用提供了更体系的约束及治理方式，具备较年夜潜力。但需存眷行业竞争及技能更新危害，建议连续跟踪相干进展，联合现实运用场景评估其价值。内容由AI天生，仅供参考

近来这个词其实是太火了。

Harness Engineering。

我刷推刷到，伴侣圈刷到，群里也于聊，微信指数又稀里糊涂一根穿云箭了。

险些每一隔两三天就有人来问我，卡兹克你能不克不及讲讲这个Harness究竟是甚么。

以是想了想，我还有是尽我可能，花了快要一成天的时间，给各人写一下我理解的Harness Engineering究竟是个啥。

各人实在不要感觉AI行业喜欢造观点或者者喜欢弄抽象，重要还有是AI这玩意其实变患上太快了，许多工具也都是跟着时间及行业的成长不停的进步的。

一个工具于24年可能还有满意其时的语境，可是25年可能就不敷了，由于模子的前进速率太快了，在是25年各人只能用一个新的词来注释，成果，26年，这个词又不敷用了。

这个年夜概就是如今的近况。

跟AI跟的比力久的伴侣，可能已经经能猜到我上面说的是哪几个词了。

Prompt Engineering，Context Engineering。

还有有今天的Harness Engineering。

这三个词，险些*地标志了咱们跟AI协作方式的三次进化。

而我刚好，这三个阶段都切身履历过。

从2023年各人都于研究怎么写一个好Prompt，到2025年最先研究怎么给AI更好的塞上下文，到此刻2026年，各人最先聊，怎么给AI设置马具。

三年。

说短不短，说长也不长。

但转头看，这三次变化，实在都映照的，是咱们人类对于AI的认知。

打个游戏玩家都能秒懂的例子吧。

*阶段，就是你于玩《只狼》这类动作游戏。

也就是每一一招格挡、每一一次见切都患上你手搓，按一下键它出一招。

一招没按对于，屏幕上就会呈现巨年夜的死。你就是AI*的操作者，AI每个动作都患上你亲自按键下令，动一下回一下，也就是咱们传统的ChatBot。

第二阶段，就是你于玩近似《金铲铲之战》这类自走棋。

你实在可以不消再本身手搓每个动作了，你的活实在全于前期配置。

选英雄、凑拘束、配设备、排站位。

配完了，棋子就本身上场打回合，你只能吃瓜看戏。而决议胜败的，端赖你前期把信息及资源喂患上对于不合错误。

这一个阶段，就是模子能力还有不敷强的时辰的前Agent时代。

第三阶段，就近似是你于玩《周全战役》这类即时战略游戏。

场上几千个单元本身于跑，你底子摇不外来每个兵，只能靠编队、阵型、AI指令、疆场法则去驾御整盘战局。

单元越智慧、越自立，你越患上靠一整套体系去约束它们的举动。

从操作一个脚色，到带一个小队，再到批示一整支军队。

玩家的节制粒度愈来愈粗，AI的自立度愈来愈高，你需要的约束方式也愈来愈体系。

而这三个阶段，我感觉就对于应了Prompt Engineering、Context Engineering、Harness Engineering的三次跃迁。

以是，聊Harness Engineer究竟是甚么，我感觉最主要的，就是你要知道这一起的跃迁毕竟是甚么样的。

想理解此刻，*的方式，就是读懂汗青。

以是，今天这篇文章，我就但愿能真的让你大白Harness Engineering究竟是个啥，它的前因后果，以和他能解决的问题。

假如你是技能年夜佬，但愿能给你提供一些新的思索角度，假如你长短技能的小白用户，我也会只管即便让你看患上大白。

话未几说，咱们最先。

先重新捋。

先把时间倒回到2023年。

2022年末到2023年，ChatGPT横空出生避世，整个世界炸了。

我还有记患上23年的春节，春节回来以后，所有人都于聊ChatGPT，而那以后，那段时间最火的一个词。

就是Prompt Engineer，提醒词工程师。

其时硅谷可以给Prompt Engineer开出了年薪30万$的offer。

然后海内也是，23年的图，各人必定都见过。

然后其时有没有数的Prompt框架呈现，由于彼时模子智能程度不敷，以是许多时辰，模子的输出不不变，我那时辰还有于做AI产物，这里可以提一嘴，海内金融范畴的*个算法存案是我拿的

咱们天天做的至多的事，实在就是于Prompt上做约束，怎么设计好Prompt，能让模子输出更不变的json格局，从而跟我的数据库举行交互。

固然，也有另外一部门，就是写好Prompt约束，让模子天生更好更不变的回覆。

阿谁年月，统一个问题，你换一种问法，AI给你的谜底质量就可能会天差地别。

好比你直接问ChatGPT“帮我写一篇关在AI的文章”，它给你吐出来的工具年夜几率是一坨准确的空话。

但你假如说“你是一个科技范畴的资深记者，气势派头偏白话化，擅长用类比来注释繁杂观点，此刻需要写一篇3000字的文章，主题是AI对于平凡人糊口的影响，要有详细案例，语气不要太正式”，那出来的工具就彻底纷歧样了。

以是你看，Prompt Engineering阿谁年月，做的至多的事就是怎么设计Prompt，能让AI给你*的回覆。

这事儿于2023年确凿是有价值的，由于那时辰年夜模子刚出来，输出也确凿不不变，各人都还有于探索跟它交流的方式。

谁能把问题问患上更好，谁把Prompt约束的更好，就能从AI那里榨出更多价值，这个技术差异是真实存于的。

但问题来了。

2024年下半年最先，一个趋向愈来愈较着，就是模子愈来愈智慧了。

你不消再像侍候年夜爷同样去精心组织Prompt了，Claude 3.5 Sonnet出来的时辰，你随意跟它说句话，它都能理解你的意思，阿谁时辰我记患上我还有写了李继刚的汉语新解，也算是一代风潮。

阿谁时代，Prompt技巧的边际收益于急速降落。

由于人们发明，当模子充足智慧的时辰，你怎么问已经经没那末主要了。

主要的是，你问的时辰，它手里有无关在你问题的充足且适合体量的信息，于有限的机能之下，来给你一个好谜底。

以是我厥后甚至都发了一篇文章，我感觉那些Prompt技巧真的没啥用，焦点的是6个心法：分享6个日常平凡我最经常使用的Prompt心法。

至此，这就引出了第二个阶段。

2025年年中，Andrej Karpathy转发了一条推，年夜概意思是说，附和把Context Engineering放于Prompt Engineering之上。

由于于现实的工业级AI运用里，真实的活不是于那雕花一个Prompt，是需要更多的思量工程化，要精心设计AI的上下文窗口里到底该塞甚么信息。

由于阿谁年月，上下文窗口真的过小了。

Karpathy的原话是，Context Engineering是“填充上下文窗口的精妙艺术与科学”。

在是，Context Engineering，上下文工程，这个观点于2025年下半年迅速成了所有做AI运用的人的共鸣。

由于他确凿切中了其时行业人们的痛点。

于这里我还有是想再次表达一下，许多时辰，造词这事分两种环境，有一种我感觉就是为了炒观点，好比xxx 4.0，而有的时辰，真的只是行业太快，人们更需要一个精准的表达。

词语，从来都是为表达而办事的。

Context Engineering解决的问题，就近似在你让AI帮你改一段代码，假如你只给它这段代码自己，它可能改患上参差不齐。

但若你同时给它这段代码地点的文件、相干的依靠、项目的技能栈申明、团队的代码规范，它改出来的工具质量会高几个量级。

而怎样优雅的、省Token的给出最精准的信息，就是真实的Context Engineering。

这里我依然感觉，让我学到的至多，还有是Manus的25年7月18号发的那篇文章。

到这里，实在已经经比Prompt Engineering进了一年夜步了。

人们最先研究的是，从怎么约束单个Prompt，酿成了怎样于有限的上下文空间里，尽可能的给模子精准的信息。

就如许，过了又快要8个月的时间。

Harness Engineering正式登上了属在它的舞台。

假如是我本身印象中，*次于AI范畴看到关在Harness的描写，应该是去年11月Anthropic发的blog。

这篇陈诉解决的焦点问题是，就是怎样让Agent超过多个上下文窗口有用事情而不丢掉状况。

他们把他们的Claude Agent SDK称为，"一个强盛的通用Agent Harness"。

不外他们并无用Harness Engineering如许的描写。

直到2026年2月，OpenAI的一篇Blog，把Harness Engineering写于了巨年夜的标题上，在是，Harness最先正式进入公共视线。

这篇也是有价值内容极多的一篇文章。

年夜概说的就是，OpenAI内部有一个团队，用了五个月的时间，用Codex搭了一个快要一百万行代码的产物。

此中人类手写的代码量，是0行。

所有代码都是Codex Agent天生的，人类工程师全程没有写一行代码。

人类工程师做的事情，就是一直于做Harness Engineering。

他们于设计架构界限，制订依靠法则，写主动化测试，配置lint法则，搭建CI/CD流水线，设计反馈轮回机制。

他们于建一个笼子，一个让AI Agent能于内里安全、高效、可控地干活的笼子。

这个笼子，就叫Harness。

Harness这个词，来历在马具，就是马鞍、缰绳、嚼子那一整套工具。

马是一种很是强盛的动物，速率快、气力年夜，但若你不给它套上缰绳，它年夜几率会跑偏，甚至把你甩下来。

Harness的作用，就是把这股野蛮的气力，指导到你需要的标的目的上。

AI Agent就是那匹马。

模子此刻自己的能力已经经极为强盛了，它能写代码、能做阐发、能跟外部东西交互、能自立决议计划。

但若你不给它套上Harness，它就会跑偏，会犯错，会于你不知道之处弄出幺蛾子。

以是，Agent = Model + Harness。

这个公式是LangChain于博客上提出来的，我感觉这多是2026年到今朝为止，关在AI工程最精炼的一句话。

虽然Birgitta Böckeler说这个界说很泛，可是我感觉还有是很形象的。

模子是马，Harness是缰绳，光有马不行，你还有患上有一整套驾御它的体系。

昨天我发的文章，实在一直于夸大一个理念，叫约束先行。

实在这就是Harness Engineering中很主要的一环。

而一个真实的Harness到底长啥样呢，Birgitta我感觉写的框架我感觉还有是比力清楚的。

她分成为了两类节制机制。

*类叫Guides(feedforward controls) ，指导。

就是于AI步履以前，提早给它设好法则，让它沿着准确的标的目的走。

这有点像高速公路上的护栏，你不需要每一一秒都去改正司机别开到山沟沟里，由于只要护栏于那里，车就险些不会开到山沟沟内里去。

CLAUDE.md文件就是一种Guide，代码规范文档也是，架构决议计划记载也是，这些工具于AI动手以前就已经经于那了，它们是前馈节制。

第二类叫Sensors (feedback controls) ，检测器。

就是于AI做完事以后，用各类手腕去检测它做的对于不合错误。

主动化测试是Sensor，代码lint是Sensor，CI流水线也是Sensor，它们是反馈节制。

好的Harness，是Guides及Sensors的组合，前者防患在未然，后者亡羊补牢，两个加于一路，形成一个闭环。

而每一当你发明Agent犯了一个过错，你就花时间去设计一个方案，让它永远不成能再犯一样的过错。

这就是Harness Engineer的一样平常。

从来都不只是于写代码，最主要的事情，实在都是于设计一个让Agent怎样再也不放错的体系。

就像我昨天那篇文章内里聊患上，就是Claude Code的法则系统怎么从全局CLAUDE.md一层一层穿透到项目级、再到文件夹级的事，约束从上往下走，一层管着一层。

这个实在虽然很是的简朴，可是底层逻辑，实在跟OpenAI于阿谁百万行代码项目里做的事是如出一辙的。

他们强迫界说了一套分层架构，Types → Config → Repo → Service → Runtime → UI，六层，每一一层只能依靠它下面的层，不克不及反向依靠。

有了约束，速率才不会降落，架构才不会漂移。

法则从来不是靠口头商定，是靠主动化测试来强迫履行的。

假如你非要我给Harness Engineering定一个最焦点的观点。

那我还有是想用我昨天说的那4个字。

约束先行。

就像咱们所设计的权限体系，你可以给AI Agent设置差别级另外权限，有些操作它可以本身做，有些操作它必需先问你，有些操作它*不克不及碰。

好比读文件可以它本身来，删文件必需先问，而像格局化硬盘这类操作，你永远想都别想。

以是你实在回过甚来看，这三个阶段的蜕变颇有意思。

Prompt Engineering的时代，AI是一个谈天呆板人。

你跟它的交互方式是一轮对于话，你说一句，它回一句。

于这个模式下，你*能影响输出的杠杆，就是你的Prompt，以是各人冒死研究怎么写Prompt。

Context Engineering的时代，AI酿成了一个助手。

它再也不只是回覆问题，它最先帮你干事了，它要读你的文档，理解你的项目，挪用你的东西，于这个模式下，光靠Prompt不敷了，你还有需要给它提供足够的上下文。

Harness Engineering的时代，AI酿成了一个自立步履的Agent。

它不是于等你的指令，它可以本身于那跑，它本身写代码，本身测试，本身提交，本身部署。

于这个模式下，Context也不敷了，由于Agent是自立运行的，你无法一直盯着它。

你需要一个体系来约束它、监控它、于它犯错的时辰主动改正它。

以是这三个阶段的蜕变，对于应的实在是AI脚色的三次进级。

谈天呆板人 → AI助手 → 自立Agent。

而你，跟它的瓜葛也变了。

实在我上个月也写过一篇漫笔，叫能用剧本就别用Agent，讲的就是剧本→Skill→Agent这个金字塔。

这个思绪实在也跟Harness Engineering的理念差未几，能用确定性法则约束之处就用法则，能用主动化检测之处就用检测，只有那些真正需要判定力的部门，才留给Agent自由阐扬。

你不会用年夜炮打蚊子，一样的原理，你也不应于可以用确定性法则解决之处引入不确定性。

以是啊，实在3个时代的Engineering，从来都不是甚么替换瓜葛，而是一层一层升维、跟着时代进步的嵌套瓜葛。

Harness Engineer需要懂Context Engineering，由于给AI提供准确的上下文信息自己就是Harness的一部门。

Context Engineer也需要懂Prompt Engineering，由于终极跟AI沟通的单位还有是一条条的Prompt。

每一一层都没有过时，只是被更年夜的框架包裹住了。

那我知道，看到末了，你可能会问了，我又不是步伐员，Harness Engineering跟我有甚么瓜葛？

这是个好问题，我也知道许多看我文章的伴侣不是技能配景。

我本身更不是步伐员身世，我是用户体验设计师。

坦率的讲，Harness Engineer这个脚色，今朝确凿重要呈现于软件开发范畴，由于现如今，AI Agent今朝最成熟的落地场景，那就是写代码、开发产物。

但我感觉，Harness Engineering的思维方式，实在是普适的。

好比许多伴侣此刻用AI做任何轻微繁杂一点的工作，可能城市碰到这类问题，好比AI有时辰稀里糊涂就跑偏了，你患上重复改正它。

这就是缺乏Harness。

好比你能不克不及给AI设一些法则，让它于这些法则的框架内干活？好比你让AI帮你写邮件，你能不克不及事前告诉它，「永远不要用感叹号末端」「收件人是老板的时辰语气要正式」「触及数字的时辰要double check」。这就是你的Harness。

好比你能不克不及设计一些查抄点，于AI输出以后主动验证？好比你让AI帮你做数据阐发，能不克不及设一个法则让它每一次算完都本身验算一遍？这也是Harness。

20世纪的伟年夜科学成绩之一，节制论，内里最焦点的一个思惟，就是任何繁杂体系的不变运行，都依靠在反馈机制。

恒温器之以是能连结房间温度恒定，从来都不是由于它知道应该是几多度，是由于它有一个传感器能感知当前温度，然后跟方针温度做比力，然后不停的举行调解。

这些思维方式，就是Harness Engineering的内核，从来不是说，让你直接做技能去写代码，是需要你思索清晰，怎么让AI于我不盯着的时辰也能干好活，是怎样设计一个体系，能让你不消盯着的时辰，这个体系也能本身运行起来。

实在咱们驯服AI的历程，真的跟人类驯服年夜天然的汗青，也有着极高的相似度。

最早人类学会用火，你患上不寒而栗地喂它柴火，火过小不行，太年夜也不行。这是Prompt Engineering，你的每一一次输入都直接决议输出。

厥后人类学会了建炉子，你把火关于一个布局里，经由过程调治进气口及烟囱来节制火势。这是Context Engineering，你经由过程设计上下文来影响火的举动。

再厥后人类发现了蒸汽机，火再也不是你直接操控的对于象了，它于一个周详的体系里主动运行，有汽锅、有气缸、有调治阀、有安全阀，你无需再管火怎么烧，你管的是这套体系怎么设计。这是Harness Engineering。

从火焰到蒸汽机，人类花了几千年。

从Prompt Engineering到Harness Engineering，AI只花了三年。

甚至我感觉，怎样利用AI蜕变到末了，实在就是人类汗青上呈现的那一门一门的古老的学科。

Harness就是节制论。

Skill实在就是分类学。

Prompt实在就是语言学。

Context实在就是信息科学。

Reasoning实在就是认贴心理学。

多Agent协同实在就是治理学。

以是，许多人每天说甚么文科已经死，我每一次城市说这是放屁，从来没有甚么文科已经死理科已经死的。

这世界就不该该再分文理。

两头交融，才是真实的王道。

多学科交融配景，有理工科的严谨，有文科的审美。

有布局化的理性，也有人文的洞察。

如许的人，于将来十年里，我才感觉会是整个社会里，能把AI、Agent用的最牛逼，同时也是将来最稀缺的那批人。

以是，底子不要焦急。

Harness Engineering底子不是甚么新词。

它就是人类几千年来一直于做的那一件老事。

就是怎么把一股更快、更强、更不受控的气力，安全地、连续地、可复制地，指导到咱们想要的标的目的上去。

火是如许，蒸汽是如许，电是如许，核能也是如许。

从咱们学会用火最先，那几十万年的汗青。

从来都是如许。

只不外，这一次，轮到AI了。

仅此罢了。

当一个工具比你更快、比你更强、比你更自立的时辰，你怎么还有能让它，为你所用。

这件事，你的先人做过，你的父辈做过。

只是此刻。

轮到你了。

【本文由投资界互助伙伴微信公家号：数字生命卡兹克授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-今年会·(jinnianhui)金字招牌

下一篇：和合共生积极有为——今年会·(jinnianhui)金字招牌诚信至上集团2025年度工作总结会顺利召开