今年会·(jinnianhui)金字招牌-火爆全网的Harness Engineering到底是个啥

2026-05-30 13:06:40

首页财产ai正文 火爆全网的Harness Engineering究竟是个啥 2023年起AI协作方式历经三次进化,从Prompt Engineering到Context Engineering再到Harness Engineering,对于应AI脚色进级,其思维方式具普适性。 2026-04-15 13:50 ·微信公家号:数字生命卡兹克数字生命卡兹克 AI投资人解读· 文章先容了 Prompt Engineering、Context Engineering、Harness Engineering 这三个阶段,它们对于应着人类与 AI 协作方式的三次进化,表现了 AI 脚色从谈天呆板人到 AI 助手再到自立 Agent 的进级。此中,Harness Engineering 的焦点是“约束先行”,经由过程指导及检测机制,让强盛的 AI Agent 安全、高效、可控地运行。 · 行业竞争加重可能致使对于 AI 运用的优化需求增长技能更新换代快,Harness Engineering 的理念及要领可能很快过时。 总结:Harness Engineering 为 AI 运用提供了更体系的约束及治理方式,具备较年夜潜力。但需存眷行业竞争及技能更新危害,建议连续跟踪相干进展,联合现实运用场景评估其价值。内容由AI天生,仅供参考

近来这个词其实是太火了。

Harness Engineering。

我刷推刷到,伴侣圈刷到,群里也于聊,微信指数又稀里糊涂一根穿云箭了。

险些每一隔两三天就有人来问我,卡兹克你能不克不及讲讲这个Harness究竟是甚么。

以是想了想,我还有是尽我可能,花了快要一成天的时间,给各人写一下我理解的Harness Engineering究竟是个啥。

各人实在不要感觉AI行业喜欢造观点或者者喜欢弄抽象,重要还有是AI这玩意其实变患上太快了,许多工具也都是跟着时间及行业的成长不停的进步的。

一个工具于24年可能还有满意其时的语境,可是25年可能就不敷了,由于模子的前进速率太快了,在是25年各人只能用一个新的词来注释,成果,26年,这个词又不敷用了。

这个年夜概就是如今的近况。

跟AI跟的比力久的伴侣,可能已经经能猜到我上面说的是哪几个词了。

Prompt Engineering,Context Engineering。

还有有今天的Harness Engineering。

这三个词,险些*地标志了咱们跟AI协作方式的三次进化。

而我刚好,这三个阶段都切身履历过。

从2023年各人都于研究怎么写一个好Prompt,到2025年最先研究怎么给AI更好的塞上下文,到此刻2026年,各人最先聊,怎么给AI设置马具。

三年。

说短不短,说长也不长。

但转头看,这三次变化,实在都映照的,是咱们人类对于AI的认知。

打个游戏玩家都能秒懂的例子吧。

*阶段,就是你于玩《只狼》这类动作游戏。

也就是每一一招格挡、每一一次见切都患上你手搓,按一下键它出一招。

一招没按对于,屏幕上就会呈现巨年夜的死。你就是AI*的操作者,AI每个动作都患上你亲自按键下令,动一下回一下,也就是咱们传统的ChatBot。

第二阶段,就是你于玩近似《金铲铲之战》这类自走棋。

你实在可以不消再本身手搓每个动作了,你的活实在全于前期配置。

选英雄、凑拘束、配设备、排站位。

配完了,棋子就本身上场打回合,你只能吃瓜看戏。而决议胜败的,端赖你前期把信息及资源喂患上对于不合错误。

这一个阶段,就是模子能力还有不敷强的时辰的前Agent时代。

第三阶段,就近似是你于玩《周全战役》这类即时战略游戏。

场上几千个单元本身于跑,你底子摇不外来每个兵,只能靠编队、阵型、AI指令、疆场法则去驾御整盘战局。

单元越智慧、越自立,你越患上靠一整套体系去约束它们的举动。

从操作一个脚色,到带一个小队,再到批示一整支军 队。

玩家的节制粒度愈来愈粗,AI的自立度愈来愈高,你需要的约束方式也愈来愈体系。

而这三个阶段,我感觉就对于应了Prompt Engineering、Context Engineering、Harness Engineering的三次跃迁。

以是,聊Harness Engineer究竟是甚么,我感觉最主要的,就是你要知道这一起的跃迁毕竟是甚么样的。

想理解此刻,*的方式,就是读懂汗青。

以是,今天这篇文章,我就但愿能真的让你大白Harness Engineering究竟是个啥,它的前因后果,以和他能解决的问题。

假如你是技能年夜佬,但愿能给你提供一些新的思索角度,假如你长短技能的小白用户,我也会只管即便让你看患上大白。

话未几说,咱们最先。

先重新捋。

先把时间倒回到2023年。

2022年末到2023年,ChatGPT横空出生避世,整个世界炸了。

我还有记患上23年的春节,春节回来以后,所有人都于聊ChatGPT,而那以后,那段时间最火的一个词。

就是Prompt Engineer,提醒词工程师。

其时硅谷可以给Prompt Engineer开出了年薪30万$的offer。

然后海内也是,23年的图,各人必定都见过。

然后其时有没有数的Prompt框架呈现,由于彼时模子智能程度不敷,以是许多时辰,模子的输出不不变,我那时辰还有于做AI产物,这里可以提一嘴,海内金融范畴的*个算法存案是我拿的

咱们天天做的至多的事,实在就是于Prompt上做约束,怎么设计好Prompt,能让模子输出更不变的json格局,从而跟我的数据库举行交互。

固然,也有另外一部门,就是写好Prompt约束,让模子天生更好更不变的回覆。

阿谁年月,统一个问题,你换一种问法,AI给你的谜底质量就可能会天差地别。

好比你直接问ChatGPT“帮我写一篇关在AI的文章”,它给你吐出来的工具年夜几率是一坨准确的空话。

但你假如说“你是一个科技范畴的资深记者,气势派头偏白话化,擅长用类比来注释繁杂观点,此刻需要写一篇3000字的文章,主题是AI对于平凡人糊口的影响,要有详细案例,语气不要太正式”,那出来的工具就彻底纷歧样了。

以是你看,Prompt Engineering阿谁年月,做的至多的事就是怎么设计Prompt,能让AI给你*的回覆。

这事儿于2023年确凿是有价值的,由于那时辰年夜模子刚出来,输出也确凿不不变,各人都还有于探索跟它交流的方式。

谁能把问题问患上更好,谁把Prompt约束的更好,就能从AI那里榨出更多价值,这个技术差异是真实存于的。

但问题来了。

2024年下半年最先,一个趋向愈来愈较着,就是模子愈来愈智慧了。

你不消再像侍候年夜爷同样去精心组织Prompt了,Claude 3.5 Sonnet出来的时辰,你随意跟它说句话,它都能理解你的意思,阿谁时辰我记患上我还有写了李继刚的汉语新解,也算是一代风潮。

阿谁时代,Prompt技巧的边际收益于急速降落。

由于人们发明,当模子充足智慧的时辰,你怎么问已经经没那末主要了。

主要的是,你问的时辰,它手里有无关在你问题的充足且适合体量的信息,于有限的机能之下,来给你一个好谜底。

以是我厥后甚至都发了一篇文章,我感觉那些Prompt技巧真的没啥用,焦点的是6个心法:分享6个日常平凡我最经常使用的Prompt心法。

至此,这就引出了第二个阶段。

2025年年中,Andrej Karpathy转发了一条推,年夜概意思是说,附和把Context Engineering放于Prompt Engineering之上。

由于于现实的工业级AI运用里,真实的活不是于那雕花一个Prompt,是需要更多的思量工程化,要精心设计AI的上下文窗口里到底该塞甚么信息。

由于阿谁年月,上下文窗口真的过小了。

Karpathy的原话是,Context Engineering是“填充上下文窗口的精妙艺术与科学”。

在是,Context Engineering,上下文工程,这个观点于2025年下半年迅速成了所有做AI运用的人的共鸣。

由于他确凿切中了其时行业人们的痛点。

于这里我还有是想再次表达一下,许多时辰,造词这事分两种环境,有一种我感觉就是为了炒观点,好比xxx 4.0,而有的时辰,真的只是行业太快,人们更需要一个精准的表达。

词语,从来都是为表达而办事的。

Context Engineering解决的问题,就近似在你让AI帮你改一段代码,假如你只给它这段代码自己,它可能改患上参差不齐。

但若你同时给它这段代码地点的文件、相干的依靠、项目的技能栈申明、团队的代码规范,它改出来的工具质量会高几个量级。

而怎样优雅的、省Token的给出最精准的信息,就是真实的Context Engineering。

这里我依然感觉,让我学到的至多,还有是Manus的25年7月18号发的那篇文章。

到这里,实在已经经比Prompt Engineering进了一年夜步了。

人们最先研究的是,从怎么约束单个Prompt,酿成了怎样于有限的上下文空间里,尽可能的给模子精准的信息。

就如许,过了又快要8个月的时间。

Harness Engineering正式登上了属在它的舞台。

假如是我本身印象中,*次于AI范畴看到关在Harness的描写,应该是去年11月Anthropic发的blog。

这篇陈诉解决的焦点问题是,就是怎样让Agent超过多个上下文窗口有用事情而不丢掉状况。

他们把他们的Claude Agent SDK称为,"一个强盛的通用Agent Harness"。

不外他们并无用Harness Engineering如许的描写。

直到2026年2月,OpenAI的一篇Blog,把Harness Engineering写于了巨年夜的标题上,在是,Harness最先正式进入公共视线。

这篇也是有价值内容极多的一篇文章。

年夜概说的就是,OpenAI内部有一个团队,用了五个月的时间,用Codex搭了一个快要一百万行代码的产物。

此中人类手写的代码量,是0行。

所有代码都是Codex Agent天生的,人类工程师全程没有写一行代码。

人类工程师做的事情,就是一直于做Harness Engineering。

他们于设计架构界限,制订依靠法则,写主动化测试,配置lint法则,搭建CI/CD流水线,设计反馈轮回机制。

他们于建一个笼子,一个让AI Agent能于内里安全、高效、可控地干活的笼子。

这个笼子,就叫Harness。

Harness这个词,来历在马具,就是马鞍、缰绳、嚼子那一整套工具。

马是一种很是强盛的动物,速率快、气力年夜,但若你不给它套上缰绳,它年夜几率会跑偏,甚至把你甩下来。

Harness的作用,就是把这股野蛮的气力,指导到你需要的标的目的上。

AI Agent就是那匹马。

模子此刻自己的能力已经经极为强盛了,它能写代码、能做阐发、能跟外部东西交互、能自立决议计划。

但若你不给它套上Harness,它就会跑偏,会犯错,会于你不知道之处弄出幺蛾子。

以是,Agent = Model + Harness。

这个公式是LangChain于博客上提出来的,我感觉这多是2026年到今朝为止,关在AI工程最精炼的一句话。

虽然Birgitta Böckeler说这个界说很泛,可是我感觉还有是很形象的。

模子是马,Harness是缰绳,光有马不行,你还有患上有一整套驾御它的体系。

昨天我发的文章,实在一直于夸大一个理念,叫约束先行。

实在这就是Harness Engineering中很主要的一环。

而一个真实的Harness到底长啥样呢,Birgitta我感觉写的框架我感觉还有是比力清楚的。

她分成为了两类节制机制。

*类叫Guides(feedforward controls) ,指导。

就是于AI步履以前,提早给它设好法则,让它沿着准确的标的目的走。

这有点像高速公路上的护栏,你不需要每一一秒都去改正司机别开到山沟沟里,由于只要护栏于那里,车就险些不会开到山沟沟内里去。

CLAUDE.md文件就是一种Guide,代码规范文档也是,架构决议计划记载也是,这些工具于AI动手以前就已经经于那了,它们是前馈节制。

第二类叫Sensors (feedback controls) ,检测器。

就是于AI做完事以后,用各类手腕去检测它做的对于不合错误。

主动化测试是Sensor,代码lint是Sensor,CI流水线也是Sensor,它们是反馈节制。

好的Harness,是Guides及Sensors的组合,前者防患在未然,后者亡羊补牢,两个加于一路,形成一个闭环。

而每一当你发明Agent犯了一个过错,你就花时间去设计一个方案,让它永远不成能再犯一样的过错。

这就是Harness Engineer的一样平常。

从来都不只是于写代码,最主要的事情,实在都是于设计一个让Agent怎样再也不放错的体系。

就像我昨天那篇文章内里聊患上,就是Claude Code的法则系统怎么从全局CLAUDE.md一层一层穿透到项目级、再到文件夹级的事,约束从上往下走,一层管着一层。

这个实在虽然很是的简朴,可是底层逻辑,实在跟OpenAI于阿谁百万行代码项目里做的事是如出一辙的。

他们强迫界说了一套分层架构,Types → Config → Repo → Service → Runtime → UI,六层,每一一层只能依靠它下面的层,不克不及反向依靠。

有了约束,速率才不会降落,架构才不会漂移。

法则从来不是靠口头商定,是靠主动化测试来强迫履行的。

假如你非要我给Harness Engineering定一个最焦点的观点。

那我还有是想用我昨天说的那4个字。

约束先行。

就像咱们所设计的权限体系,你可以给AI Agent设置差别级另外权限,有些操作它可以本身做,有些操作它必需先问你,有些操作它*不克不及碰。

好比读文件可以它本身来,删文件必需先问,而像格局化硬盘这类操作,你永远想都别想。

以是你实在回过甚来看,这三个阶段的蜕变颇有意思。

Prompt Engineering的时代,AI是一个谈天呆板人。

你跟它的交互方式是一轮对于话,你说一句,它回一句。

于这个模式下,你*能影响输出的杠杆,就是你的Prompt,以是各人冒死研究怎么写Prompt。

Context Engineering的时代,AI酿成了一个助手。

它再也不只是回覆问题,它最先帮你干事了,它要读你的文档,理解你的项目,挪用你的东西,于这个模式下,光靠Prompt不敷了,你还有需要给它提供足够的上下文。

Harness Engineering的时代,AI酿成了一个自立步履的Agent。

它不是于等你的指令,它可以本身于那跑,它本身写代码,本身测试,本身提交,本身部署。

于这个模式下,Context也不敷了,由于Agent是自立运行的,你无法一直盯着它。

你需要一个体系来约束它、监控它、于它犯错的时辰主动改正它。

以是这三个阶段的蜕变,对于应的实在是AI脚色的三次进级。

谈天呆板人 → AI助手 → 自立Agent。

而你,跟它的瓜葛也变了。

实在我上个月也写过一篇漫笔,叫能用剧本就别用Agent,讲的就是剧本→Skill→Agent这个金字塔。

这个思绪实在也跟Harness Engineering的理念差未几,能用确定性法则约束之处就用法则,能用主动化检测之处就用检测,只有那些真正需要判定力的部门,才留给Agent自由阐扬。

你不会用年夜炮打蚊子,一样的原理,你也不应于可以用确定性法则解决之处引入不确定性。

以是啊,实在3个时代的Engineering,从来都不是甚么替换瓜葛,而是一层一层升维、跟着时代进步的嵌套瓜葛。

Harness Engineer需要懂Context Engineering,由于给AI提供准确的上下文信息自己就是Harness的一部门。

Context Engineer也需要懂Prompt Engineering,由于终极跟AI沟通的单位还有是一条条的Prompt。

每一一层都没有过时,只是被更年夜的框架包裹住了。

那我知道,看到末了,你可能会问了,我又不是步伐员,Harness Engineering跟我有甚么瓜葛?

这是个好问题,我也知道许多看我文章的伴侣不是技能配景。

我本身更不是步伐员身世,我是用户体验设计师。

坦率的讲,Harness Engineer这个脚色,今朝确凿重要呈现于软件开发范畴,由于现如今,AI Agent今朝最成熟的落地场景,那就是写代码、开发产物。

但我感觉,Harness Engineering的思维方式,实在是普适的。

好比许多伴侣此刻用AI做任何轻微繁杂一点的工作,可能城市碰到这类问题,好比AI有时辰稀里糊涂就跑偏了,你患上重复改正它。

这就是缺乏Harness。

好比你能不克不及给AI设一些法则,让它于这些法则的框架内干活?好比你让AI帮你写邮件,你能不克不及事前告诉它,「永远不要用感叹号末端」「收件人是老板的时辰语气要正式」「触及数字的时辰要double check」。这就是你的Harness。

好比你能不克不及设计一些查抄点,于AI输出以后主动验证?好比你让AI帮你做数据阐发,能不克不及设一个法则让它每一次算完都本身验算一遍?这也是Harness。

20世纪的伟年夜科学成绩之一,节制论,内里最焦点的一个思惟,就是任何繁杂体系的不变运行,都依靠在反馈机制。

恒温器之以是能连结房间温度恒定,从来都不是由于它知道应该是几多度,是由于它有一个传感器能感知当前温度,然后跟方针温度做比力,然后不停的举行调解。

这些思维方式,就是Harness Engineering的内核,从来不是说,让你直接做技能去写代码,是需要你思索清晰,怎么让AI于我不盯着的时辰也能干好活,是怎样设计一个体系,能让你不消盯着的时辰,这个体系也能本身运行起来。

实在咱们驯服AI的历程,真的跟人类驯服年夜天然的汗青,也有着极高的相似度。

最早人类学会用火,你患上不寒而栗地喂它柴火,火过小不行,太年夜也不行。这是Prompt Engineering,你的每一一次输入都直接决议输出。

厥后人类学会了建炉子,你把火关于一个布局里,经由过程调治进气口及烟囱来节制火势。这是Context Engineering,你经由过程设计上下文来影响火的举动。

再厥后人类发现了蒸汽机,火再也不是你直接操控的对于象了,它于一个周详的体系里主动运行,有汽锅、有气缸、有调治阀、有安全阀,你无需再管火怎么烧,你管的是这套体系怎么设计。这是Harness Engineering。

从火焰到蒸汽机,人类花了几千年。

从Prompt Engineering到Harness Engineering,AI只花了三年。

甚至我感觉,怎样利用AI蜕变到末了,实在就是人类汗青上呈现的那一门一门的古老的学科。

Harness就是节制论。

Skill实在就是分类学。

Prompt实在就是语言学。

Context实在就是信息科学。

Reasoning实在就是认贴心理学。

多Agent协同实在就是治理学。

以是,许多人每天说甚么文科已经死,我每一次城市说这是放屁,从来没有甚么文科已经死理科已经死的。

这世界就不该该再分文理。

两头交融,才是真实的王道。

多学科交融配景,有理工科的严谨,有文科的审美。

有布局化的理性,也有人文的洞察。

如许的人,于将来十年里,我才感觉会是整个社会里,能把AI、Agent用的最牛逼,同时也是将来最稀缺的那批人。

以是,底子不要焦急。

Harness Engineering底子不是甚么新词。

它就是人类几千年来一直于做的那一件老事。

就是怎么把一股更快、更强、更不受控的气力,安全地、连续地、可复制地,指导到咱们想要的标的目的上去。

火是如许,蒸汽是如许,电是如许,核能也是如许。

从咱们学会用火最先,那几十万年的汗青。

从来都是如许。

只不外,这一次,轮到AI了。

仅此罢了。

当一个工具比你更快、比你更强、比你更自立的时辰,你怎么还有能让它,为你所用。

这件事,你的先人做过,你的父辈做过。

只是此刻。

轮到你了。

【本文由投资界互助伙伴微信公家号:数字生命卡兹克授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-今年会·(jinnianhui)金字招牌

下载360浏览器