菜单
首页财产ai正文 OpenAI让人对于所有截图的信托归零了 GPT Images 2于文字衬着、UI模仿等方面体现精彩,能力界限较着,能晋升效率,但也带来安全危害,人们对于图片信托度降低,AI检测技能待完美。 2026-04-24 10:31 ·微信公家号:知危知危编纂部 AI投资人解读· GPT Images 2于文字衬着、UI模仿、邃密节制、强推理等方面体现精彩,文字衬着上限约2500字,能复刻繁杂UI界面,强推理能力有年夜幅晋升。· 模子能力界限较着,于一些场景中存于不足图片真实性难辨,可能激发信托危机,当前AI检测技能尚不完美。总结:GPT Images 2天生能力晋升显著,于告白、UI设计等范畴有运用潜力,但需存眷其能力界限与安全危害,进一步评估其对于各行业的详细影响。内容由AI天生,仅供参考
于 AI 巨头焦灼对于战的此刻,谁也想不到,还有有能靠榜单数据,拉出一个代差的文生图模子。
没错,说的就是GPT Images 2。
测试样例信赖各人应该都看的差未几了,基本都能总结出它比拟上一代幸亏哪。
好比高正确、高密度的文字衬着,尤其是中文,甚至能天生可运行的代码;传神甚至有些瘆人的 UI 截图模仿,昨天应该有不少人被一则 Claude Code 的推文骗到;画面邃密度及审美程度也年夜年夜晋升,那些一眼 AI 的难堪打光呈现的几率一会儿低了太多,预计能让 Midjourney 吓出一身盗汗;强推理能力,能存眷到许多你没写的细节,愈来愈靠近年夜语言模子的交互体验。至在错误谬误,OpenAI 本身也认可,于空间理解上的能力还有不敷。
固然,知危于测试一下后也能感触感染到,许多反复无数遍的论点依然建立:设计圈不会是以崩塌,审美及创意依旧属在人类,告白人材是受益*的人群,行业市场价值确凿需要重估,但不会直接归零。要知道,每一次一个炸裂的 AI 模子发布后,都是小白、老板及投资人最高兴。老板及投资人想甚么各人都知道,小白纷歧定是指纯外行人,还有有各类营业中需要补足艺术创作的人,好比告白导演可以省去年夜量拍摄及后期成本。至少于当下,AI 都是用来补足人的短板,而不是替换人的。
但,比拟代替人类,咱们要体贴多是另外一种危机:人们对于图片的信托可能会崩坍,以后看到的每一一张截图都需要留个心眼。
于今天知危对于 GPT Images 2 的测评中,就会将上述提到的文字衬着、UI 模仿、邃密节制、强推理这些长处,做一个极限测试,看看界限于哪,也看看安全隐患有多年夜。
起首是文字衬着方面,知危尤其留意到 OpenAI 发布的一张图,看似是一个平平无奇的铺于夏布上的白米堆。
但放年夜后有彩蛋,可以看到正中央的一粒米上写了文字 “ GPT Image 2 ”。
这张图可以说是给知危带来*震撼的官方案例。
知危立即筹算把这个例子复刻出来。但于 ChatGPT 及 Lovart 测验考试屡次后发明效果一般。年夜部门环境下,要末所有米粒都很年夜,可以轻松写下文字。
要末会以一种 “ 做弊 ” 的方式写上去,好比只有写字的米粒会变患上很是年夜。
厥后经由过程一种多步迭代的方式来测验考试,要求模子把上图写着文字的米粒缩小,重复屡次以后,终究有了差未几的样子,但文字形态已经经很丢脸清了。

然后知危才发明,OpenAI 提供的例子是 4K 分辩率的,而于 ChatGPT 及 Lovart 上免费利用时只能天生 1K 分辩率的图象。为此,知危买了个会员来测试 GPT Image 2 的最高质量及最高分辩率版本( 经由过程Higgsfield AI),如下每一张图都基在这个规格。
是否是采用最高规格就能乐成复刻了呢?并无。不异的问题还有是一直呈现,不是所有米粒都太年夜,就是有文字的米粒太年夜,不管怎么提示模子 “ 文字只有 75x30 像素巨细 ”、“ 写着文字的米粒及其它米粒同样年夜 ”。
如下是知危感觉还有算比力冷艳的两个例子。*张图于在文字衬着的物理真实性,第二张图于在文字充足小但很清楚。
接下来再刁难它一下,让它把上图的 “ Zhiwei ” 复制到另外一颗米上去,这回却是很顺遂,但很较着模子专程新天生了一粒米来写文字。
假如是一粒米上写年夜量文字,好比一首诗呢?做弊伎俩再次呈现。即便夸大字体巨细为本来的十分之一,以和写诗的米粒不比其它米粒年夜,仍旧很背及。
再从唐诗换为宋词,模子直接本身洒了一把不知品种的年夜米来写。
到这里只能先作罢,今朝看成果要末是提醒词没猜对于,要末 OpenAI 只是给了一个偶尔的成果,要末 OpenAI 是用更高级另外算力天生出来的。究竟需要放年夜后才能看到文字,可能隐含了多一个级另外场景繁杂度及推理难度。模子由于节省算力而降智,宣传片及内测阶段都很牛逼的模子,一旦正式发布就发明年夜打扣头,信赖各人已经经碰到不少次了。
固然,这也隐含了一种可能性,年夜模子公司内部的 AI 能力比咱们能见到的还有强患上多,但受限在算力没法普和。不外这个例子也意味性地让咱们感触感染到文生图模子再一次冲破了极限。
对于了,猜猜 GPT Images 2 老冤家 Nano Banana Pro 会怎么做这道题?
别笑,这事 GPT Image 2 也可能做患上出来。
接下来,咱们再看一些比力有实用价值的测试维度,好比文字衬着密度。这多是这一版模子*实用价值的一个能力,于海报、产物图、科普图中都有年夜用。
测试很简朴,就是看 GPT Image 2 于一张图中至多能塞进几多个文字。
咱们以《西纪行》原文为例,将*章的内容慢慢增长字数提供应模子,看看效果怎样。
起首是从开篇到孙悟空刚出生避世,年夜概 1300 字。
天生成果以下,险些看不到一个错字或者崩坏的字,甚至提醒词中包罗的拼音解释也加进去了。
接下来,增长文本,从开篇一直到孙悟空称美猴王,约莫 2800 字。这一回,模子有些吃不用了,不仅后面的文本出缺掉,末尾的文字也显患上有些凌乱及拥堵。
咱们再增长更多文本,从开篇一直到孙悟空独自出行追求永生不老之方,碰到了老樵夫,约莫 5600 字。这一回,模子直接偷懒了,年夜概只衬着了 1500 字内容。
末了咱们直接将文字篇幅晋升到万字范围,模子直接傻了,输出了一个换胎的科普图,还有有一个前沿信息技能的 PPT,不知道受了甚么刺激。现实上我输入的内容是知危以前的采访文章全篇,不知道模子是怎么遐想到换胎的。
末了,咱们折中一下,于让模子呈现稍微崩坏的 2800 字篇幅下轻微缩小篇幅,从《西纪行》的开篇一直到刚发明水帘洞,约莫 2500 字,这一回模子算是面子地完成为了使命。
老冤家 Nano Banana Pro 能做到甚么水平呢?
你可能感觉 Nano Banana Pro 更懂宏不雅上的排版美学,但实在细节不忍直视,有太多文字崩坏。
对于比一下 GPT Image 2 天生的局部放年夜,立见高下。实用处景下此刻必定患上选择 GPT Image 2。
这个测试结论就一句,就知危的测试成果来看,模子的文字衬着上限年夜概是 2500 字。
以上重要针对于文字元素,接下来重要看图象元素方面的节制邃密度,尤其是针对于 UI 天生。
要说对于在年夜部门人而言,最繁杂的软件是甚么,可能就是 PhotoShop 了。
咱们来让 GPT Image 2 复刻一个 PhotoShop 的功课举行中的事情界面,起首是人像抠图场景,功课内容是正于对于人类头发部门举行过细的抠图操作。
提醒词:
一个超传神、高清的桌面事情场景,拥有影戏级的光影效果。画面主体是电脑屏幕,配景中显示着 Adobe Photoshop(深色主题),屏幕上正于举行邃密的人像抠图。图象中央是一张高分辩率的半身人像,配景繁杂(例如街道或者天然情况)。抠图历程正于举行中,还没有完成。
Photoshop
的界面高度传神,与当前操作慎密相干:左边东西栏清楚地显示了快速选择东西、魔棒东西、套索东西、钢笔东西及画笔东西;顶部东西选项栏显示了“选择及蒙版”参数,例如边沿检测、成仙、对于比度及挪动边沿的滑块;画布上主体周围会呈现动态的“蚂蚁线”选区,头发区域具备半透明的边沿加强效果,注解正于处置惩罚细节。
右边面板包罗富厚的真实信息:“图层”面板至少包罗配景、人像、蒙版、边沿调解及颜色校订图层或者图层组;当前选中的图层具备清楚的图层蒙版缩略图(黑白对于比较着),部门区域被涂成玄色或者白色;“属性”面板显示蒙版参数;“汗青记载”面板列出近来的操作步调,例如快速选择、细化头发及画笔蒙版;“通道”面板显示RGB及各个通道的预览,提醒可使用基在通道的图象抠图功效。
图象至少包罗三个清楚可辨的图象元素:起首是主体图象,其边沿已经被抠出,并保留了繁杂的头发细节;其次是原始配景,已经被移除了或者隐蔽(部门区域出现透明棋盘格图案或者被蒙版遮挡);第三是待替代的新配景图层(例如,恍惚的风光),于下方隐隐可见,还没有彻底交融。
画布上显示一个柔边画笔光标,轻轻地沿着主体头发的边沿涂抹,部门边沿出现半透明过渡效果,表现了“细化”的历程;总体界面简便了然,信息富厚,所有UI元素的结构均切合 Photoshop 的现实事情流程。屏幕违光柔及地照亮键盘及桌面情况,营建出专注、专业且传神的气氛,夸大“操作历程中的刹时”,而非终极制品。它拥有 4K 分辩率、极高的细节体现、传神的用户界面布局以和流利无 bug 的界面。
天生成果:
周边情况及人类可能还有有些 AI 味,至少 PS 的界面自己一眼是看不出来有甚么问题的,重要是信息密度太年夜,是于很难信赖 AI 能做到,但 GPT Image 2 就是做到了。固然,知危对于 PS 的许多专业常识其实不认识,没法判定上图是否真的彻底无误,就再也不细细阐发了。
咱们再磨练一下模子的邃密微调能力,把节制配景图可见性的小眼睛图标改成 “ 不成见 ” 状况,也就是空的方框,模子真的做到了。
知危细心对于比过原图,真的只有这里改动了,的确是像素级的邃密度。但还有是要挑刺一下,假如配景图被改成 “ 不成见 ”,画布中的配景应该消散才对于,究竟模子都号称有强推理能力了。
比拟之下 Higgsfield AI 提供的自制修改器的效果是如许的。虽然也有把小眼睛改成空方框,但给人脸也做了一个抠除了,光照也变化了,很难做到可控。
再看一个游戏观点设计场景,功课内容是正于将海盗风帆主体及年夜海配景举行交融,是 PS 中比力繁杂的操作。
提醒词:
一幅超传神、高清、广角的电脑桌面场景。画面主体是 Adobe Photoshop(深色主题)界面,捕获了“3D 海盗游戏风帆观点设计”历程中图象合成的刹时。
屏幕上显示着一块巨年夜的横向画布,中央位置正于合成一幅精致的海盗风帆观点图。船体由多张图片拼接而成,包括木质船体、破旧的白色船帆、绳子、桅杆、年夜炮、金属铆钉、波浪飞溅的浪花以和浓雾及狂风云,所有元素同时出现。图象仍处在未完成的编纂状况,显然是于举行后期润色,而非终极制品展示。
Photoshop 界面必需高度传神且完备。
画布周围可见参考图象的缩略图预览,展示了从图象网络到合成的整个历程。
超传神、细节富厚、布局切确的用户界面,富厚的层级布局,看似杂乱却又专业,动态的编纂举行中感,4K 分辩率,影戏级光照,以和极高的保真度。
天生成果:
又是一个经由过程繁杂度就能让人觉得真假莫辨的成果。但需要留意的是,模子对于画面元素的节制还有不敷,我提醒的是 “ 主体及配景暂时还有没有天然交融的刹时 ”,近似下图的效果( 来自 Youtube 博主 Imad Awan),模子没有实现,而是直接于画布中给到了一个完成的作品。
我进一步要求模子实现这个效果,天生成果是如许的,直接把配景抠失了,而不是调解风帆主体的光照。
可以看到,模子无论于 UI 细节天生还有是邃密节制上都远超以前的模子能做到的水平。但对于在 UI 设计而言,精度纷歧定够。
联合知危以前及产物设计专家的交流,实在需要真正到达像素级微调的东西才是够用的,这类要求下,还有是传统东西更高效,假如你让模子将图象的某个元素偏移两个像素,模子基本就是啥也不干,输出原图。但 GPT Image 2 作为灵感摸索及原型设计已经经是必然水平的够用,后续的细节微调事情,可以将图片输入 Codex 开发出原型或者者转换为 Figma 文件后再举行。
末了要上年夜考了,就是强推理能力。
知危以前于测试 Nano Banana Pro 的时辰用过一个例子,就是经由过程于提醒词描述 6X6 阵列的玩具呆板人的行属性及列属性,让模子本身去推理每个玩具呆板人应该长甚么样子。于这个例子下,Nano Banana Pro 及 GPT Image 1 完成的都欠好,只有把每个玩具呆板人的属性直接列出来后,Nano Banana Pro 才能较好地完成这个使命,GPT Image 1 则是彻底掉败。
此次咱们再次把最高难度的提醒词直接给 GPT Image 2。
提醒词:
严酷俯视(正上方正交/orthographic top-down),整洁摆列的 6x6 网格(6 行 × 6 列),白色配景,细薄灰色网格线将每一个单位格分开开。每一个单位格正中放置一个玩具呆板人(共计 36 个),每一个呆板人都有确定且*的形状属性及编号(两位数,从 01 到 36,编号以玄色或者深灰色小字印于呆板人底座或者底盘一侧,清楚可辨)。
呆板人气势派头:复旧玩具(念旧机械/齿轮/铆钉感),色采艳丽但材质各别(按法则分配),每一行及每一列遵照确定性属性映照(见下方法则),确保所有呆板人互不反复。
严酷连结顶视无透视变形(无鱼眼、无歪斜),匀称平行光(自上而下)、细微柔及投影以显示立体感但不转变顶视轮廓。
高分辩率、超细节,4K 输出(或者更高),*细节(纹理、螺丝、划痕、贴纸、反光、铆钉、漆面厚度等),无景深恍惚。
画面洁净:只呈现呆板人、网格线与白色配景。高保真、真实感玩具质感 + 轻微卡通化的色采饱及度。
确定性天生法则:
为了包管“每个呆板人都差别且可复现”,请根据下面法则组合属性(行 × 列 的组合天生*形状):
行主色(Row 1 → Row 6,决议主色调)
Row 1: 正红(crimson)
Row 2: 橙黄(amber)
Row 3: 橙(tangerine)
Row 4: 黄(sunny yellow)
Row 5: 绿(emerald)
Row 6: 青(teal)
列材质/外貌处置惩罚(Column 1 → Column 6,决议材质与总体质感)
Col 1: 抛光金属(polished steel)
Col 2: 拉丝铝(brushed aluminum)
Col 3: 黄铜(brass)
Col 4: 铬镀层(chrome)
Col 5: 涂漆塑料(high-gloss painted plastic)
Col 6: 半透明塑料(translucent acrylic)
GPT Image 2 一雪前耻,颜色、材质、编号同样都没错。

接下来,咱们再晋升一个难度等级,做 10X10 阵列的玩具呆板人,不仅要遵照按行差别颜色及按列差别材质的细节,还有要加之按行差别头部造型及按列差别眼睛类型的细节。
提醒词:
严酷俯视(正上方正交 / orthographic top-down),整洁摆列的 10×10 网格(10 行 × 10 列),纯白配景,极细灰色网格线切确分开每一个单位格(线宽一致、无透视收敛)。每一个单位格正中心放置一个玩具呆板人(共计 100 个),所有呆板人尺寸同一、居中对于齐、边距一致。
每一个呆板人必需具有 彻底*的外不雅组合与编号(01–100,三位数格局 001–100),编号以微小但清楚的玄色或者深灰色印刷字体标注在底座或者底盘边沿,标的目的同一且可读(不成扭转或者遮挡)。
总体气势派头:复旧机械玩具(nostalgic retro toy robots),夸大齿轮布局、铆钉毗连、机械拼接感;造型同一基础布局(头+躯干+四肢),但细节变化极富厚。色采高饱及但真实材质相应正确。
光照:匀称平行顶光(从正上方垂直照射),极稍微柔及接触暗影(ambient occlusion),无标的目的性暗影偏移;严酷无透视、无镜头畸变、无鱼眼效果。
画质:超高分辩率(4K),*细节(微划痕、油漆厚度、金属氧化、模具分型线、螺丝纹理、微尘、指纹陈迹、反射粗拙度差异等),无景深恍惚(everything in focus)。
画面约束:配景纯净,仅包罗呆板人 + 网格线;无分外元素、无文字申明(除了编号外)、无杂物。
确定性天生法则(10×10 全*组合)
1. 行主色(Row 1 → Row 10:决议主色调)
Row 1: crimson(正红)
Row 2: amber(褐色)
Row 3: tangerine(橙)
Row 4: sunny yellow(亮黄)
Row 5: lime green(浅酸橙绿)
Row 6: emerald(深祖母绿)
Row 7: teal(天蓝)
Row 8: azure(钴蓝)
Row 9: cobalt blue(粉红)
Row 10: violet(紫罗兰)
2. 列材质(Column 1 → Column 10:决议总体材质)
Col 1: polished steel(抛光钢)
Col 2: brushed aluminum(拉丝铝)
Col 3: brass(黄铜)
Col 4: chrome(铬)
Col 5: high-gloss painted plastic(高光漆塑料)
Col 6: translucent acrylic(半透明亚克力)
Col 7: matte rubberized coating(哑光橡胶涂层)
Col 8: anodized metal(阳极氧化金属)
Col 9: ceramic enamel(陶瓷釉)
Col 10: frosted glass composite(磨砂玻璃复合材质)
3. 行决议头部造型(Head Type)
Row 1–10 对于应:
圆顶/立方体/六棱柱/圆柱体/梯形/天线罩/双眼面罩/复旧电视/头盔/虫豸状
4. 列决议眼睛类型(Eye Style)
Col 1–10:
单透镜/双圆形/LED 灯条/面罩发光/像素眼/机械虹膜/十字准星/双筒千里镜/狭缝眼/无可见眼
要害约束(很是主要)
每一个呆板人 = *组合(颜色 × 材质 × 头 × 眼)
不答应呈现两个视觉上不异的呆板人
所有呆板人朝向一致(正上视不成扭转)
网格严酷对于齐,无偏移、无错位
编号必需完备笼罩 001–100 且无反复
乍一看又被惊到,颜色按行排布彻底正确,眼睛类型基本没问题,每一一列的呆板人造型都很差别。但细心看就会发明,玩具呆板人险些没有材质上的不同,多了一列,第 7 列编号反复并及第 10 列同样,模子按列而不是按行来画玩具呆板人的头部造型,第 4 列玩具呆板人的头部造型没有要求过,原本该实现的圆柱体头部造型放到了第 6 列,缺乏复旧电视及虫豸状头部造型,等等。
以是,GPT Image 2 的批量天生能力确凿有年夜幅晋升,还有一举跨越了 Nano Banana Pro,但能力界限还有是很快被探到。
整体而言,GPT Image 2 的邃密天生及节制能力都有很年夜水平的晋升,但能力界限也很较着,对于各类场景能带来提效是必定的,至在提效的水平,还有是要详细场景详细阐发。对于在告白预计是年夜跨度的量变,对于在 UI 设计则多是质变的水平,即从不成用到可用。
末了,咱们聊聊模子的安全危害。
可以看到 GPT Image 2 于天生 UI 上邃密水平尤其高,足以以假乱真,甚至前面的 PS 画布里的风帆观点设计都能认真图来交功课了。
知危也测验考试问 Gemini 那张风帆图是否是 AI 天生的,因为没有 Google AI 的水印,Gemini 只能按照画面元素举行判定,成果 Gemini 彻底沉浸于画布中去阐发风帆是否是 AI 天生的,患上出结论说这是基在 AI 天生的图举行人工修改后的风帆图,彻底没意想到 UI 自己也是 AI 天生的。


ChatGPT 也给出了近似的成果。



而对于在许多平凡人来说,各人可能于对于一张图阐发的时辰,还有没 AI 过细呢。
从昨天到此刻,网上传播着各类 AI 天生的新闻软件截图、社媒截图,个个都是假动静。还有有人玩各类恶弄梗甚至地狱梗,包括不限在川普与高市早苗成婚、张雪峰代言长命乡、科比代言直升飞机等等......
这致使于编纂部群里,从昨全国午最先,每一有人发一张图,下面就立刻存心有人问:这是 AI 天生的吗?
此后的世界,必定是 AI 假图满天飞。假如每一一张截图都需要细心甄另外话,降低上彀摸鱼体验还有是小事,最可怕确当然是危和产业安全。
此刻,GPT Image 2 已经经全量发布,靠人工检测一定跟不上假图发布的速率,需要 AI 的助力,但当前的 AI 检测技能好像还有没预备好。
以是只能说,人们对于图片的信托,基本归 0 了,至在何时能从头成立信托,还有真欠好说。
【本文由投资界互助伙伴微信公家号:知危授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-今年会·(jinnianhui)金字招牌