AI扩图越救越丑？你根本不是在修图是在给AI“擦屁股”|武汉市良龙茂科技有限公司

我跟你讲个气炸肺的事。

上礼拜我把老家猫主子的照片翻出来，想扩个横构图当电脑桌面。原图就是普通手机竖拍，猫蹲窗台上，背景是糊成一片的绿萝。结果呢？我像个憨憨一样传了五六家AI扩图工具，出来的东西让我直接脑溢血——猫倒是那只猫，绿萝硬生生被AI臆想成了仙人掌，还带刺儿的那种。我老家武汉的，家里养没养仙人掌我能不晓得？这哪叫扩图，这根本就是AI喝多了在给我瞎编。

真的，我估摸着你也遇到过这种事儿。一张好好的图，主体没毛病，就是边儿上缺块地儿，想着现在AI这么神，拉一拉画布不就齐活了？好家伙，拉完你发现，原本干干净净的背景突然多了座山、多了条河，甚至多了个你不认识的路人甲。你以为自己在做后期，其实AI在给你搞二次创作。这就不是咱们用工具，这是工具在耍咱们。

所以今儿我必须跟你掰扯清楚这个——我叫它“ai膨胀裁剪”。你别以为这是个什么高端学术词，这就是我自个儿编的。啥叫膨胀？就是AI生成的时候飘了，觉得自己啥都懂，在你图片边角料区域疯狂加戏，把你那点安静的留白空间塞成春运火车站。裁剪整理呢，就是咱们回过头来给它擦屁股，把那些画蛇添足、逻辑喂狗的破像素一块一块往回抠。

首先咱们得整明白，“ai膨胀裁剪”这毛病到底打哪儿来的。

你肯定也好奇，明明扩的是同一张图，为啥有时候AI乖得跟金毛似的，有时候却疯得跟二哈一样？这事儿我专门问过做算法的一个朋友，他是湖北人，跟我用方言讲了一大堆，我听个半懂，但核心意思我抓住了：AI它不是“看”图，它是“猜”图。它压根不晓得你这张照片背后的故事，它只是看过几亿张图，觉得“哎这个地方空着，按套路该补棵树”，于是它就给你种棵树。哪怕你家地板是大理石的，它也敢种-5-10。

这就是最典型的“ai膨胀裁剪”——AI凭经验办事，把你正常的需求整出灵异事件。尤其是有Logo或者文字的电商图，你扩个白边想把产品居中，结果AI在空地上给你生造一排英文字母，拼起来还不是单词，纯粹是乱码。上回我一个开网店的朋友传了张童装图，衣服上印着“Happy Day”，扩完边角多了个“Hapyy Dey”，拼写都错了，差点没被买家笑死-5。

你说气不气？这种时候你想的不是修图，你想的是顺着网线去打产品经理。

然后你以为你学聪明了，开始给AI写提示词。“延展木质桌面、柔光、无杂物”，写得够细了吧？结果AI给你扩出一块木头，纹路对不上，色差像打了补丁。它压根没理解“同一张桌子”是啥概念，它就觉得反正是木头，差不离就行-1。这时候你又得动手裁剪整理，把那块假木头裁掉，再一点点补、一点点试。

我管这个叫“裁剪整理”不是没道理的。因为你根本不是一次性扩完，你是扩一下、裁一下、再扩一下、再修一下。AI在那儿可劲儿膨胀，你在后头可劲儿往回拽。你说到底谁是甲方？

更可气的是，有些图天生就不该拿去给AI扩。网上那些教程从不跟你说这个，就光吹AI多神。结果你屁颠屁颠把一张500x500的糊图传上去，期待它给你变出4K壁纸。可能吗？它自个儿连原图里有几个人都看不清，它拿啥给你补细节？它只能瞎补，补出来的脸像橡皮泥捏的，鼻子不是鼻子眼睛不是眼睛-10。这就是另一种“ai膨胀裁剪”——输入质量本来就差，AI为了完成任务强行输出，最后产出一堆像素垃圾。

有一回我拿一张老照片试，八几年的黑白照，人脸都是模糊的。扩完之后，我外婆的衣服纹理倒是清楚了，但她背后那堵墙凭空多了一扇窗户，窗户外头还有一棵树。我家老房子二楼哪来的树？你要说这是写实，这就是诈骗。

那咋整呢？难道这AI扩图就纯属噱头，根本没法用？

也不是。我跟好几个做设计的聊过，自己也摸爬滚打试了俩月，总结出一套对付“ai膨胀裁剪”的土方子，你听听看有没有道理。

第一招，也是最笨的一招：给它画框子。不是真的画，是在脑子里画。你要知道，AI最怕自由发挥，你得给它定死边界。很多工具支持方向性扩图，比如只扩左边、只扩下边，你就给它限定死，别让它四面八方瞎跑-1-5。这就像你请人刷墙，你把报纸铺好、美纹纸贴好，他再怎么手生也泼不到天花板上去。我自个儿用的时候，只要条件允许，一定只选单边扩，哪怕多扩两次，也不让它一次把四面全填满。你给它一分自由，它还你十分惊吓。

第二招，是让它学会“抄作业”。现在的AI扩图，尤其是一些迭代版本，支持传垫图或者参考图-5。啥意思？就是你扩右边，把左边原图的边缘裁一小条，当参考答案喂给AI。它一看，哦，这儿是木纹、这儿是光影方向、这儿饱和度偏低，它就照着抄。抄作业的孩子虽然笨，但至少不会把历史书写成科幻小说。我试过，垫图和不垫图，那效果是天壤之别。

第三招，给自己省点显卡。这个是我最近才悟出来的。你别一上来就拿4K原图去扩，AI跑不动，你电脑也卡。正确姿势是先把原图缩到1080p左右，扩完图，再用专门的超分模型把整张图放大到4K-4-5。很多人把扩图和超分搞反了，拿着低清图直接扩，结果AI一边猜细节一边补画面，错上加错。顺序很重要：先超分（让图清晰），再扩图（补全内容），最后如果有需要，再轻微二次超分（收尾润色）。这叫给AI减负，也给自己省时间。

第四招，就是认怂。有些图真不适合扩，比如结构图、电路图、医学影像，这些东西AI理解不了，你非让它扩，它就是一本正经胡说八道-10。还有就是那种主体已经顶天立地的，猫鼻子都快戳到画框边了，你还要往外扩？AI没有操作空间，只能强行拉伸主体，猫脸变驴脸-10。这种图你再怎么调提示词也没用，物理定律决定了它就是不行。

说到这儿我又想起一茬。前阵子社区里有人讨论Topaz的新模型，说RTX 5090跑起来都吃力，24GB显存直接吃满，0.8帧每秒，扩个两分钟视频要两小时-9。下面有人支招，说把视频切成四块拼成田字格，一起扩完再拆开，效率翻倍。你看，这就是人民群众的智慧。AI在那儿膨胀，要显存要算力要你加钱上云；咱们就在这儿裁剪整理，拼视频、拆视频，硬生生从牙缝里省出几帧速度-9。

所以说到底，什么ai膨胀裁剪整理，压根不是什么技术难题，是人跟机器斗智斗勇的过程。AI负责幻想，你负责拉它回现实。AI负责画蛇添足，你负责把那条蛇脚剁了。AI负责画饼充饥，你负责告诉它这饼馅儿不对。

我这人没啥学历，也不懂啥神经网络扩散模型，我就知道一件事：工具是伺候人的，不是人伺候工具的。哪天要是AI扩图还得我自个儿上阵做二次校稿、三次返工，那这AI到底是省事了还是添堵了？你想想是不是这个理儿。

好用的AI扩图，是扩完你根本想不起来这儿是补的。不好用的，是每回看到都来气，恨不得给它打个马赛克。

所以下回你再用这些工具，记着我这几句土话：别让它自由发挥，给它边界；别拿垃圾图指望奇迹，清晰是爹；别跟它硬刚不行就换图；别急着升4K，先扩再超分。你把这几条焊死在脑门上，保准少踩一半坑。

剩下那一半坑，那是AI自己还在进化的事儿，你急也没用。咱们先把自个儿能控的场控住，剩下的，等程序员慢慢熬吧。