说实话,混咱们这行(无论是写小说的、拍短视频的还是搞设计的),最头疼的还不是没灵感,而是脑子里的画面跟最终呈现出来的东西隔着一百个美图秀秀。我以前为了给甲方描述一个“赛博朋克感但要带点烟火气的小吃摊”的画面,愣是憋了三天,写了五百字,最后甲方回我一句:“没内味儿,再改改。” 那一瞬间,我连摔键盘的姿势都想好了。
但这事儿吧,最近算是让个新玩意儿给整明白了。我说的就是这个画面描写AI,这玩意儿现在进化得,嘞,那叫一个妖艳儿(方言:厉害/出人意料)。它现在不仅仅是能画个图那么简单,它像是钻进你脑子里把你那团浆糊给理顺了。打个比方,以前用那些工具,你得像伺候祖宗一样写精确的关键词,少写一个“4k”、“光线追踪”它就能给你糊一脸马赛克。现在的画面描写AI聪明多了,你哪怕用方言跟它唠,比如你是个重庆的,想拍个短视频,你跟它说“老师,给我整个勒种下半城老社区里头,那种梯坎儿旁边,有个嬢嬢在卖熨斗糕,但是要有那种王家卫电影那种昏戳戳的灯光感觉”,它真能给你理解个七八成 -1。这就是进步,它开始懂人话了,不再是个只会认单词的人工智障。

而且我跟你们嗦(方言:说),这里面有个坑你们肯定踩过。以前我们做分镜或者画插画,最怕啥子?怕“跳戏”。第一张图那个男主角还是穿着红夹克在雨里忧郁,第二张图你只是想要他转个身,结果好家伙,红夹克变绿雨伞,连脸上的痣都换了个位置,生生把忧郁男主变成了隔壁老王 -10。这就是以前AI对“连续性”的理解为零。现在的画面描写AI为了解决我这个痛点,学聪明了,你只需要在描述下一幕的时候加一句“保留人物服装细节、保留脸部特征、保留周围灯光氛围”,它能像个记性超好的场记一样,把那些要素给你锁死 -10。这对我们这种要做系列图文或者漫画的人来说,简直是救命,终于不用在PS里一张张抠图去统一色调了。
当然,你们可能要骂我,说这玩意儿写出来还是缺了点灵魂。我跟你们讲,我最近发现个骚操作,专门对付那种“AI味儿”。你们晓得撒,AI最容易翻车的地方就是整那些花里胡哨的字体和符号 -3。我见过最搞笑的,有人让AI在海报上写个“生日快乐”,结果生成出来是“生曰怏樂”,那种别扭感就像吃了苍蝇。所以我现在用画面描写AI,绝对不让它直接生成带具体汉字的画面。我的秘诀是:让它先给画面,咱再手动加字。比如我想要个复古 disco 舞厅的背景,上面要打“舞动青春”四个字。我不会让AI去写这四个字,我只让它画那种灯球、那种方格地板、那种迷幻光线 -3。图出来之后,我自个儿用最简单的手机修图软件把字敲上去。这样一来,既有复古那味儿,又不会出现火星文,完美!
说到这儿,再掏心窝子给你们分享点干货,关于这个画面描写的“清晰度”问题。好多兄弟伙抱怨,说生成的图一放大全是噪点,跟打了码一样。这事儿其实不全怪AI,就像你炒菜不好吃不能全怪锅一样。你喂给它的“菜谱”(也就是提示词)得有细节。你要是只写“一座山”,它大概率还给你的是幼儿园简笔画。你得写成“清晨雾气缭绕的喀斯特地貌山峰,山脚下有若隐若现的徽派建筑,青石板路被雨水打湿,有很深的质感,4k高清” -9。这还不算完,你生成完之后,要是觉得还是肉,可以在后期软件里给它加个“锐化”滤镜,就那么轻轻一拉,清晰度立马上去 -9。这就跟你拍完照片稍微修个图一样,别指望素颜出镜还美若天仙,那不现实。
还有一点,涉及到专业干活儿的。咱们有时候做商业稿,要求的是“稳定的发挥”,而不是“抽奖式的惊喜”。现在有些高级点的玩法(像Seedream这种),已经可以做到“连续生成”了 -10。啥意思呢?就比如你要做一个汽车广告的分镜脚本,第一格是车头大灯特写,第二格是流线型车身,第三格是车尾划过水洼。以前你得写三段完全不同的提示词,出来的车可能长得像三个品牌。现在你只需要在第一格锁定好那辆车所有的特征,后面两格直接告诉AI“和上张图是同一辆车,换个角度,保留细节”,出来的效果就基本能对上 -10。这对于我们这种要拿给客户验收的人来说,信任感一下子就建立起来了,客户会觉得你这工具靠谱,而不是觉得你在变魔术。
最后说点心里话。有人总担心,这玩意儿越来越厉害,是不是要抢咱们饭碗?我看未必。你想嘛,以前咱们要把脑壳头的画面描写出来,得靠画画、靠摄影、靠复杂的软件,那是有门槛的。现在这个门槛被画面描写AI给削平了。以前你脑子里有个绝世美景,但你手残画不出来,心里憋得慌。现在呢?你可以借着AI的手,把它摊开来给全世界看。这其实是对创作者想象力的最大解放。咱们省下了跟工具较劲的时间,多花点心思去感受生活,去菜市场看看那热腾腾的烟火气,去公园听听老头老太太吹牛,把这些鲜活的、有温度的东西再喂给AI,这才是人机协作的王道嘛。不然的话,机器永远不懂啥子是“巴适”,啥子是“得劲儿”。




