互联网从业者充电站 头像

消息来源频道

互联网从业者充电站

@https1024

频道28,610 位成员公开可见持续更新

互联网从业者专属 内容多为技术、产品、设计、运营等不同话题内容; 目标人群为程序员、设计师、产品经理、运营管理等不同职能。 投稿/合作: @inside1024_bot 内容来源网络

成员规模28,610 位成员
在线情况待同步
消息总数32,672 条消息
浏览量总数5,084,371 次浏览

在这个频道里搜索消息……

t.me/https1024

我有些设计需求尝试直接用 nano banana pro 发现效果极好,然后我又尝试了一下 lovart,发现效果反而不如 banana pro 直出。
不久前,因为图片生成模型水平还不够,所以 agent 工程,例如将用户的 prompt 先用文本大模型转成更适合的图片生成 prompt 等技巧,能够极大提高最终效果,是以 lovart 能够惊艳四方,也确实能够产出比当时的模型水平更高的图。但 nano banana pro ,本身就足够好,而且对自然语言理解极强,所以那些工程化的东西,反而有点变成画蛇添足了?
所以我觉得模型的进化还是挺恐怖的,agent 公司如果没有模型之外的工具调用并形成自己的独特壁垒,感觉还是有点危险