ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

最近,谷歌一口气对 AI 模型能力做了一次大升级,其中最吸引我的是 Gemini 2.0 Flash (Image Generation) ,这个模型对设计师来说,实用性很强。

更多新模型的介绍:

然后谷歌这个模型也开放了 API,可以很容易把它接入到 ComfyUI 中,我自己试用后很兴奋,忍不住在我的社群里跟大家分享,太惊喜了!

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

可能有朋友还不知道 Gemini 2.0 Flash 是个啥模型?能做什么?

我先简单总结下:Gemini 2.0 Flash 最早是在 2024 年 12 月 12 号发布的,那时候只是作为一个实验性的发布,并不对我们普通用户开放。经过几个月的测试后,在 3 月 12 号已经测试通过,正式全面向所有人开放了。它能通过自然语言生成或编辑图片,和 ComfyUI 有点类似,可控性很好。

可控性好就意味着在工作中将会变得实用,前段时间还跟腾讯的同事聊天,发现他们现在都已经要求团队的人必须会 ComfyUI 了,招人也是有这个要求,能通过搭建工作流解决工作问题,对这块很是重视。

模型怎么用?

它的使用很简单,打开官方这个链接 :https://aistudio.google.com/prompts/new_chat

然后选择 Gemini 2.0 Flash (Image Generation) Experimental 这个模型

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

在主页上,它给了 3 个示例,可以分别点击这几个示例,就大概知道怎么用了。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

先快速说下官方给的这 3 个基础用法示例

1. 图片编辑

用最直白的话就能对图片进行修改。

这里的提示词是:给牛角面包撒点巧克力。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

我们还可以继续用对话对图片进行编辑,比如“给这张图上面加点奶油”,如果觉得不大够,还可以“奶油再多一些”。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

基本上它的生成就是指哪打哪,不会把原图搞乱,这就跟咱们在 PS 里修图挺像的了,非常实用,AI 改图最怕的就是改完之后原图搞不像了,可控性至关重要。下次你老板再戳你屏幕的时候,直接让他把意见打成文字,一分钟给他改好。

2. 创建图片绘本

可以让它帮你写一段故事脚本,并且每一个场景配上一张图,且每个片段的图是连贯的。

这里的提示词官方给了示例:生成一个故事,关于一只小山羊在一个农场冒险的故事,每个场景对应生成一张配图。

点示例后,它很快就生成了 9 个故事场景,然后每个场景都会生成一张统一主角,统一风格的配图。效果惊人!

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

以后绘本生意估计不好做了。家里小孩想看绘本,咱们自己都能很快出一套,打印出来就能做成册了。亲手做出来给孩子的绘本,成就感肯定不一样,言传身教。

3. 生成生日卡片

它还能通过最直白的对话,生成一张海报,文字内容我看了下完全正确,直接就能发给朋友了。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

好,官方的几个示例都特别简单,自己去试下绝对能明白,没什么好说的。下面我要讲下它的进阶用法,我感觉这才是大招!这也是这个模型让我觉得最有用的地方,它提供了 API 的方式,可以随便免费插入到其他应用中,比如 ComfyUI。

我经常跟社群的朋友们说,一定要学会 ComfyUI,因为它真的能帮我们解决实际项目问题,但很多朋友的电脑配置带不动 ComfyUI,有心无力,现在有了谷歌的这个新模型 API,只要你能在电脑上启动 ComfyUI,你的显卡多差都无所谓,一样能通过 ComfyUI 工作流快速生成想要的效果。

具体在 ComfyUI 里怎么接入这个模型?然后又有哪些进阶玩法呢?咱们继续说。

先启动 ComfyUI,如果你还不知道怎么安装,可以看这篇:

打开插件安装器,搜 Gemini-API ( https://github.com/tatookan/ComfyUI_ssl_gemini_EXP ),注意看最新更新的时间,装完之后重启 ComfyUI,它就会生效。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

上面是连单张图的,如果你还想要通过 2 张图合并生成,可以装上这个节点:ComfyUI Gemini Flash ( https://github.com/ShmuelRonen/ComfyUI_Gemini_Flash )节点。

然后双击 ComfyUI 空白处,搜索 gemini,把这个节点调出来

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

前面连上你想调的图片,后面接上图片预览,就能用起来了。

但在这之前,面板上还有一个 api_key 需要填,这个从哪弄到呢?

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

还记得前面打开的 google AI studio 吗?怕你忘了,地址再说一次:https://aistudio.google.com/prompts

左上角有一个蓝色按钮,“Get API key” 。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

点中间的创建 API 秘钥

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

创建完之后,把这个秘钥复制上

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

贴到 ComfyUI 中刚才创建的节点里

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

到这配置就完成了,没任何难度。

当结合 ComfyUI 后,它能玩的东西就非常多了。相当于把之前可能需要一堆节点才能完成的事,现在用谷歌一个节点也能做。我给大家示例一些,其他的大家再发挥下想象力,把你想到的有意思的用途放在评论区。

① 给图片去水印

本来我想找一张车的白模给大家演示,但找到的图是带水印的,那就先去掉水印。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

提示词:把这张图中的水印去掉,只保留车。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

修改结果,发现它不仅把水印给去掉了,还把位置和光影移动到了更好的位置,图片的清晰度和质量都帮忙提升了。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

② 上色+换背景

有了高质量白模图,咱们继续让这张图变得更真实。

给这张图上个材质,换个环境

提示词:给图中的车上个色,让它看起来更真实好看,车开在户外的公路上,路两边有山林,保留车的角度和特征。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

结果还行吧,基本特征算是继承了下来。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

③ 换衣服

给车上完色,咱们接着来做点更实用的事,给模特换衣服,这在电商领域经常用到。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

提示词:给这位美女换一件白色衬衫

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

换完衣服,动作稍微有些变化,但画面的背景,人物的其他特征基本上得到了保留。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

④ 给一件衣服做一张广告图

假如我们有一件衣服需要把它做成一张宣传图。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

提示词:给这件衣服添加一个小孩子模特,做出一张电商广告图,保持衣服的一致性

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

⑤ 给人物换个表情

以前在 ComfyUI 中换表情,调起来挺麻烦的,现在接入这个 API 后,换表情不要太容易,而且效果还不错,人物特征保持的特别好。

比如我拿哪吒来尝试,让他张嘴笑起来。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

提示词:让图片中的人物大笑起来,嘴巴需要打开,保持人物的特征不变。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

修改结果

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

上面这些操作,你也可以不用 ComfyUI,直接用谷歌的那个对话框也能搞定,只不过在 ComfyUI 里有批量或者其他更多操作的时候,会更方便一些。

AI 的发展,其实一直都在降低技术学习成本,ComfyUI 学习对很多人来说太复杂,我就知道早晚会把它的难度打下来,只是没想到这么快。

果然在 AI 世界,每天都在发生巨变,我们要做的就是保持关注,积极接纳,多用多学习。一起适应这个正在发生巨变的世界。

欢迎关注作者的微信公众号:「彩云译设计」

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

收藏 41干货满满
点赞 37

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。