博主TechHalla分享了一套用GPT-4o做动画的教程,流程简单清晰,跟着操作即可做出这样的动画【视频1】。
话不多说,我们直接来看操作步骤:
1、生成角色形象:首先,把你的自拍丢给GPT-4o,要求生成「2.5D风格卡通形象」,需满足以下条件:T-pose姿势(双手水平张开、身体站直)、细线条画风、服装保持统一、背景为绿幕。
转换好自己的卡通形象后【图2】,接着让GPT-4o参照相同风格制作三位配角,确保整体风格一致【图2 图3 图4】。
2、画场景:接下来是搭建动画舞台。向GPT-4o描述你想要的场景,比如“咖啡馆”、“末日街道”、“魔法森林”等,补充关键词(如“白天/夜晚”、“科技感/童话风”等),让它按照之前的风格输出16:9比例的场景画面。
GPT-4o生成的场景后,再搭配Magnific AI,将图片高清放大,并加深纹理细节后,就形成了这样的画面:一个坐落在荒废沙漠的西部城镇,效果堪比绘图软件【图6 图7 图8】。
3、场景融合:现在来到了最神奇的部分,上传角色和环境,让GPT-4o帮你放在一个场景中,你可以说主角站哪、配角站哪,画面比例是多少,镜头怎么摆放等等。【图9】
就是这么模糊的描述,GPT-4o竟然完美理解并做到了!画面中,作者自己和卡皮巴拉坐在酒馆吧台,酒保在他们面前擦拭酒杯。【图10】
4、生成分镜:继续告诉GPT-4o,让它根据剧情生成多种角度的画面(俯拍、侧拍、对话视角),还可以详细描述想要的画面,比如“男人和卡皮巴拉走向旅馆”、“登上台阶”、“伸手开门”等一系列分镜。
GPT-4o准确“理解”了他的需求,并给出了这样的画面【图11 图12 图13】。
5、生成动画:动画这步,作者用到了可灵AI的v1.6模型,让可灵把上面那些静帧变成动图,生成“人物动起来”的效果,并加上环境音等音效,就生成了这样的动画片段【视频14 15 16 17】。
以上就是整套流程,无需手动画图或剪辑,只需要简单的提示词和几张参考图,用户就可以借助GPT-4o+Magnific AI+可灵AI三件套,生成动画效果。
by:微博@量子位 建议收藏转发,随时翻阅!
🚀 不会修马桶?想学做菜?连恋爱技巧都想要?这个网站能让你秒变“生活超人”!
✨ 为什么全球3亿人都在用wikiHow? ① 海量技能库,专治“我不会” 从「如何修漏水的水管」到「如何写代码」,再到「如何安慰焦虑的朋友」,50000+篇指南覆盖生活、职场、兴趣全领域!遇到问题不再百度翻10页广告,一步直达靠谱答案!
② 专家级教程,小白秒变大神 每一篇指南都经过专家审核+真实用户验证!手把手拆解步骤,搭配高清图解,哪怕你从没下过厨房,也能跟着做出「完美溏心蛋」🍳!
③ 全球智慧“外挂”,中文也能用 想学国外流行的DIY技巧?直接看中文版!平台支持多语言切换,不用🪜就能get海外生活达人的神操作!
④ 人人都是“知识侠” 如果你有独门绝技,还能投稿成为作者!教别人「如何用可乐洗马桶」「如何10分钟学会吉他弹唱」,边分享边涨粉,变身垂直领域KOL!
💡 适合谁用? ▸ 留学生、独居党:紧急情况自救指南(比如「如何一个人换灯泡」) ▸ 职场人:快速提升办公效率(「Excel快捷键大全」「PPT高级排版」) ▸ 学生党:从「如何写论文」到「如何考前突击」全攻略 ▸ 好奇星人:解锁冷知识(「如何用香蕉擦皮鞋」「如何训练猫握手」)
🌟 现在就用wikiHow,告别“求人帮忙”的尴尬! 👉 点击直达:https://www.wikihow.com/
“收藏等于学会”的时代过去了——这次,真的能动手做到! 💪
学Comfyui的朋友们,你们还好吗?想必大家这2天已经都见识了GPT-4o的强大了!
1、高保真真实照片 2、有审美的文字排版:从海报到梗图,不仅准确,字在哪里都听你指挥 3、各种风格、滤镜随心切换 4、P 图全家桶:抠图、换脸、扩图样样行,还能结合不同图片中的元素「炖」出一张新图来
但是也有质疑声。据说今早,Midjourney的CEO就在内网嘲讽GPT-4o:
GPT-4o生成图像又慢,质量又差。 他们发这个功能只是为了筹集资金用的。 GPT-4o不是一款创意工具。 一周后(Midjourney v7即将发布),就没人会在讨论GPT-4o了。
大家对此有什么看法,Midjourny v7真能完爆GPT-4o吗?
想必大家今天都刷到GPT-4o模型能直接生成各种场景的图片了,朋友圈里、群内都在热议,这是图像生成领域的重大突破,以后我们都无需额外工具就能在ChatGPT内直接生成各式各样的高质量图片。
具体来说主要有以下几点:
功能描述:GPT-4o的图像生成功能允许用户通过简单的文本描述生成逼真的图片,包括但不限于漫画、手绘、LOGO、品牌宣传海报等。这些图片不仅清晰度高,还能精准渲染文字内容,例如制作带文字的LOGO或菜单。
技术优势:GPT-4o通过大量多样化的数据训练,具备生成高分辨率、具有一致性和细节丰富图像的能力。它支持多轮交互式生成,可以根据用户需求调整细节,例如宽高比、色号或透明背景等。
应用场景:GPT-4o的图像生成功能被广泛应用于创意设计、品牌宣传、教育等领域。例如,它可以将照片转换为素描风格的手绘作品,或者根据描述生成科学示意图和餐厅菜单。
限制与改进:尽管功能强大,但目前仍存在一些局限性,例如在密集文字或非拉丁文字图像生成方面可能表现不佳,角色一致性方面也还有待完善。OpenAI计划在未来几周内逐步优化这些功能。