设计师新宠来啦!初创公司 Luma 全新发布 Dream Machine,能从文本/图像直接生成视频。感觉比 Sora 也差不了多少。
Dream Machine 120秒就能给你做出一个120帧的视频!这速度,想改点啥,马上就能再做一个新的,太高效了!而且镜头效果超自然,Dream Machine还超级懂镜头语言!它能模拟出各种电影级的摄像机运动,让你的视频看起来就像大片一样流畅、自然。
大家可以看看下面的演示视频,它还能理解人和物是怎么在现实中互动的,所以做出来的视频里,角色和场景都超级真实,一点都不会觉得假。
最最最主要的是,现在人人都可以免费体验!服务器都快被大家挤爆了,你还在等啥呢?赶紧来试试吧!
体验地址:https://lumalabs.ai/dream-machine
近日,快手发布了国内首个效果对标 Sora 的视频生成大模型「可灵」,并已在其旗下的快影App中开放邀测体验。
可灵大模型是由快手 AI 团队自研,采用了类似 Sora 的技术路线,并结合了多项自研创新技术。该模型具备强大的概念组合能力和想象力,能够生成具有大幅度合理运动的视频,并模拟物理世界特性。其生成的视频分辨率高达1080p,时长最高可达2分钟(帧率30fps),且支持自由的宽高比。
可灵大模型不仅限于文生视频功能,还将推出其他应用,如“AI舞王”和“AI唱跳”,这些应用可以驱动表情和肢体动作,仅需一张照片就能生成相应的视频。
目前,可灵大模型已在快影App中正式开启邀测,支持720p视频生成,竖版视频生成能力也即将开放,大家可以来试一试,看看生产的效果怎么样!
官网地址:https://kling.kuaishou.com/
给大家分享一个超好用的短视频制作 AI 神器:GlatoAI。特别适合那些想快速给产品做介绍的自媒体小伙伴们,还有想第一时间get新产品信息的商务大哥大姐们。
你只需把链接往上一贴,不管是文章、产品页还是啥网页链接,GlatoAI 都能秒速分析,然后给你做个配套的短视频广告。视频里啥都有,包含讲话的人物+语音+字幕。
就这么简单,不需要你费太多脑筋。赶紧试试吧,真的超好用哦!
如果对效果不满意,还可以在以下方面进行更多的调整: 1. 修改名称、上传标志、产品描述、期望持续的时间、额外的介绍信息 2. 除了自动收集链接中的图文视频之外,也可以选择自行上传更多信息 3. 从多个备选的视频脚本中进行筛选 4. 更改不同的数字人形象(性别、年龄、拍摄背景等等)
官网地址:GlatoAI
腾讯发布了 ToonCrafter,是一种新型的卡通动画生成技术,可以通过生成插值方法生成自然、连贯的卡通动画中间帧。该技术超越了传统基于对应关系的卡通视频插值方法,能够处理复杂的非线性运动和遮挡问题,使动画过渡更加平滑自然。
从演示来看效果很好,过渡很顺滑,而且没有明显问题。ToonCrafter 利用预训练的图像到视频模型,可以插值两幅卡通图像,并根据参考图像对动画草图自动上色。它支持生成最多16帧的视频,每帧分辨率为512x320。通过减少DDIM步骤,可以降低推理时间。
还设计了一个灵活的草图编码器,使用户能够对插值结果进行互动控制。
项目地址:ToonCrafter
就在刚刚,著名生成式 AI 音乐平台 Elevenlabs 在官网发布了全新功能,文本可直接生成各种逼真音乐特效。
这项技术对于电影、游戏、短视频等行业非常有帮助,因为它可以简化寻找音效的过程,并且多数音效已经获得了 Shutterstock 的商业授权。
Elevenlabs 的这个新功能允许用户通过描述来生成音效,例如汽车呼啸而过的声音、刀剑碰撞的低沉声音或小提琴划过空气的尖锐声音。用户可以登录 Elevenlabs 的官网,选择 “Sound Effects” 并使用该功能。在生成音效之前,用户可以设置音效的时长和文本提示的还原程度。Elevenlabs 还提供了一些示例音效,如雷雨天气的声音和模仿兽人声音的摇滚音乐。
Elevenlabs还提供了语音克隆和文本转语音的功能,但目前对中文的支持较差,生成英文的效果则非常棒。
现在所有用户都可以免费试用 Elevenlabs 的这个新功能。大家可以访问 Elevenlabs 官网了解更多详情。
今天我要推荐的网站,能为你提供未来感十足的AI网站生成体验!
Framer 由Koen Bok和Jorn van Dijk于2014年创立。他们曾在Facebook和Hype进行产品设计和开发,看到现有设计工具无法满足创建复杂互动原型的需求,于是创立了Framer。当下,Framer已经成为设计和开发领域的重要工具。
虽然在实时协作和矢量设计方面,Figma等竞争对手更具优势,但Framer凭借其在互动原型和动画方面的强大功能,保持了在设计工具市场中的重要地位。
✨ Framer亮点 ✨ ① 无代码设计:你无需编程基础,通过拖放组件即可创建复杂的交互效果。 ② 实时协作:多人同时编辑和评论,团队合作更加高效流畅。 ③ 自动化设计:智能布局和响应式设计功能,让你的作品在任何设备上都完美呈现。这也是最打动我的一点。现在大大小小的设备太多了,能做到多端适配,简直感动到哭。 ④ 丰富的模板和组件:海量模板和UI组件库,助你快速启动项目,节省时间。 ⑤ 高保真原型:从静态设计到动态原型,一气呵成,完美展示用户体验。
官网地址:Framer
昨天(5月30日)凌晨,OpenAI 在 x 平台宣布,GPT-4o 多模态能力向所有用户免费开放。不过,在使用次数上官方没有更新公告,预计还是会是有一定次数限制。
北京时间 5 月 14 日凌晨,OpenAI 举办发布会,带来了 GPT-4o 。该模型打通了文本、图片、视频和语音输入,无需中间转换,互相之间就可以直接生成。此次发布会还带来了更智能的实时语音助手,以及适用于 macOS 的 ChatGPT 桌面应用程序。
当时,OpenAI 宣布向 ChatGPT Plus 和 Team 用户推出 GPT-4o,很快就会向企业用户推出。同时,也向所有人开放 GPT-4o 多模态能力,但有使用次数限制。
随着今年WWDC的临近,记者 Gurman 在其最新一期《Power On》专栏中,为我们揭秘了苹果在人工智能领域的最新进展。苹果将对其智能助手Siri进行升级,新版本的Siri将依托于苹果自主研发的LLM技术,为用户提供更为智能的服务。
除此之外,苹果还将在多个方面引入AI技术以增强用户体验,例如通过AI技术实现语音备忘录的自动转录、照片的智能修饰,以及Spotlight和Safari搜索功能的优化。而且,AI还将能够根据用户的短信内容,动态生成个性化的表情符号。
在个性化界面方面,苹果也做出了创新。用户将能够摆脱网格的限制,自由地在屏幕上摆放图标,并可以自定义图标的颜色,这一改进虽与AI无直接关系,但无疑将极大地提升用户体验。
同时,有消息称苹果将在即将到来的 iOS 18 和 macOS 15 系统中,为 Safari 浏览器加入一系列人工智能支持的新功能。
1、智能搜索。 苹果可能在搜索中引入 Ajax 语言模型来提供文本摘要。
2、Web橡皮擦:这一功能强调用户界面的简化和隐私保护的增强,允许用户自定义网页内容,删除不需要的元素,如广告和图片。
3、用户界面更新:苹果正在将 Safari 的关键工具集中到一个位置,以提高用户的访问效率。
4、 AI增强的视觉查找:苹果可能在2025年推出高级视觉搜索功能,允许用户通过图像获取信息,类似于 Siri 目前识别照片中的植物、宠物和地标的功能。
这些新功能的加入,将使Safari浏览器的使用体验更上一层楼,你觉得哪项最实用呢?