给大家分享一个超好用的短视频制作 AI 神器:GlatoAI。特别适合那些想快速给产品做介绍的自媒体小伙伴们,还有想第一时间get新产品信息的商务大哥大姐们。
你只需把链接往上一贴,不管是文章、产品页还是啥网页链接,GlatoAI 都能秒速分析,然后给你做个配套的短视频广告。视频里啥都有,包含讲话的人物+语音+字幕。
就这么简单,不需要你费太多脑筋。赶紧试试吧,真的超好用哦!
如果对效果不满意,还可以在以下方面进行更多的调整: 1. 修改名称、上传标志、产品描述、期望持续的时间、额外的介绍信息 2. 除了自动收集链接中的图文视频之外,也可以选择自行上传更多信息 3. 从多个备选的视频脚本中进行筛选 4. 更改不同的数字人形象(性别、年龄、拍摄背景等等)
官网地址:GlatoAI
腾讯发布了 ToonCrafter,是一种新型的卡通动画生成技术,可以通过生成插值方法生成自然、连贯的卡通动画中间帧。该技术超越了传统基于对应关系的卡通视频插值方法,能够处理复杂的非线性运动和遮挡问题,使动画过渡更加平滑自然。
从演示来看效果很好,过渡很顺滑,而且没有明显问题。ToonCrafter 利用预训练的图像到视频模型,可以插值两幅卡通图像,并根据参考图像对动画草图自动上色。它支持生成最多16帧的视频,每帧分辨率为512x320。通过减少DDIM步骤,可以降低推理时间。
还设计了一个灵活的草图编码器,使用户能够对插值结果进行互动控制。
项目地址:ToonCrafter
就在刚刚,著名生成式 AI 音乐平台 Elevenlabs 在官网发布了全新功能,文本可直接生成各种逼真音乐特效。
这项技术对于电影、游戏、短视频等行业非常有帮助,因为它可以简化寻找音效的过程,并且多数音效已经获得了 Shutterstock 的商业授权。
Elevenlabs 的这个新功能允许用户通过描述来生成音效,例如汽车呼啸而过的声音、刀剑碰撞的低沉声音或小提琴划过空气的尖锐声音。用户可以登录 Elevenlabs 的官网,选择 “Sound Effects” 并使用该功能。在生成音效之前,用户可以设置音效的时长和文本提示的还原程度。Elevenlabs 还提供了一些示例音效,如雷雨天气的声音和模仿兽人声音的摇滚音乐。
Elevenlabs还提供了语音克隆和文本转语音的功能,但目前对中文的支持较差,生成英文的效果则非常棒。
现在所有用户都可以免费试用 Elevenlabs 的这个新功能。大家可以访问 Elevenlabs 官网了解更多详情。
今天我要推荐的网站,能为你提供未来感十足的AI网站生成体验!
Framer 由Koen Bok和Jorn van Dijk于2014年创立。他们曾在Facebook和Hype进行产品设计和开发,看到现有设计工具无法满足创建复杂互动原型的需求,于是创立了Framer。当下,Framer已经成为设计和开发领域的重要工具。
虽然在实时协作和矢量设计方面,Figma等竞争对手更具优势,但Framer凭借其在互动原型和动画方面的强大功能,保持了在设计工具市场中的重要地位。
✨ Framer亮点 ✨ ① 无代码设计:你无需编程基础,通过拖放组件即可创建复杂的交互效果。 ② 实时协作:多人同时编辑和评论,团队合作更加高效流畅。 ③ 自动化设计:智能布局和响应式设计功能,让你的作品在任何设备上都完美呈现。这也是最打动我的一点。现在大大小小的设备太多了,能做到多端适配,简直感动到哭。 ④ 丰富的模板和组件:海量模板和UI组件库,助你快速启动项目,节省时间。 ⑤ 高保真原型:从静态设计到动态原型,一气呵成,完美展示用户体验。
官网地址:Framer
不知道你有没有遇到过这样的烦恼:设计的颜色看起来很漂亮,但是总有人说看不清楚?其实,这都是因为颜色对比度不够高!今天给大家推荐一个神器 Colour Contrast,让你的设计既好看又清晰!
🔍 五大亮点: ① 简单易用: 界面简洁,操作方便。只要输入你要用的颜色,马上就能看到对比度结果,超级方便!
② 符合标准: 网站按照国际无障碍标准(WCAG)来评估你的颜色对比度,确保你的设计对所有人都友好,特别是那些有色觉障碍的用户。
③ 实时反馈: 输入颜色后,立刻显示对比度评分,告诉你颜色搭配是否合格。如果不合格,还有建议改进的地方。
④ 色盲模拟: 可以模拟不同色盲类型的视觉效果,帮助你更全面地优化设计,确保任何人看你的设计都不会觉得吃力。
⑤ 方便分享: 可以保存和分享你的颜色对比结果,让团队协作更顺畅。
👉首页地址:Colour Contrast
没错!就是这样一个网站被红杉资本投资了,然后在去年6月被Linktree收购 所以!今天的主角就是Bento.me!一个专门为创作者、网红和企业家而设计的网站。
Bento允许用户创建个人页面,优雅地展示所有内容和链接,这样你就可以在一个位置推广各种数字产品、社交媒体资料等。你是不是觉得很不可思议!这样也行?
所以我来给你说说,Bento.me 的一些主要特点: ① 可自定义布局:用户可以使用现有模板设计页面,或根据品牌美学进行自定义。 ② 内容管理:Bento可以极其简洁的让你添加并组织各种链接、图片和其他内容。 ③ 友好的界面:Bento 以其直观的拖放界面,使创建和更新页面变得简单。 ④ 永久免费:不花钱,可以直接访问使用。
我在配图中,也给大家展示一些用户的Bento页面。第1张是我自己创建,仅仅做个示范。
现在,你可以像和 ChatGPT 聊天一样使用谷歌地图了。
谷歌地图最新升级包括以下 5 点: 1. 对话式地图搜索 直接与 Google Maps 聊天搜索信息,AI 将使用 Google Maps 上的商户信息、照片、评分和评论等信息来提供可信的结果。
2. 实时查看地图 只需点击相机图标即可使用实时视图进行搜索。谷歌地图会显示附近的 ATM、餐厅、公园和公交站,并显示其开放时间和评级,且跟随 AR 箭头,准确引导您到达目的地。
3. 全新沉浸式视图 在正式访问地点之前先确定其范围,查看逼真的视图,并获取天气预报、高峰时段等有用信息,而且还能查看室内景观。比如在订餐时可以展现餐厅氛围,帮助您选择。
4. 新增多重搜索 现在,您可以结合文字和图像, 在 Google 地图上访问数百万本地企业的信息。
5. 获取人工智能建议 随时随地获取人工智能支持的建议。如果开始下雨,可以向地图询问“雨天活动”并获取附近的喜剧表演或电影院等建议。
2024 春季火山引擎 Force 原动力大会大家看了吗?放大招了,火山引擎第一次正式亮相了豆包大模型家族,一口气直接祭出了9个成员。
以下是大会的重点信息概要:
1. 核心模型:豆包通用模型分为两个尺寸,大杯(Pro)和中杯(Lite),其中Pro版本窗口尺寸最大可达128K,全系列可精调;Lite版本响应速度快。 2. 价格优势:豆包通用模型Pro的价格远低于行业标准,小于32K窗口尺寸的价格为0.0008元/千tokens,128K窗口尺寸为0.005元/千tokens。 3. 使用量:豆包大模型自上线以来,每天处理的token数量高达1200亿,生成图片数量为3000万张。 4. 多场景应用:豆包大模型在抖音、今日头条等50多个场景中进行实践和验证。 5. 文本对话与语音功能:豆包大模型在文本对话和语音合成方面表现出色,提供了更自然、更像人的声音效果。 6. 角色扮演模型:豆包大模型还包括角色扮演模型,允许用户与虚拟角色进行对话。 7. AI应用开发平台:火山引擎还发布了一站式AI应用开发平台“扣子(coze)”,支持用户通过简单的操作来创建智能体。 8. 火山方舟2.0:火山引擎的MaaS平台火山方舟升级到2.0版本,提供一站式服务,让企业可以快速落地大模型应用。 9. 安全性与稳定性:火山方舟在算力、算法和安全层面提供了优化方案,包括GPU资源池、SFT训练引擎和安全沙箱等。 10. 差异化插件:火山引擎提供了联网插件、内容插件和RAG知识库插件,以提供差异化服务。 11. 战略差异:火山引擎的战略与其他大模型厂商不同,更注重实际使用量和用户体验,而不是仅仅依赖榜单分数和参数规模。 12. 市场反馈:豆包APP累计下载量超过1亿,火山引擎与多个行业的企业合作,共同优化大模型。 13. 总体评价:火山引擎的大模型以更大的使用量、更低的价格、更多的应用场景、更人性化和智能化的特点,展示了其在大模型时代的竞争力。
小编觉得本次大会最吸引我的当属这个文本对话语音功能了,很逼真了,大家可以一起感受一下:(右键视频-显示控件-可以打开声音)
更多介绍可以戳这里: 2024 春季火山引擎 Force 原动力大会
太震撼了啊,没等到GPT-5,却迎来了 OpenAI 新旗舰模型GPT-4o!
5月14日凌晨,GPT-4o 在 OpenAI 官网正式发布了,GPT-4o是一个多模态模型,能够处理视频、音频和文本数据,具有实时推理的能力。它能够执行多种任务,包括实时翻译、唱歌、做数学题和讲笑话等。GPT-4o的语音响应时间非常短,平均响应时间为320毫秒,并且在MMLU评测中创下了88.7%的新高分,超过了其他市面上的大模型。
这是正儿八经的原生多模态,更重要的是可以实时推理音频、视觉和文本,注意这里是实时,实时,实时,推理的不是文本,是音频!视觉!
某种程度上,AGI 已然成为现实,我们即将迎来一个新的时代啊!