今天发现了一个声音克隆的好东西,我刚刚挖到的Fish Speech这个工具,不仅生成速度快到飞起,而且克隆出的声音也很真实,支持文字转语音功能,非常的好用!
Fish Speech 是一款由fishaudio开发的全新文本转语音(TTS)工具,具有强大的语音克隆能力。用户只需提供一段参考语音,系统便能迅速进行语音克隆,无需繁琐的训练过程。
该工具支持中文、英语和日语等多种语言,并且在语音处理上的能力接近人类水平。 Fish Speech采用了先进的AI技术,包括VQ-GAN、Llama和VITS等,能够将文本转换成逼真的语音。它还采用了Flash-Attn算法,以提高处理大规模数据的效率和稳定性。这些技术使得Fish Speech不仅在语音合成方面表现出色,还在语音克隆方面具有显著的优势。
Fish Speech的语音克隆功能特别适合内容创作者使用,他们可以利用这一工具快速生成各种声音效果,用于视频配音、播客制作等场景。
试玩地址:https://fish.audio/zh-CN/
上半年 Sora 爆火到现在,AI 在视频领域的发展越来越强了,近日,Runway 的 Gen-3 Alpha 文字转视频功能向所有人开放了。
Runway Gen-3 Alpha 的文字转视频功能是其核心功能之一。用户只需输入文字描述或关键词,Gen-3 Alpha 就能够通过其强大的深度学习算法,自动生成与之相关的视频作品。这一功能不仅支持简单的文本到视频转换,还提供了多种高级创作工具,如运动画笔、相机控制和导演模式等,进一步提升了视频制作的专业度和灵活性。
Runway Gen-3 Alpha 在保真度、一致性和运动表现上均实现了显著的突破,能够生成高保真的视频片段,最长可达10秒。用户可以选择生成5秒或10秒的视频,并且可以根据需要调整视频的详细程度和风格。
Runway Gen-3 Alpha 的文字转视频功能不仅强大且灵活,能够满足各种创意需求,还在技术上取得了显著的进步,成为AI视频生成领域的一大亮点。
但是目前想体验还是需要开通12美元的会员~
Solos 是一家专门生产智能眼镜的公司,近日它们推出了 Solos AirGo Vision 智能眼镜,这是全球首款集成 GPT-4o 技术的可穿戴设备,让你随时随地都能体验到人工智能的魅力!
更多功能和特点包括: - 提供实时多语言翻译 - 与 ChatGPT 通过自然对话交互 - 可自行选择镜框。包括日常眼镜、太阳镜和运动太阳镜等样式 - 通过触摸传感器向上或向下更改音量 - 通过虚拟按键一键连接 Solos 智能眼镜 - 通过USB-C 连接口充电 - 具有 IP67 级防水功能,可户外活动佩戴 - 可持续 10 小时播放音乐或 7 小时通话
官网地址:https://solosglasses.com/
今天推荐3个海外行业知识大V,也是我今年特别喜欢看的。
① 第1位是大胡子Leo Becker,在优设微博搜大胡子,可以找到7期经典的AI教程。他的教程质感最好,主要讲一些小知识点,而且极其精炼,看完有醍醐灌顶之感。通常结尾会有他的标志性表情。
② 第2位,就是今天这个视频的主角了,平面设计师Cj Cawley,他的教程更集中在一些观点和节奏“说教”上,所以他的视频通常都用嘻哈说唱铺垫,伴随他风趣并略微夸张的表情,再加上与客户对谈的切换,来传递他的创作观点,譬如本次的视频,他就和用户分享了:不要吐槽你客户多嘴,往往好作品都是和客户一起打造出来的。是属于三观很正的设计师。所以他也是属于接单到手软的平面大佬了。也会经常缅沸为一些项目服务。
③ 第3位,Zander Whitehurst 是一位用户体验师,同时也是一位老板。所以在视频上,可能没有太多时间精雕细琢,但这不妨碍他的内容很好。不过问题是,教程的语速太快,特别是没有翻译的话,看起来有点吃力。
你还关注过哪些行业知识大V?评论区互相分享一下吧!