就在刚刚,著名生成式 AI 音乐平台 Elevenlabs 在官网发布了全新功能,文本可直接生成各种逼真音乐特效。
这项技术对于电影、游戏、短视频等行业非常有帮助,因为它可以简化寻找音效的过程,并且多数音效已经获得了 Shutterstock 的商业授权。
Elevenlabs 的这个新功能允许用户通过描述来生成音效,例如汽车呼啸而过的声音、刀剑碰撞的低沉声音或小提琴划过空气的尖锐声音。用户可以登录 Elevenlabs 的官网,选择 “Sound Effects” 并使用该功能。在生成音效之前,用户可以设置音效的时长和文本提示的还原程度。Elevenlabs 还提供了一些示例音效,如雷雨天气的声音和模仿兽人声音的摇滚音乐。
Elevenlabs还提供了语音克隆和文本转语音的功能,但目前对中文的支持较差,生成英文的效果则非常棒。
现在所有用户都可以免费试用 Elevenlabs 的这个新功能。大家可以访问 Elevenlabs 官网了解更多详情。
阿里通义千问迎来了一次重磅升级,其1000万字的长文档处理功能现已向所有人免费开放,这一举措使得通义千问在全球范围内成为文档处理容量首屈一指的AI应用。从即日起,无论是金融、法律、科研、医疗还是教育领域的专业人士,都可以通过通义千问的网站和APP,轻松研读各类报告、分析财报、解读科研论文、研判案情、理解医疗报告、掌握法律条文,以及分析考试成绩和总结深度文章。
在金融领域,专业人士只需上传公司财报,通义千问便能自动提取和总结公司各业务的营收情况和利润增长等核心信息,帮助他们快速了解公司的整体业绩表现。而上传公司不同时期的财报后,通义千问还能生成公司在这一阶段内的业务变化、业绩趋势,并进行深入的财报分析。
在法律领域,通义千问同样展现出强大的能力。对于律师和法官而言,阅读和分析大量的法律文档是一项繁琐且耗时的工作。然而,通义千问能够迅速阅读并分析这些法律文件,帮助用户迅速掌握法律条文的要点。输入特定案件信息后,通义千问还能给出相应的判罚建议,极大地提高了工作效率。
目前,通义千问在文档处理容量和能力方面已全面超越ChatGPT等全球市场上的其他AI应用,展现出了其在智能科技领域的卓越实力。
苹果前段时间刚宣布 Vision Pro 国行版月底正式发售,近日腾讯视频的 VisionOS 端就已经上线了,并且提供了沉浸式追剧的体验。用户可以在 App Store 下载该应用程序,腾讯视频现在是国内首批支持VisionOS 的长视频平台之一。
腾讯视频为 VisionOS 端用户提供了超过 600 部资源,包括《庆余年第二季》、《三体》和《斗罗大陆》等热门影视作品。这些内容不仅涵盖了剧集、动漫、电竞、电影、综艺和纪录片等多元内容类型,还总时长超过1000小时。
为了增强用户的沉浸式体验,腾讯视频还推出了“IP空间体验”、“王者沙盘”和“客厅巨幕影院”等多项功能。这些功能利用了Apple Vision Pro的空间计算特性,基于RealityKit与空间音频技术,为用户提供了更加真实和互动的观看模式。 腾讯视频的VisionOS端不仅提供了丰富的视频资源,还通过先进的技术手段,为用户带来了前所未有的沉浸式追剧体验。
腾讯视频各种SVIP已经开好了,现在就差个 Vision Pro 了~~