1月23日,支付宝宣布“集五福”升级为“五福节”,第一阶段为五福年货节,已于1月10日启动;第二阶段为大家最熟悉的集五福,将于1月29日正式开启;第三阶段为过年天天乐,在大年初一推出。
四大AI玩法是今年最大的亮点,包括:
1、飙戏小剧场 2、会说话红包 3、时空照相馆 4、大家来找福
除了年三十集齐五福分5亿奖金的保留节目,整个五福节期间用户还可以在支付宝上看短视频、参与评论、打榜等方式瓜分3亿红包。今年,除了合成五福卡兑换奖金,多余的福卡还可以在近300个商家小程序里兑换好礼。
另外,五福节期间,支付宝将举办52场“五福节创作者挑战赛”,在现有的创作者分成计划外,额外投入超2500万现金奖励优质内容创作者。
你对集福活动感兴趣吗?今年还会继续参与吗?
谷歌在官网宣布,在谷歌浏览器(Chrome最新版本M121)中新增自动生成文本、壁纸以及自动管理标签3个全新生成式AI功能。
1、文本生成 你是否还为发帖子、写美食感想、购物评论而烦恼?谷歌浏览器最新版本将新增类似的ChatGPT文本生成功能。 使用方法:用户只需右击谷歌浏览器中访问的任何网站上的文本框,然后选择“帮助我编写”。输入文本提示词,例如,写一篇关于地方美食的攻略。
2、壁纸生成 谷歌在Android 14和Pixel 8设备上推出了生成式AI壁纸,受到了极大欢迎。现在,谷歌将文本生成图像功能内置到谷歌浏览器中,帮助用户打造个性化壁纸。 AI将根据你选择的主题、情绪、视觉风格和颜色,快速生成壁纸,帮助你打造绚丽多彩的浏览器。
3、标签管理 我们在使用谷歌浏览器时可能会打开几十个甚至上百个网站,管理这些标签相当麻烦。 现在,借助全新的AI标签管理器,可以根据旅行、科学研究、购物等进行自动分类。 使用方法:右点选择标签管理器,然后点击搜索标签组,标签管理器会根据网站的类型自动创建管理组,用户只需点击创建即可完成。
Chrome 应该是为数不多支持生成式AI的浏览器。但是由于这三项功能处于预览测试阶段,企业和教育账户无法使用。如果正式上线,大家觉得哪一项功能最实用呢?
昨天在优设读报刷到的这个工具,试玩了一下,感觉还蛮有意思的,比较适合做微信头像(不是很会用,就感觉拿来生成卡通的头像太合适了)
PhotoMaker 是腾讯推出的一款真实人像生成工具,快速逼真,效果自然。
功能包括: 1. 利用多张照片作为身份ID,获取人物特征,然后创造出一个新的、个性化的人物图像。
2.把几个不同人的照片特征混合在一起,创造出一个全新的人物形象。
3. 能改变照片人物的性别、年龄和生成多种风格的其他照片。Huggingface上有Demo,试了一下的确可以精准还原人脸特征。
大家有体验过了吗?感觉怎么样呢?
AI商品图,类似的AI工具有不少,这里给大家简单整理下我自己使用过的,不全面,欢迎补充评价。
01 AI设计师|AI商品图生成器 网址:https://www.logosc.cn/design/
⭐️功能特点: 1.上传任意产品图片,智能抠图美化; 2.直接给你的产品生成上百种商品场景图,所见即所得,挑选喜欢的样式进入AI编辑; 3.支持AI生成背景,如果没有满意的效果,可以直接自己生成原创背景图,支持文字prompt或上传图片生成相似背景图
02 Claid AI拍摄商品图 网址:https://claid.ai/
生成产品图是一款自动创建和优化电子商务图片的工具。无论是提高分辨率、移除背景,还是制作高质量的能够提高转化率的AI照片,Claid AI都能够胜任。通过在线平台和API,您可以轻松地提升产品图片的质量和吸引力。
03 Photoroom生成商品图背景 网址:https://www.photoroom.com/zh/tools/instant-backgrounds
功能特点: 1. 瞬间背景生成:Photoroom能够快速生成逼真的产品图片背景,使您的商品照片看起来更加专业和吸引人。 2. AI技术支持:Photoroom利用先进的人工智能技术,通过自动抠图和背景替换,让您的商品图片与背景融合自然,达到专业水平。 3. 平台无关性:无论您使用的是哪种平台,Photoroom都能够适应您的需求并生成与平台相匹配的产品图片。
04 Pebblely宝贝丽 网址:https://pebblely.com/zh/
自动抠图,并根据您的要求生成不同的背景,打光,映射和阴影效果,让您的产品更加生动和吸引人。 拥有20种默认主题,您也可以自定义您想要的场景,如早晨的光,空灵的氛围,柔和的色调等。 可以调整场景图的大小,并扩展您的图像至任意尺寸,适用于多种媒体,如Instagram故事,Facebook帖子,电子邮件横幅,主页图像,广告照片等。 还可以使用AI编辑生成的图像,如添加多个产品,修改图像细节,重复使用背景等。
Magnific AI 是一款图像 AI 增强工具,最近刚发布了全新功能,可以将任何图像放大并增强至10000x10000像素。
大家应该都知道4K超清吧?就是那种有4096像素的。但Magnific AI这玩意儿更厉害,能把一张只有600像素、糊得跟智障似的图片,几分钟内变成10K的超清图片。
你没听错,不是4K,也不是8K,是10K!
就是那种本来模模糊糊的图片,经过它一加工,怎么放大都清晰得跟啥似的。
感兴趣的小伙伴可以体验一下,我感觉是最强的图像处理AI工具了:Magnific AI
更加让我觉得离谱的是,这个 Magnific AI 只有两个人。这就是AI时代的变革吗?MidJourney在爆火的时候,11个人。PIKA在爆火的时候,4个人。Magnific AI在爆火的时候,2个人。这是不是有点儿一人能抵千军万马的意思了?
Github 上的一个名为 OpenVoice 的 AI 语音克隆项目爆火,该项目由 myshell-ai 开源,仅开源了不到三周,就有了 6.1k 的 star。
OpenVoice能对声音风格的精细控制,包括情感、口音、节奏、停顿和语调,同时能够复制参考发言者的音色。
主要功能: - 准确的音色克隆:OpenVoice能够精确地克隆参考音色,并在多种语言和口音中生成语音。 - 灵活的声音风格控制:用户可以控制生成语音的情感和口音,以及其他风格参数,如节奏、停顿和语调。 - 零样本跨语言声音克隆:OpenVoice可以在未包含在大规模多语言训练集中的任何语言之间进行声音克隆。
试玩地址: https://github.com/myshell-ai/OpenVoice
熟悉 Midjourney、Stable Difusion 等 AI 绘画工具的朋友可能遇到这样一个问题:在图像中生成或嵌入精确的文本可能会比较困难。
现在不必太担心了,阿里巴巴集团的研究人员已经开源了一款名为 AnyText 的多语言视觉文字生成与编辑模型。
AnyText在生成文字方面的控制能力可以媲美专业的PS,用户可以自定义文字出现的位置,以及图片的强度、力度、种子数等参数。
目前,它在Github上已经获得了超过2,400颗星的好评。并且 AnyText 可以作为插件无缝集成到其他开源扩散模型中,从而全面增强了图像嵌入精准文本的能力。
今年接触了太多 AI 工具了,AI 绘画的先不说,光是视频生成就已经让我震惊不已。今天刷到了一个 VideoPoet 作者的专访,分享的一些关于视频生成领域的观点非常有意思,其中关于视频生成领域的 “ChatGPT 时刻”的解读前瞻性十足,大家感兴趣的可以了解一下!
以下是引用: “ 视频生成的“ChatGPT 时刻”,我觉得大概是,哪怕模型生成的还是比较短的片段,比如 2-5s,但这个生成是可控的,人类也很难分辨是 AI 生成还是人类制作。从用户角度,只需要几美分的代价,就能获得一个可以被送到好莱坞专业 studio 的样片。如果类比的话,可以类比到图像领域 stable diffusion 1.x 或 2.x 版本,肯定还有再提升的空间,但已经到了能使用的程度,而且能激发很多应用。
我的预测是,到 2024 年底或 2025 年初,我们可能会到这个时刻。并且我认为,实现这个时刻肯定也需要 diffusion 参与,并且 diffusion 在未来一段时间,比如 1 到 2 年内,可能仍然是主流,扮演很重要的角色。这里说的 diffusion 已经包含了 transformer。
“ChatGPT 时刻”意味着模型到了一个相对稳定的阶段,但后面还会再改,只不过是在这个基础上做小的改动,可能一开始版本只能做到逼近好莱坞,有一些缺点,但可以商业化运用了,但要达到真正稳定需要更长时间。随后还可能仍会迭代升级。
现在市场上所有的视频生成都达不到这个标准,所以我认为视频生成的方法可能还需要进一步迭代,有可能要达到“ChatGPT 时刻”需要新的模型和方法,它不一定是全新的模型或者架构,可能是现在市场上的某个技术路线或者方案再往前走一步。”