大白(●—●) 邀你回答

2024/04/10

一键自动写影评，谷歌重磅发布Gemini 1.5 Pro，功能太强大了吧？

4月10日凌晨，谷歌在官网正式发布了Gemini1.5Pro，现在可在180多个国家/地区使用。

Gemini 1.5 Pro 不仅能够生成创意文本和代码，还能理解、总结上传的视频和音频内容，并且支持高达100万tokens的上下文。

在Google AI Studio开发平台中，用户可以免费试用Gemini 1.5 Pro，并且它支持中文提示。这使得用户能够通过简单的操作，上传视频或音频文件，并获取内容的深度总结。例如，用户可以上传一个视频并询问影片的内容，Gemini 1.5 Pro能够快速解析并提供答案。

Gemini 1.5 Pro还提供了音频理解功能，能够快速解析音频文件并总结其内容。这对于需要处理大量视频和音频内容的用户来说，无疑是一个巨大的帮助，因为它可以节省大量的时间。

谷歌还对Gemini API进行了性能优化，包括系统指令、JSON模式以及函数调用优化，这些改进显著提升了模型的稳定性和输出能力。系统指令功能允许用户根据特定需求控制模型的行为，JSON模式可以帮助开发者从文本或图像中提取结构化数据，而函数调用优化则支持开发者实现更全面的查询响应。

详情点此查看:
https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html

音频理解能力:
https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb

AI神器 Gemini Gemini 1.5 Pro 人工智能谷歌设计

收藏 关注话题 点赞 17

立即查看 AI神器的解决方案

新手科普！常用的Stable Diffusion模型与提示词总结

AIGC AI创作阅读 8.7w

查看详情

优设问答有问必答 👉 回答问题赢奖品

11分钟阅读

16分钟阅读

9分钟阅读

11分钟阅读

{{comTitle}} {{comSubtitle}}

菜单 优设网uisdc.com 优设网 - 学设计上优设

您还未登录

登录后即可体验更多功能

大白(●—●) 邀你回答

立即查看 AI神器 的解决方案

AIGCAI创作阅读 8.7w

Wo~本文的评论还空着，快来抢沙发

邀你回答

2024 年全球最具创新能力的 50 家公司盘点，哪家才是你心中的 No.1 ？

< 上一篇

5.9k 设计师围观了该问题

设计师发布自己的作品算不算侵权？

下一篇 >

数字生命卡兹克

薛志荣

夏花生

京东JellyDesign

程远

优设读报 2025年04月16日 星期三

OpenAI 发布 GPT-4.1系列模型：能力全面超越前代

可灵 AI 全系模型进入 2.0 时代：视频生成技术实现革命性突破

智谱AI启用全新域名 Z.ai，并开源 32B/9B 系列 GLM 模型

阿里云旗下 AI 开源社区魔搭上线 MCP 广场

月之暗面 Kimi ai 将推出内容社区，开启用户互动新模式

近期热门问题

做个小调查，你希望优设网新增哪项新功能？

42位设计师参与回答

听说山西的午休是要写进合同的，你们公司有多长时间的午休呢？

7位设计师参与回答

优设桌面摆件，IP小黄鸡原创桌面立牌上新啦！

7位设计师参与回答

为什么上个班硬是上出了结婚的感觉？

6位设计师参与回答

求职找工作，这些潜台词你一定要知道！

6位设计师参与回答

大龄失业了怎么办？这9条建议很中肯的！

6位设计师参与回答

优设官方微信群

添加管理员 招财

微信号: 扫码添加

严格审核打造高质量交流群