ChatGPT 的强大相信大家都体验过了,近日,微软推出了更为强悍的全能型 AI--Kosmos-1。ChatGPT 是纯文本 LLM,而它是更强大的多模式大型语言模型(MLLM)。研究人员在他们的学术论文中写道:“作为智能的基本组成部分,多模态感知是实现人工智能的必要条件”。Kosmos-1 论文中的视觉示例显示模型分析图像并回答有关图像的问题,从图像中读取文本,为图像编写标题,并以 22-26% 的准确度进行视觉智商测试。
微软表示,它计划向开发人员提供 Kosmos-1,大家可以期待一下哦~