手把手教学！Deepseek Janus 生图模型安装流程+核心功能解析

2025/03/07 推荐： 果汁阅读 1.6w 评论有奖阅读本文需 9 分钟

手把手教学！Deepseek Janus 生图模型安装流程+核心功能解析

一、Janus 模型介绍

Janus 是深度求索（DeepSeek）公司开源的多模态大模型，主打 AI 图像生成与 AI 图像识别，支持文生图、图生文等多模态交互，属于其 AGI 技术布局中的关键产品之一。（简而言之：一个能画图、能识图、开源可定制的 AI 模型）

GitHub 代码库： https://github.com/deepseek-ai/Janus

更多DeepSeek干货：

强到离谱！如何用DeepSeek快速搞定3D建模+PPT+短视频？

在设计领域，效率与创意是永恒的追求。

阅读文章 >

二、Janus 模型在线使用

1. 图像识别（图生文）

① 使用魔法网络打开网址： https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B ，选多模态识别，红色箭头位置上传图片，QUESTION 处写上 explain this picture（解释这个图片）点击 CHAT 即可。

② 使用魔法网络稍等片刻，Response 即可显示图片识别的结果。

③ 也可以使用早期版本来做图像识别

Janus 1.3B「图像识别」 https://huggingface.co/spaces/deepseek-ai/Janus-1.3B

JanusFlow-1.3B「图像识别」 https://huggingface.co/spaces/deepseek-ai/JanusFlow-1.3B

2. 图像生成（文生图）

① 打开网址： https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B ，选文生图，红色箭头位置写提示词，绿色箭头位置点击即可生成图片

手把手教学！Deepseek Janus 生图模型安装流程+核心功能解析

② 稍等片刻，即可显示图片生成的结果。

手把手教学！Deepseek Janus 生图模型安装流程+核心功能解析

三、Janus 模型本地使用

三个步骤请按顺序执行，如果那个步骤已经安装对应软件可忽略此步骤。

1. 安装 ComfyUI

详见：

喂饭级教程！ComfyUI本地部署超详细指南

大家好，欢迎来到本节的 ComfyUI 课程！

阅读文章 >

2. 安装插件

① 打开 COMFYUI 右上角的管理器，然后选择节点管理

② 打开魔法网络。搜索 JANUS，三选一，点击 INSTALL 安装即可

网址：

3. 安装模型

模型将在首次运行时自动下载。如果下载失败必须手动下载模型。
下载 https://huggingface.co/deepseek-ai/Janus-Pro-7B/tree/main所有文件并复制到 ComfyUI\models\Janus-Pro\Janus-Pro-7B 文件夹。
下载 https://huggingface.co/deepseek-ai/Janus-Pro-1B/tree/main所有文件并复制到 ComfyUI\models\Janus-Pro\Janus-Pro-1B 文件夹。
提供 1B（10 亿参数）和 7B（70 亿参数）两种规模模型，适配不同算力需求，并允许开发者自由使用及二次开发模型。

4. 图像识别（图生文）

打开工作流文件，红色箭头处选择 Janus-Pro-1B 模型，绿色框位置写上图像提示词，提示词支持中文/英文详细描述图片的内容，输出要求: 一份中文描述, 一份英文描述

5. 图像生成（文生图）

打开工作流文件，红色箭头处选择 Janus-Pro-1B 模型，绿色框位置写上生成图像的提示词，提示词支持英文

手把手教学！Deepseek Janus 生图模型安装流程+核心功能解析

四、Janus 模型资料

1. Janus 模型版本介绍

一共有三个版本，Janus-Pro 为最新模型。

① Janus-Pro：通过数据和模型缩放统一多模态理解和生成

Janus-Pro 是之前作品 Janus 的高级版本。具体而言，Janus-Pro 包含优化的训练策略、扩展的训练数据以及扩展至更大的模型尺寸。通过这些改进，Janus-Pro 在多模态理解和文本-图像指令遵循能力方面都取得了显著进步，同时还增强了文本-图像生成的稳定性。

② Janus：解耦视觉编码，统一多模态理解和生成

Janus 是一个新的自回归框架，统一了多模态理解和生成。它通过将视觉编码解耦到单独的路径中来解决以前方法的局限性，同时仍然使用单个统一的 Transformer 架构进行处理。这种解耦不仅消除了视觉编码器在理解和生成过程中的角色冲突，而且增强了框架的灵活性。Janus 超越了以前的统一模型，并匹配或超过特定任务模型的性能。Janus 的简单性、高度灵活性和有效性使其成为下一代统一多模态模型的有力候选者。

手把手教学！Deepseek Janus 生图模型安装流程+核心功能解析

③ JanusFlow：协调自回归和校正流，实现统一的多模态理解和生成

JanusFlow 引入了一种极简架构，将自回归语言模型与整流流集成在一起，整流流是生成建模中最先进的方法。我们的关键发现表明，整流流可以直接在大型语言模型框架内训练，无需复杂的架构修改。大量的实验表明，JanusFlow 在各自的领域中实现了与专用模型相当或上级的性能，同时在标准基准测试中显著优于现有的统一方法。这项工作代表了向更有效和通用的视觉语言模型迈出的一步。

手把手教学！Deepseek Janus 生图模型安装流程+核心功能解析