图像模式提供文生图(T2I)与图生图(I2I,单张本地图片)能力,输出统一为 base64(默认 image/png),生成多张时串行执行。
- 文生图:仅文本提示词
- 图生图:单张本地图片 + 文本提示词(仅 png/jpeg,≤10MB)
- 输出:base64(默认 image/png)
- 生成张数:1~4(串行,不并发)
- 暂不支持:多图融合、组图、mask/局部编辑、upscale、历史记录、图像模板
- Gemini(image-gemini)
- provider:
gemini - defaultModel:
gemini-2.5-flash-image-preview - apiKey: 复用
VITE_GEMINI_API_KEY
- provider:
- Seedream(image-seedream)
- provider:
seedream - defaultModel:
doubao-seedream-4-0-250828 - apiKey: 读取
VITE_SEEDREAM_API_KEY|VITE_ARK_API_KEY(或process.env.ARK_API_KEY)
- provider:
提示:配置好以上环境变量后,内置图像模型将自动注入并按需启用。
- 顶部导航“高级模式”改为下拉:选择“图像模式”。
- 左侧输入提示词;可选择本地图片(图生图);设置生成张数(1~4)。
- 选择图像模型(来自图像模型管理器)。
- 点击“生成”,右侧显示单图 base64 预览,支持下载与复制。
- 模型管理器新增标签页:“文本模型|图像模型”。
- 图像模型页支持:新增、编辑、启用/禁用、删除。
- 连通性测试:当前版本在图像页暂不提供(后续可考虑快速小图验证)。
- 本地图片:仅
image/png或image/jpeg;大小 ≤ 10MB(前端与后端均有校验)。 - count:1~4,串行执行。
- Seedream 请求固定关闭组图(
sequential_image_generation='disabled'),返回b64_json。
- 核心层:
ImageService+ 适配器(Gemini/Seedream/OpenAI),适配器注册表按 provider 路由。 - UI:
ImageWorkspace.vue为图像模式工作区;通过useImageGeneration调用ImageService。 - 代理与网络:现在仅支持直接访问模型提供商,如在浏览器环境遇到跨域限制,请改用桌面版或自行配置反向代理。