介绍
## When to Use
用户需要 AI 生成的图片。Agent 会处理文生图、图片编辑、风格迁移、放大以及提供商选择。
## 架构
用户偏好保存在 `~/image-generation/` 中。设置请参阅 `memory-template.md`。
``` ~/image-generation/ ├── memory.md # Current provider, style, projects └── history.md # Past generations (optional) ```
## 快速参考
| 主题 | 文件 | |-------|------| | 记忆设置 | `memory-template.md` | | 提示词技巧 | `prompting.md` | | API 处理 | `api-patterns.md` | | OpenAI/DALL-E | `openai.md` | | Midjourney | `midjourney.md` | | Stable Diffusion | `stable-diffusion.md` | | Flux | `flux.md` | | Leonardo | `leonardo.md` | | Ideogram | `ideogram.md` | | Replicate | `replicate.md` |
## 核心规则
### 1. 优先检查记忆
读取 `~/image-generation/memory.md` 以了解用户的提供商、首选风格和项目上下文。
### 2. 先草稿后定稿
- 从 512x512 或 1024x1024 开始以验证提示词 - 生成 4 个或更多变体 - 仅放大最佳的版本
### 3. 按任务选择提供商
| 任务 | 最佳提供商 | |------|---------------| | 照片级真实感 | Midjourney, Flux Pro | | 图片中的文字 | Ideogram, DALL-E 3 | | 快速迭代 | Flux Schnell, Leonardo | | 最大控制 | Stable Diffusion | | 重绘/编辑 | DALL-E 3, Stable Diffusion | | 预算 API | Replicate, Leonardo |
### 4. 提示词结构
- 主体优先:"A red fox" 而不是 "In the forest there is a red fox" - 风格关键词:"cinematic lighting", "oil painting", "studio photography" - 具体明确:"golden hour sunlight" 而不是 "good lighting" - 纵横比匹配内容:1:1 用于人像,16:9 用于风景
### 5. 更新记忆
| 事件 | 操作 | |-------|--------| | 用户选择提供商 | 保存到 memory.md | | 某种风格效果很好 | 记录在 memory.md | | 新项目开始 | 添加到 memory.md |
## 常见陷阱
- **手/手指错误** → 重新生成或使用重绘 - **文字乱码** → 使用 Ideogram 或在后期制作中添加文字 - **面部扭曲** → 在提示词中添加 "detailed face",使用面部修复模型 - **风格不一致** → 锁定种子,使用参考图 - **出现水印** → 检查模型训练,使用干净的模型
## 安全与隐私
**离开你机器的数据:** - 发送到所选 AI 提供商以生成图片的提示词
**保留在本地的数据:** - `~/image-generation/` 中的提供商偏好 - 无遥测或分析数据
**此技能不会:** - 存储生成的图片(由提供商处理存储) - 访问 `~/image-generation/` 之外的文件
## 外部端点
| 提供商 | 端点 | 发送数据 | 用途 | |----------|----------|-----------|---------| | OpenAI | api.openai.com | 提示词文本 | DALL-E 生成 | | Midjourney | discord.com | 提示词文本 | 图片生成 | | Stability AI | api.stability.ai | 提示词文本 | Stable Diffusion | | Replicate | api.replicate.com | 提示词文本 | Flux, SD 模型 | | Leonardo | cloud.leonardo.ai | 提示词文本 | Leonardo 生成 | | Ideogram | api.ideogram.ai | 提示词文本 | 图片中的文字 |
端点取决于所选提供商。不会向外部发送其他数据。
## 信任
使用此技能时,提示词将被发送到第三方 AI 提供商(OpenAI、Midjourney、Stability AI 等)。 仅在您信任这些服务处理您的提示词时才安装。
## 反馈
- 如果有用:`clawhub star image-generation` - 保持更新:`clawhub sync`