FLUX.1 | 墨鱼AI

简介

FLUX.1 是由 Black Forest Labs 推出的新一代开源图像生成模型，由 Stable Diffusion 的核心团队成员创立并开发。FLUX.1 在图像质量、文本渲染能力和提示词遵循度方面都达到了业界领先水平，被誉为「开源版的 Midjourney」。该模型提供三个版本：FLUX.1 [pro]（专业版）、[dev]（开发者版）和 [schnell]（快速版），满足不同使用场景的需求。

官网：Black Forest Labs

主要功能

高质量图像生成：基于 Rectified Flow 架构，生成细节丰富、质感出色的图像
卓越的文本渲染：能够准确地在图像中生成清晰的文字和标语
强大的提示词遵循：准确理解复杂提示词，生成符合描述的内容
多版本支持：pro 版质量最高，dev 版平衡性能与质量，schnell 版速度最快
开源可用：[dev] 和 [schnell] 版完全开源，支持本地部署
高分辨率输出：支持生成高达 2MP 的图像，满足专业需求
人像和手部优化：改善了人像生成质量和手部细节表现
风格多样性：支持写实、插画、艺术等多种风格

适用场景

广告设计：生成带有文字的营销海报、产品展示图
品牌视觉：创建 logo 设计、品牌物料、社交媒体配图
内容创作：为文章、博客、视频生成配图素材
电子商务：生成产品展示图、广告 banner、店铺素材
插画与艺术：创作数字艺术、概念设计、插画作品
原型设计：快速生成 UI 设计、产品原型概念图

安装与使用

在线使用

可直接通过以下平台在线体验 FLUX.1：

Replicate - 支持 FLUX.1 [pro] 和 [schnell]
HuggingFace Spaces - 免费体验 [schnell] 版
BriaAI - 商业级图像生成平台

本地部署（推荐硬件配置）

操作系统：Linux（推荐）、Windows 11 (WSL2)、macOS
显卡：NVIDIA GPU（24GB 显存推荐），需支持 CUDA
内存：至少 32GB RAM
硬盘空间：至少 50GB（模型文件约 30GB）
Python 3.10+ 环境

使用 ComfyUI 本地部署

# 安装 ComfyUI（参考 ComfyUI 安装指南）
# 下载 FLUX.1 模型并放入 models/checkpoint 目录

# 模型下载
# FLUX.1 [dev]：https://huggingface.co/black-forest-labs/FLUX.1-dev
# FLUX.1 [schnell]：https://huggingface.co/black-forest-labs/FLUX.1-schnell

# 还需要下载以下文件放入对应目录：
# - ae.safetensors (VAE) -> models/vae
# - flux_text_encoder (文本编码器) -> models/text_encoder
# - flux_sae (特征提取器) -> models/sae

使用 Diffusers 库

# 安装依赖
pip install torch torchvision torchaudio
pip install diffusers transformers accelerate safetensors opencv-python

# Python 代码示例
import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.1-schnell",
    torch_dtype=torch.bfloat16
)
pipe.enable_model_cpu_offload()

image = pipe(
    "A cat sitting on a couch, photorealistic style",
    guidance_scale=0.0,
    num_inference_steps=4,
    max_sequence_length=256,
).images[0]

image.save("flux_example.png")

工具名称	类型	特色	适合人群
FLUX.1	开源/云端	开源最强图像模型、文本渲染优秀	追求高质量和可控性的用户
Stable Diffusion XL	开源/本地	生态成熟、扩展丰富	需要高度定制的用户
Midjourney	闭源/云端	出图质量高、上手简单	不愿配置环境的用户
DALL-E 3	闭源/云端	与 ChatGPT 集成、理解力强	OpenAI 生态用户
Ideogram 2.0	闭源/云端	文本渲染出色、专注设计	需要文字渲染的用户

官网与入口

官网：https://blackforestlabs.ai

模型下载：HuggingFace Black Forest Labs

在线体验：HuggingFace FLUX.1-schnell

API 服务：Replicate、Runway

研究论文：FLUX.1 GitHub

价格与版本

FLUX.1 [schnell]

开源免费，快速生成，商业可用

FLUX.1 [dev]

开源免费，平衡质量与速度

FLUX.1 [pro]

闭源专业版，API 调用，按量计费

本地部署完全免费（[dev] 和 [schnell] 版）。[pro] 版通过 Replicate 等平台 API 提供，费用约 $0.05-$0.1/张。具体价格以各平台为准。

使用技巧

💡

文本生成技巧

FLUX.1 的文本渲染能力出众，将文字放在引号内可获得更准确的文字效果。

⚡

版本选择

快速原型使用 [schnell]，追求质量使用 [dev] 或 [pro]。[schnell] 4 步即可出图，[dev] 建议 20-30 步。

🎯

提示词结构

使用详细具体的描述，包含风格、构图、光照等信息。FLUX 对自然语言理解能力强。

🔄

负面提示词

虽然 FLUX 整体表现优秀，但适当添加负面提示词（如低质量、变形等）可进一步提升质量。

📝

分辨率设置

推荐直接生成目标分辨率，避免拉伸变形。最佳效果在 1024x1024 或类似比例。

🔒

商业使用

[dev] 和 [schnell] 版采用 Apache 2.0 许可证，允许商业使用，但需遵守相关条款。

常见问题

版本FLUX.1 三个版本有什么区别？

[schnell] 速度最快适合快速生成，[dev] 平衡质量与速度适合一般用途，[pro] 质量最高通过 API 提供，适合专业生产场景。

使用FLUX.1 可以商业使用吗？

是的，[dev] 和 [schnell] 版采用 Apache 2.0 许可证，允许个人和商业使用，无需开源衍生作品。

本地本地部署需要什么显卡？

推荐 24GB 显存的 NVIDIA 显卡（如 RTX 4090）。16GB 显存可运行但可能需要优化配置。

文本为什么文字生成不准确？

确保文字用英文引号包围，文字不要太长太复杂。如需生成中文，建议后期用 Photoshop 等工具添加。

质量图像质量不如 Midjourney 怎么办？

尝试更详细的提示词，使用 [dev] 或 [pro] 版，调整采样步数。FLUX.1 在某些风格上可能需要更多调试。

工具哪些工具支持 FLUX.1？

ComfyUI、Stable Diffusion WebUI（通过插件）、Diffusers 库等主流工具都已支持 FLUX.1。

模型如何下载和使用 LoRA？

在 ComfyUI 或 WebUI 中加载 FLUX.1 兼容的 LoRA 模型，注意使用与 FLUX 架构兼容的版本。

更新FLUX.1 还会更新吗？

Black Forest Labs 表示会持续更新 FLUX 系列模型，可关注官方公告获取最新消息。

小结

FLUX.1 的出现标志着开源图像生成领域的重要突破。它不仅在图像质量上达到了业界顶级水平，更重要的是提供了完全开源可用的选择，让更多人能够体验和使用最先进的 AI 图像生成技术。其卓越的文本渲染能力更是填补了开源模型的空白。

推荐对图像质量有较高要求且需要一定可控性的用户尝试。可先通过在线平台体验，再根据需求决定是否本地部署。

简介