FLUX.1
FLUX.1

全新开源图像生成模型,效果惊艳

简介

FLUX.1 是由 Black Forest Labs 推出的新一代开源图像生成模型,由 Stable Diffusion 的核心团队成员创立并开发。FLUX.1 在图像质量、文本渲染能力和提示词遵循度方面都达到了业界领先水平,被誉为「开源版的 Midjourney」。该模型提供三个版本:FLUX.1 [pro](专业版)、[dev](开发者版)和 [schnell](快速版),满足不同使用场景的需求。

官网:Black Forest Labs

主要功能

  • 高质量图像生成:基于 Rectified Flow 架构,生成细节丰富、质感出色的图像
  • 卓越的文本渲染:能够准确地在图像中生成清晰的文字和标语
  • 强大的提示词遵循:准确理解复杂提示词,生成符合描述的内容
  • 多版本支持:pro 版质量最高,dev 版平衡性能与质量,schnell 版速度最快
  • 开源可用:[dev] 和 [schnell] 版完全开源,支持本地部署
  • 高分辨率输出:支持生成高达 2MP 的图像,满足专业需求
  • 人像和手部优化:改善了人像生成质量和手部细节表现
  • 风格多样性:支持写实、插画、艺术等多种风格

适用场景

  • 广告设计:生成带有文字的营销海报、产品展示图
  • 品牌视觉:创建 logo 设计、品牌物料、社交媒体配图
  • 内容创作:为文章、博客、视频生成配图素材
  • 电子商务:生成产品展示图、广告 banner、店铺素材
  • 插画与艺术:创作数字艺术、概念设计、插画作品
  • 原型设计:快速生成 UI 设计、产品原型概念图

安装与使用

在线使用

可直接通过以下平台在线体验 FLUX.1:

本地部署(推荐硬件配置)

  • 操作系统:Linux(推荐)、Windows 11 (WSL2)、macOS
  • 显卡:NVIDIA GPU(24GB 显存推荐),需支持 CUDA
  • 内存:至少 32GB RAM
  • 硬盘空间:至少 50GB(模型文件约 30GB)
  • Python 3.10+ 环境

使用 ComfyUI 本地部署

# 安装 ComfyUI(参考 ComfyUI 安装指南)
# 下载 FLUX.1 模型并放入 models/checkpoint 目录

# 模型下载
# FLUX.1 [dev]:https://huggingface.co/black-forest-labs/FLUX.1-dev
# FLUX.1 [schnell]:https://huggingface.co/black-forest-labs/FLUX.1-schnell

# 还需要下载以下文件放入对应目录:
# - ae.safetensors (VAE) -> models/vae
# - flux_text_encoder (文本编码器) -> models/text_encoder
# - flux_sae (特征提取器) -> models/sae

使用 Diffusers 库

# 安装依赖
pip install torch torchvision torchaudio
pip install diffusers transformers accelerate safetensors opencv-python

# Python 代码示例
import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.1-schnell",
    torch_dtype=torch.bfloat16
)
pipe.enable_model_cpu_offload()

image = pipe(
    "A cat sitting on a couch, photorealistic style",
    guidance_scale=0.0,
    num_inference_steps=4,
    max_sequence_length=256,
).images[0]

image.save("flux_example.png")

同类工具对比

工具名称 类型 特色 适合人群
FLUX.1 开源/云端 开源最强图像模型、文本渲染优秀 追求高质量和可控性的用户
Stable Diffusion XL 开源/本地 生态成熟、扩展丰富 需要高度定制的用户
Midjourney 闭源/云端 出图质量高、上手简单 不愿配置环境的用户
DALL-E 3 闭源/云端 与 ChatGPT 集成、理解力强 OpenAI 生态用户
Ideogram 2.0 闭源/云端 文本渲染出色、专注设计 需要文字渲染的用户

官网与入口

官网:https://blackforestlabs.ai

模型下载:HuggingFace Black Forest Labs

在线体验:HuggingFace FLUX.1-schnell

API 服务:ReplicateRunway

研究论文:FLUX.1 GitHub

价格与版本

FLUX.1 [schnell]
开源免费,快速生成,商业可用
FLUX.1 [dev]
开源免费,平衡质量与速度
FLUX.1 [pro]
闭源专业版,API 调用,按量计费

本地部署完全免费([dev] 和 [schnell] 版)。[pro] 版通过 Replicate 等平台 API 提供,费用约 $0.05-$0.1/张。具体价格以各平台为准。

使用技巧

💡

文本生成技巧

FLUX.1 的文本渲染能力出众,将文字放在引号内可获得更准确的文字效果。

版本选择

快速原型使用 [schnell],追求质量使用 [dev] 或 [pro]。[schnell] 4 步即可出图,[dev] 建议 20-30 步。

🎯

提示词结构

使用详细具体的描述,包含风格、构图、光照等信息。FLUX 对自然语言理解能力强。

🔄

负面提示词

虽然 FLUX 整体表现优秀,但适当添加负面提示词(如低质量、变形等)可进一步提升质量。

📝

分辨率设置

推荐直接生成目标分辨率,避免拉伸变形。最佳效果在 1024x1024 或类似比例。

🔒

商业使用

[dev] 和 [schnell] 版采用 Apache 2.0 许可证,允许商业使用,但需遵守相关条款。

常见问题

版本FLUX.1 三个版本有什么区别?
[schnell] 速度最快适合快速生成,[dev] 平衡质量与速度适合一般用途,[pro] 质量最高通过 API 提供,适合专业生产场景。
使用FLUX.1 可以商业使用吗?
是的,[dev] 和 [schnell] 版采用 Apache 2.0 许可证,允许个人和商业使用,无需开源衍生作品。
本地本地部署需要什么显卡?
推荐 24GB 显存的 NVIDIA 显卡(如 RTX 4090)。16GB 显存可运行但可能需要优化配置。
文本为什么文字生成不准确?
确保文字用英文引号包围,文字不要太长太复杂。如需生成中文,建议后期用 Photoshop 等工具添加。
质量图像质量不如 Midjourney 怎么办?
尝试更详细的提示词,使用 [dev] 或 [pro] 版,调整采样步数。FLUX.1 在某些风格上可能需要更多调试。
工具哪些工具支持 FLUX.1?
ComfyUI、Stable Diffusion WebUI(通过插件)、Diffusers 库等主流工具都已支持 FLUX.1。
模型如何下载和使用 LoRA?
在 ComfyUI 或 WebUI 中加载 FLUX.1 兼容的 LoRA 模型,注意使用与 FLUX 架构兼容的版本。
更新FLUX.1 还会更新吗?
Black Forest Labs 表示会持续更新 FLUX 系列模型,可关注官方公告获取最新消息。

小结

FLUX.1 的出现标志着开源图像生成领域的重要突破。它不仅在图像质量上达到了业界顶级水平,更重要的是提供了完全开源可用的选择,让更多人能够体验和使用最先进的 AI 图像生成技术。其卓越的文本渲染能力更是填补了开源模型的空白。

推荐对图像质量有较高要求且需要一定可控性的用户尝试。可先通过在线平台体验,再根据需求决定是否本地部署。

Relevant Sites