Одной из самых впечатляющих способностей генеративного искусственного интеллекта, на мой взгляд, является его умение создавать уникальные и невероятные изображения. Эти изображения могут быть воплощением трехмерного мира фантастического будущего в компьютерной игре или быть виртуальной симуляцией окружающего нас мира. Изображения могут быть трехмерными или двумерными, а также могут быть выполнены в различных стилях живописи знаменитых художников разных эпох. Но самое интересное то, что на этих изображениях могут появиться существа или предметы, не существующие в нашем мире, которые тем не менее можно материализовать, добавив текстовое описание в программу Stable Diffusion WebUI Forge и создать нечто новое.
Stable Diffusion WebUI Forge – это совершенно бесплатная программа, которую вы можете загрузить и установить на свой компьютер. Она устроена таким образом, что в нее без особого труда можно добавлять различные модули, которые расширяют ее функциональные возможности. Одними из таких модулей являются модели, при помощи которых создаются изображения.
Сейчас наиболее популярными моделями являются Stable Diffusion, Midjourney и DALL-E. Но, не так давно, появилась невероятно мощная модель FLUX.1.
В середине 2024 года модель FLUX.1 стала прорывной технологией в генеративном искусственном интеллекте, оставив позади себя все остальные модели от лидеров рынка. Десятки интернет-сервисов стали рекомендовать ее как наиболее производительную и эффективную при создании изображений. И, как вы уже поняли, именно этой модели уделяется основное внимание в этой книге.
Модель FLUX.1 была создана бывшими инженерами из компании Stability AI, которые занимались разработкой и развитием знаменитой модели Stable Diffusion1. Робин Ромбах (Robin Rombach), Андреас Блаттманн (Andreas Blattmann), Доминик Лоренца (Dominik Lorenz) и Патрик Эссер (Patrick Esser) объединили свои усилия в работе над новым проектом FLUX.1 и создали новую компанию Black Forest Lab2.
Black Forest Lab изначально предлажила нам три версии модели FLUX.13:
–FLUX.1 [pro] – самая мощная версия реализация коммерческой модели, доступная к использованию через API у партнеров компании или в индивидуальном порядке.
–FLUX.1 [dev] – немного облегченный вариант первой модели не для коммерческого использования. Варианты реализации модели можно найти на сайте huggingface.