На Civitai один из выложенных по каскаду воркфлоу содержит таблицу разрешений, очень удобно. Собственно про сам каскад на сегодняшний день, это пока, если сравнивать с играми, бета версия. Модель по сути одна, хотя и состоит из отдельных частей, о чем показано в видео. Лор нет, ничего нет, населена роботами...но умеет работать со встроенными в Комфи стилями. Причем интересно, что ноды для стилей подходят только от SD. На XLевской вылазит та же ошибка совместимости с SD моделью, что и на обычной версии. Я так понял - основа SD? По поводу использования видео памяти, на 8 все работает примерно так же как и на стандарте. Ни о каких больше 8гб речи нет. Но интересное происходит в нагреве видеокарты, при гораздо большей длительности генерации в каскаде температура ниже. Если при стандарте доходит до 72, то здесь не выше 57., хотя может и от видюхи зависит. Что касается качества... добиться результатов на подобии того, что представлено в качестве примеров на странице каскада, не получилось. Скорее всего просто терпения не хватило разобраться, очень уж долго каскад генерирует, в итоге получается что то не слишком естественное. Ну и самое главное, на данный момент каскад не понимает того что понимает та же XL.То есть один и тот же промт в каскаде требует уточнять многие детали дополнительно. Наследие SD модели? Понимание сути из общей фразы, например когда в качестве промта пишешь текст стихов или песни, тут каскад смог справиться на хорошем уровне. Суть улавливает и это уже есть гуд. Теперь пальцы, руки, ноги... Мало тестировал по причинам указанным выше, но в том что было криминала не увидел. Но если вы генерируете персонажа с предметом в руке (не с тем что вы подумали, каскад пока что в ЭТО не умеет никак), то готовьтесь к арсеналу как из мемной фотки с десантником. Если предмет в одной руке. то персонаж держит его правильно зажав пальцы. Если нужен предмет во 2й руке, то этот доп предмет слетает с позиционирования. В итоге, продукт пока сырой, слишком массивный из-за структуры, когда нужны по сути 4 модели в одной пачке- VAE (он же а). b, c, CLIP и все это весит от 6 до 14гб по отдельности (интересно кто будет заморачиваться с созданием новых моделей в таком случае), требующий изначально минимум 2 прохода генерации по KSampler-у, помимо всех прочих обработок, что влияет существенно на время работы. А прибавьте сюда всяких обработчиков-улучшайзеров, да с контролнетами, да поболее, да что бы все в одном... В общем ждем оптимизацию и доработки.
@@user-ej2lm9vo5m с лорами мне не нужна новая нейронка, мне бы хотелось чтоб как они рекламируют - в один клик норм фотка, а не полчаса потом еще допиливать чем то, надоели костыли.
Подскажите, а можно ли нейросетью генерить надписи с красивыми шрифтами ? И если "да", то с помощью каких бесплатных нейросетей это возможно ? Stable Diffusion умеет такое ?
@@TURBINSKIY посмотрел, что в плане шрифтов умеет Adobe Firefly. Сильно в детали не вдавался, но, исходя из того, что увидел - это не то, что нужно, увы. Он, как я понял, генерит не стили и разновидности шрифтов, а заливку одного и того же шрифта разными графическими паттернами - шоколадками, грибочками, нитками, чешуёй и т.п. А нужна именно генерация надписей разными шрифтами - то, чего я не увидел в FireFly. (заливать паттернами сами буковки, конечно, тоже имеет значение, но это уже на втором месте).
С большими разрешениями (15360*4320 с параметром "very good highly ultra‑detailed 16K" (но, требуется большое кол-во RAM, при 64Gb бывает в SWAP скидывает порядка 20Gb, при 128Gb SWAP не задействован, но оператива грузится на 80-90Gb; еще так-же, средствами реестра и BIOS расширена VRAM за счет RAM, хоть чуть-чуть лучше и стабильней работает, хотя 2-е видюшки, 2080 под нейросеть задействую и вспомогательная на 2-ой монитор RX5800XT, уже фильмы и прочее смотрю; единственное что плохо, в "Фокусе" не могу полностью проц задействовать, SD задействует и грузит проц на 70-80%, "Фокус" 2-5%, максимум до 10% (но это если еще и играть во что-то параллельно), было-бы идеально, задействовать Nv+Ati+CPU - но как это сделать...???)) пока единственное, что корректно может работать это "Fooocus". Все остальное, сколько не пробовал, огромные искажения и артефакты. Особенно с конечностями и лицами. Ну и конечно, размытость, расфокусировка, наложение.
Установил себе попробовать версию, которая типа "в один клик". Встала без проблем. Интерфейс минимальный, но настроек там нет. По умолчанию было 1024х1024 и при 16гб оперативки и 16гб видео больше не смог ничего сгенерировать. Из 16гб забирает практически всё. У меня только после загрузки оболочки уже занято 13.7гб видео памяти. От результата хотелось получить "ВАУ!" Но на первый взгляд никаких плюсов не увидел. По скорости дольше, картинка похуже и только полное потребление ресурсов компьютера. Это заметно сразу. Может допилят, но пока по ресурсы-скорость-качество у меня Forge потом А1111 остальное на вкус и цвет😊😊😊
Я немного тестировал каскаду. Она лучше понимает промпт и получить с её помощью более сложную композицию легче. Как по мне это попытка приблизиться к миджорни в плане соответствия между подсказкой и результатом. До Dall E 3 всё ещё далеко.
народ, подскажите плиз: при генерации выдает ошибку CUDA out of memory, 8gb видеокарта 3070ti, 16 гигов оперативки. Кто-нибудь сталкивался с такой ошибкой?
Я не понимаю, для чего они делают нейронки которые генерят типа высокое разрешение, если sd 1.5 с апскеллером выдает такой же результат? Неужели нельзя было дальше простую sd развивать? (сам пользуюсь Delibrate)
Ваше непонимание совершенно понятно. Оно кроется в неспособности видеть, анализировать изображения и воспринимать элементарные отличия деталей. Также понимать отличия общего и частного. Проще говоря, примитивная нейронка в вашей голове не позволяет проводить сравнительные визуальные операции.
@@funnyfun9017 инпайнт отдельных участков решает эту проблему. Если конечно cascade без косяков бы рисовала сразу то было бы норм. А так и в том и другом случае все равно косяки исправлять. (Даже в видео 4-7 пальцев в конце эт несерьезно) А генерация на каскаде медленней.