Тёмный

Nuevo STABLE DIFFUSION 3... ¿Mejora a Dall-e 3 y Midjourney? 🚀 

Xavier Mitjana
Подписаться 221 тыс.
Просмотров 22 тыс.
50% 1

Stability presenta Stable Diffusion 3 y libera Stable Cascade. ¡Nuevos reyes en la generación de imágenes?
Recibe toda la INFO de mi NUEVA ACADEMIA 👉 bit.ly/curso_ia_
📕 Descarga mi guía gratuita para crear contenido con IA:
👉 snip.ly/guia-IA
ENLACES DEL VÍDEO
👉 Prueba Stable Cascade: huggingface.co/spaces/multimo...
👉 Noticia Stable Cascade: stability.ai/news/introducing...
👉 Noticia Stable Diffusion 3: stability.ai/news/stable-diff...
---
MARCAS DE TIEMPO
00:00 Stability Despierta
00:37 Stable Cascade
07:57 Stable Diffusion 3
---
✅ SUCRÍBETE A MI CANAL: bit.ly/suscribirse_XM​​​​
📕 Descarga mi guía gratuita para Stable Diffusion:
👉 snip.ly/guia-IA
---
Instagram: / xavier_mitjana
Twitter: / xavier_mitjana
Contacto comercial: xavmit.yt@gmail.com
*Al realizar una compra a través de cualquiera de estos enlaces de afiliado, recibimos una comisión muy pequeña sin costo adicional para ti. Esto me ayuda a hacer el canal sostenible y seguir ofreciendo contenido de calidad.
#inteligenciaartificial

Наука

Опубликовано:

 

21 июл 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 81   
@XavierMitjana
@XavierMitjana 3 месяца назад
👉 Recibe toda la INFO de mi NUEVO CURSO: bit.ly/curso_ia_
@RhillEnglish
@RhillEnglish 4 месяца назад
¡Impresionante avance en generación de imágenes! Stable Diffusion 3 parece llevar la calidad y eficiencia al siguiente nivel. ¡Gracias por compartir este análisis detallado y comparativo! 👏👏
@jccluaviz
@jccluaviz 4 месяца назад
Expectacular como siempre. Ya tengo los dientes largo por poder probar pronto Stable Diffusion 3. Ojola dentro de Comfyui.
@ConsejoMillonario2.0
@ConsejoMillonario2.0 4 месяца назад
Este si es un canal informativo con criterio propio 🥳
@juancarlos-zx4et
@juancarlos-zx4et 4 месяца назад
GR BRO excelente tus videos y tus comentarios 👌
@rikardobrunno4925
@rikardobrunno4925 5 месяцев назад
podrias por favor hacer un video actualizado de la instalación de este programa? en verdad es complicada la instalación, yo tengo varios años instalado programas sin ningún problema pero instalar esto es un dolor de bolas
@MarcoEscobedo10
@MarcoEscobedo10 5 месяцев назад
Instala Stable diffusion Forge es mas sencillo, es igual y mas actual
@Genshi-studio
@Genshi-studio 4 месяца назад
Esto se puede instalar en automatic1111?
@paulocastroverbena722
@paulocastroverbena722 5 месяцев назад
Me gustó mucho la forma como va configurando la imagen. Me pareció como que se fuera pintando. Gracias por compartir. Realmente fue bastante rápida la herramienta.
@XavierMitjana
@XavierMitjana 5 месяцев назад
Sí, la verdad es que es muy curioso el modo en como la va generando como en una grilla. Y lo mejor es que funciona muy bien.
@peladocontrenzas1061
@peladocontrenzas1061 4 месяца назад
Increíble y meritorio el trabajo que está haciendo Stable con estos 2 modelos. A mi me gustó más el Cascada por la velocidad, pero también por ver como se va generando la imagen (le da un plus). Ojalá los liberen ambos para uso comercial. Gracias Xavier por tenernos al tanto. Saludos.
@fabricandocicloturistas6305
@fabricandocicloturistas6305 4 месяца назад
Gracias por la informacion
@gamenoob1815
@gamenoob1815 5 месяцев назад
Muy buena información
@TioYesi
@TioYesi 5 месяцев назад
Hola!. Otro interesante video. Tengo una pregunta " puedo mostrarle una fotografía propia y pedirle que haga tal y cual ?. Muchas gracias. Saludos cordiales desde Chile
@videosfeoscomotucara9038
@videosfeoscomotucara9038 5 месяцев назад
Gracias maestro, like
@cesarchirinos007
@cesarchirinos007 Месяц назад
Cuál nos recomiendas de todos los programas?
@darioloco25
@darioloco25 4 месяца назад
Xavier, podrías explicarnos por qué es tan importante dominar el modelo de generación de imágenes? La generación de imágenes, a diferencia de los generadores de lenguaje, tienen un target de uso bastante puntual. El mundo entero podría usar a diario un generador de lenguaje, pero no un generador de imágenes, siendo así, ¿por qué se invierte tanto en ello?
@XavierMitjana
@XavierMitjana 4 месяца назад
Hombre, la generación de imágenes aunque sea un poco más nicho que los modelos de lenguaje mueve industrias que mueven miles de millones: comunicación, moda, cine, videojuegos. Vamos, que no creo que haya duda de que incentivos hay para desarrollarla.
@studiorodich
@studiorodich 4 месяца назад
No le veo mejor calidad, esperemos que lo mejoren, suena bien. Utilizo SDXL y crea imágenes 10 veces mejor que Cascade, sin dudas. Ojalá de buenos resultados y que le hagan competencia a SORA.
@XxQuidanxX
@XxQuidanxX 4 месяца назад
Este modelo es nuevo mientras xl es uno viejo pero más afinado
@alexisdawn6255
@alexisdawn6255 5 месяцев назад
SD logró entrar a la competición con Dall-e 3 y Midjourney, eso sin mencionar que es OpenSource y gratis, en un tiempo más los va a superar en definitiva.
@canaljoseg0172
@canaljoseg0172 4 месяца назад
Lo que puedo apreciar de forma generalizada de Stable Diffusion 3, es que respecta el prompt a diferencia de Midjourney y Dalle-e 3, 13:05 Puede ser que esta versión de SD soporte fuentes personalizadas por su alta calidad y haga como proceso interactivo y lo coloque según su orientación dentro la imagen (procesamiento de texto en bit map), 16:41 Midjourney no hizo bien las botellas, ya que le agrego la unidades litros y eso no se especificó en el prompt (por que tan parcial!!!!). A pesar de que mucho le justa hacer imágenes en la redes, a mi personalmente (Nooo!!!), yo quiero que Stable Difusión corra en mi maquina y que supere a estas plataforma de pago. Si Stable Difussion se vuelve de pago, yo pagaría siempre y cuando corra en mi maquina, y generar la cantidad de imágenes que yo quiera.
@arielaalez3985
@arielaalez3985 5 месяцев назад
Me encantaría que hicieras un curso completo de Stable Difusión para aprender a usar los loras, control Net etc.
@XavierMitjana
@XavierMitjana 5 месяцев назад
Vamos a tener un curso de generación de imagen en la Academia donde profundizaremos en esto y también seguiremos compartiendo tutoriales aquí en RU-vid.
@Ale-ht6xd
@Ale-ht6xd 4 месяца назад
Hola Xavier, quiero formarme en la IA generativa de imágenes, cuál para ti es la mejor herramientas de todas para especializarme en ella?
@XavierMitjana
@XavierMitjana 4 месяца назад
Hola, para especializarte y usarlas profesionalmente. El entorno de Stable Diffusion es lo que da más control y posibilidades. Pero es más técnico y avanzado. Midjourney es lo más accesible y te genera imágenes de calidad y cada vez te da más herramientas y control. Para empezar, yo empezaría con Leonardo, que más allá de que la calidad de las imágenes no estén al nivel de Midjourney, tiene un conjunto de herramientas más completo que te permite hacerte una idea de todas las maneras como se pueden generar imágenes. De hecho, Leonardo es la herramienta con la que introducimos en la generación de imágenes a nuestros alumnos de la academia.
@jpc-273
@jpc-273 4 месяца назад
Dot CSV debería enterarse de esto
@tvanime6747
@tvanime6747 3 месяца назад
Tengo que instalarme otra IA ? O se puede este modelo usar en Stable Diffusion
@morlockman72
@morlockman72 5 месяцев назад
No es gratuito, le pides unas cuantas imagenes y te suelta "You have reached the usage cap" y te pide que te hagas premium
@XavierMitjana
@XavierMitjana 5 месяцев назад
Técnicamente el modelo sí es gratuito, otra cosa es que HuggingFace te límite el tiempo de inferencia que puedes usar. Pero esto no tiene que ver con el modelo. Si lo instalas y ejecutas en tu ordenador es completamente gratuito.
@TakaTakaaaaaaaaaaaaa
@TakaTakaaaaaaaaaaaaa 5 месяцев назад
i la calidad de un full body s ridiculamente mala
@DanCreaMundos
@DanCreaMundos 4 месяца назад
Ninguna página te va a ofrecer generación ilimitada gratis, necesitas instalarlo manualmente en tu PC, no es apto para vagos 😂
@miguelangelus02
@miguelangelus02 4 месяца назад
@@TakaTakaaaaaaaaaaaaaMALA COMO TU INTERPRETACIÓN DE LA INFOMACIÓN
@BoulderBoost
@BoulderBoost 4 месяца назад
🎯 Key Takeaways for quick navigation: 00:00 *🚀 Stability presenta dos importantes novedades: Stable Diffusion Cascade y Stable Diffusion 3, prometiendo generar imágenes de alta calidad.* 01:23 *🖼️ Stable Diffusion Cascade permite generar imágenes de alta calidad y rapidez, incluso con texto integrado.* 02:03 *📄 El modelo es fácil de entrenar y ajustar en hardware de consumo, con licencia no comercial para uso gratuito.* 03:55 *⚙️ La arquitectura "Wur" optimiza el modelo, reduciendo significativamente los costos computacionales de entrenamiento.* 04:51 *🎨 Stable Diffusion 3 supera a modelos anteriores en calidad y rapidez de generación de imágenes.* 06:29 *🔍 Stable Diffusion 3 maneja con precisión y eficiencia proms complejos, mostrando una mejora significativa en comparación con otros modelos.* 08:26 *💻 Stable Diffusion 3 combina la arquitectura de difusión por Transformers con la correspondencia de flujo, posicionándose como un modelo de referencia.* 17:58 *💬 La calidad y capacidad de adaptación de Stable Diffusion 3 lo coloca como un fuerte competidor para ser el modelo de referencia en generación de imágenes.* Made with HARPA AI
@tomyjerryoficial822
@tomyjerryoficial822 Месяц назад
Hola se puede crear un influencer con esta IA?
@jorgeyuks
@jorgeyuks 4 месяца назад
EN el caso de las botellas de colores he probado este prompt (traducción al español del original) en DALL-E 3: Imagen ultrarreliasta de tres botellas de cristal transparentes sobre una mesa de madera de pino. La primera botella de la izquierda contiene un líquido rojo y está numerada con el número 1, la botella del medio contiene líquido azul y tiene el número 2 y la botella de la derecha contiene líquido verde y la botella lleva el número 3". Y el resultado de las 4 imágenes ha sido superior al de Stable Diffussion.
@XxQuidanxX
@XxQuidanxX 4 месяца назад
Usan promps diferentes. Mientras a dall e le puedes dar cierto contexto. En sd tienes que ir más directo.
@senramen77
@senramen77 4 месяца назад
Como siempre impresionante!!! enhorabuena por el video, muy didáctico. Xabier, quería hacerte una pregunta: ¿cuál crees tú que sería la mejor web o plataforma para trabajar en internet (on line, ya que no poseo un ordenador muy potente) para trabajar con la mejor aplicación (Dall-E, SD, Midjourney, firefly...) no importa si tengo que pagar, lo doy por hecho; para poder hacer el ilustraciones por medio de textos, en donde tuviera todo tipo de herramientas y opciones a la hora de editarlos.?
@XavierMitjana
@XavierMitjana 4 месяца назад
Hay varias, pero por facilidad de uso, creo que Rundiffusion es la que te lo va a poner más fácil. Eso sí, es solo para entorno Stable Diffusion. Si a lo que te refieres cual es la mejor herramienta de pago para generar imágenes entre las opciones más comerciales, para la mayoría de situaciones Midjourney.
@morlockman72
@morlockman72 5 месяцев назад
A ver cuando sacan una aplicación donde le puedas pedir que te haga un cómic entero, que guarde coherencia y que simplemente contándole una historia y ciertas directrices que haga todo el story board. Yo creo que es cuestión de tiempo.
@XavierMitjana
@XavierMitjana 5 месяцев назад
Creo que existe, aunque no genera comics muy largos. Si me acuerdo del nombre te la traigo.
@HISTORIASINCREIBLESplus
@HISTORIASINCREIBLESplus 4 месяца назад
me gustaría un comentario sobre el tema ideológico en Midjourney, uno le pide varones para un documental y sale tirando un varon y varias mujeres, sería bueno que se respete al cliente que paga, y presten un mejor servicio.
@AventurasdeColores
@AventurasdeColores 5 месяцев назад
Stable Diffusion, para mi, siempre sera el mejor modelo simplemente por el hecho de ser libre. Ya sabes que los modelos base de SD, aunque buenos, no alcanzan la excelencia que posteriormente les da la comunidad.
@XavierMitjana
@XavierMitjana 5 месяцев назад
Exacto, y lo bueno es que Stable Cascade está especialmente pensado para esto.
@user-pj8wg1uv2s
@user-pj8wg1uv2s 5 месяцев назад
The one
@user-ug9nl3we9w
@user-ug9nl3we9w 4 месяца назад
Pregunta igual muy de monger pero, entonces ForgeUI ya ha quedado atras?
@XavierMitjana
@XavierMitjana 4 месяца назад
En absoluto, ForgeUI es una interfaz donde ejecutar modelos, supongo que se adaptará a SD3.
@titusfx
@titusfx 4 месяца назад
16:39 el de midjourney dice 1.1, 1.x 1.x en cada botella
@diesirae4546
@diesirae4546 5 месяцев назад
Como se financia stable diffusion? Si es gratis de usar
@productor_spopovich
@productor_spopovich 5 месяцев назад
Hacen el programa y cuelgan, tu descargas el programa en tu pc y usará tus recursos, ellos no gastan nada solo mejoran la arquitectura del programa
@petitemasque5784
@petitemasque5784 3 месяца назад
Es muy pronto para especular, creo que a estas alturas Midjourney ya está por encima de Dall-E y Cascade se encuentra a años luz de ambos. Puede que SD 3 se aproxime a Midjourney 6 con la ventaja de que podrá ser entrenado y decensurado (eso sí, si posees un PC de la NASA en tu casa). Lo que no me gusta en absoluto son las nuevas licencias de los modelos de Stability AI, pues ya no son 100% gratis, o sea que básicamente inviertes tiempo y dinero entrenando un modelo que no posees. Aunque SD 3 fuera el mesías de la generación de imágenes deberías pagar una licencia para usarlo comercialmente de forma que me pregunto que diferencia hay con tener que pagar para usar Midjourney, que te ahorras cientos de horas de entrenamiento.
@joselito5443
@joselito5443 4 месяца назад
midjourney dudo que lo supere
@gnostman1
@gnostman1 4 месяца назад
Ya estoy creyendo que las imágenes que realmente hace las IAs no son realmente originales sino que son un collage de images o fotos de internet, si tienen dudas intente hacer esta imagen y verán que no sale lo que quiere : Basicamente lo que se busca ahi es ver un una hormiga observado otro pequeño insecto pero desde su propio punto de vista o sea que el observador sea la propia hormiga, y ninguna AI de imagen lo ha podido hacer. Aquí les dejo el prompt que he utilizado: In a natural setting, an ant clutches a small insect in its mandibles in a scene unfolding from the ant's own perspective. This hyper-realistic image is meticulously crafted to emphasize the intimate viewpoint from the ant's eyes. The daylight filters through the surrounding leaves, accentuating every anatomical detail of the insect in the ant's jaws. The scene reflects the interconnectedness of nature, with a precise focus on the ant's eyes, revealing determination and instinct in this captivating microcosm.
@miguelangelus02
@miguelangelus02 4 месяца назад
amigo son modelos generativos de lenguaje, entrenados con imágenes, ponte a leer primero, y lego con conocimiento e info criticas.
@omarnug
@omarnug 26 дней назад
Xavier Midjourney 😅
@yoniwoker
@yoniwoker 4 месяца назад
todos están esperando que stable diffusion destrone a sora. ese día se hará fiesta.
@hectorfabiandelabarra7235
@hectorfabiandelabarra7235 5 месяцев назад
Las patas del gato son humanas!
@TakaTakaaaaaaaaaaaaa
@TakaTakaaaaaaaaaaaaa 5 месяцев назад
perdona pero he usado cascade, pra hacer una imagen de una persona full body, y madre mia que alien ...
@XavierMitjana
@XavierMitjana 5 месяцев назад
¿Qué prompt le has metido? Yo le he acabo de pedir un retrato de un persona a cuerpo entero y me lo ha hecho correctamente.
@nucelar9094
@nucelar9094 4 месяца назад
Y eso de que es mas rápido yo no lo veo por ningún lado en mi caso tanto en Comfyui como en Forge es mucho mas rápido SDXL.
@AxsRock
@AxsRock 5 месяцев назад
Cascade no da buenos resultados, sigue teniendo problemas con las manos y algunos prompts. Tampoco entiende muy bien el español.
@XavierMitjana
@XavierMitjana 5 месяцев назад
Cascade es un modelo más enfocado a finetuning y eficiencia en image to image y controlnet. En eso es muy bueno. La calidad de la imagen a mí sí que me parece que mejora sus predecesores. Pero aquí el modelo bueno es Stable Diffusion 3.
@SpotifryTV
@SpotifryTV 4 месяца назад
este tipo de comparaciones muchas veces no son muy relevantes.. puede ser que vuelvas a lanzar un prompt en uno de los modelos y te lo haga mejor que esos ejemplos de SD 3 o incluso cuando se pueda probar SD 3 , lances uno de esos prompts y no te cree bien la composición muchas veces hay que lanzar esos prompts varias veces hasta que consigue un resultado que estamos buscando.
@dark-taku7937
@dark-taku7937 4 месяца назад
Superó a dale3 xd ???
@XavierMitjana
@XavierMitjana 4 месяца назад
Cuando esté disponible lo veremos, pero tiene pinta de qué sí.
@joanignasivicente2012
@joanignasivicente2012 5 месяцев назад
Estás portadas que diseñas para tus videos me dan buen rollo porque me recuerdan a las revistas de informática que leía hace siglos ahora desaparecidas. Como en ese caso son bastante dudosas artísticamente pero también muy divertidas. Tienen ya no solo sana autocrítica implícita si no incluso pitorreo. Si te las hiciera el enemigo seguro que le tiras granos de arroz soplando el boli bic hasta que rinda y deje de hacer semejantes portadas. Pero bueno, las hace tu equipo de youtubers y la verdad es que son buenas portadas. No sé si falta una verde como la masa, de Batman, Spiderman y Superman. Luego podrías meterte e política però no lo aconsejo... Eso no lo hicieron las increíbles revistas de informática de los años 90. Encuentro mucho a faltar esas revistas. Era una gozada tenerlo todo en papel.
@XavierMitjana
@XavierMitjana 5 месяцев назад
Supongo que somos de la misma generación. A mi me recuerda un poco a la es´tica de los 90 y me mola. Además creo que son diferentes y que ayudan a identificar que los videos son míos y de qué va al canal. Yo les tengo mucho cariño.
@joanignasivicente2012
@joanignasivicente2012 4 месяца назад
@@XavierMitjana el papel tiene encanto especial. Se sabe que kami es Dios japonés, papel y pelo. Antes era prohibitivo publicar. Ahora parece demasiado fácil para ser real. Parece que falta gente con capacidad de leer pero sobra de todo por todas partes, gente también, siendo simultáneamente escasa y al final no llega agua al grifo mientras nos ahogamos por el chaparrón (virtual, que vivo en Barcelona) que nos cae encima.
@asier7400
@asier7400 4 месяца назад
Totalmente de acuerdo, tiene ese royo Micromania. Que tiempos
@aaromnido
@aaromnido 5 месяцев назад
En estas pruebas hay que tener en cuenta que las imágenes que publican son un cherry pick de los mejores resultados obtenidos. Habría que compararlo con un cherry pick 20 intentos o más en las otras dos plataformas.
@XavierMitjana
@XavierMitjana 5 месяцев назад
Lo comento en el vídeo, que hasta que no se pueda probar es difícil juzgar, pero muchos de los resultados que muestran en twitter, ni con cherrypicking los consigues en los otros 2. Hay muchos detalles en los que parece superior, pero supongo que es lo normal al ritmo que avanza esto. En nada Midjourney y OpenAI seguro que sacan modelos nuevos.
@aaromnido
@aaromnido 5 месяцев назад
Sí, aparentemente, en mi opinión en lo que más destaca es en la capacidad de reproducir escenas complejas en base a propmts complejos. Parece que la comprensión del lenguaje natural es muy buena.@@XavierMitjana
@pasqualeforenza_BTIChannel
@pasqualeforenza_BTIChannel 5 месяцев назад
Robin bird es un petirrojo. Batman y Robin son el hombre murciélago y el hombre petirrojo
@XavierMitjana
@XavierMitjana 5 месяцев назад
Muchas gracias! Ya has visto que muy convencido no estaba. En catalán lo hubiese dicho bien, pero no sé porque me sonaba que la traducción de Pit-roig era Ruiseñor.
@cuentoshistoriasinfantiles
@cuentoshistoriasinfantiles 5 месяцев назад
Para mí solo llego al mismo nivel que dalley
@XavierMitjana
@XavierMitjana 5 месяцев назад
Yo los ejemplos que estoy viendo en twitter sugieren que es el mejor de los 3... de momento. Porque Midjourney ya está trabajando en la v7 y OpenAI no me extrañaría que pronto actualizase Dall-e.
@qweasdzxcrfv1
@qweasdzxcrfv1 5 месяцев назад
alv
@TheSyphonfilterarg
@TheSyphonfilterarg 4 месяца назад
Midjourney es de paga y online y no hace deepfake. FIN
@kratoswarelmejor
@kratoswarelmejor 3 месяца назад
Huggins face ese yo me lo guíe y ahí solo hay basura busque el famoso stable difusión y me salen difusión estables por todos lados pero ninguna interfaz
Далее
ChatGPT GRATIS...¡MEJORA! 🚀 Nuevo GPT4-o mini
20:14
شربت كل الماء؟ 🤣
00:31
Просмотров 15 млн
ЗАМУРОВАННЫЙ ФОКУСНИК
00:44
Просмотров 47 тыс.
Beautiful sport😍
00:20
Просмотров 167 тыс.
Google Releases AI AGENT BUILDER! 🤖 Worth The Wait?
34:21