Los temas de IA se han vuelto cada vez más populares recientemente.
Recientemente, la aplicación de generación de videos de OpenAI "Sora"
※Para obtener más información sobre Sora, consulte la siguiente reseña:
Y el 12 de diciembre del mismo año, Apple lanzó una aplicación de generación de imágenes para iOS 12 llamada "Imagen del patio de recreo(Tengo un iPhone 14 por lo que no es compatible)
Y recientemente, la IA de generación de video de Google "Veo2" y generación de imágenes IA y otras funciones de generación incluidas en Adobe Photoshop 2025.
Últimamente he estado prestando especial atención a las funciones de generación de Photoshop 2025 porque son de alta calidad y tienen velocidades de renderizado rápidas.
Mientras tanto, la IA de generación de imágenes que estoy usando para crear mi blog en este momento es,Diseñador de Microsoft"Y creo que esta es una de las IA de generación de imágenes que es extremadamente fácil de usar. Las razones de esto son las siguientes:
- Puede generar imágenes fotorrealistas que no suelen verse en otras aplicaciones.
- También es ideal para generar ilustraciones de estilo anime japonés.
- Se generan cuatro patrones de imágenes con un comando
- Responde a los comandos con bastante fidelidad.
- Si tiene una cuenta de oficina, su uso es gratuito.
- La renderización es rápida.
Creo que estos puntos la hacen destacar de otras aplicaciones. Por supuesto, también tiene sus debilidades. Lo compensa con creces generando imágenes que siguen tus instrucciones.
Entonces, me gustaría presentarlo con algunos ejemplos y cómo usarlo.
¿Qué es Microsoft Designer?
Microsoft Designer es una herramienta de generación de imágenes proporcionada por Microsoft y es un servicio que tiene como objetivo permitir a los usuarios crear fácilmente diseños de alta calidad utilizando tecnología de IA. Una de sus características especiales es que incluso los principiantes pueden crear fácilmente imágenes de aspecto profesional.
También es posible crear diseños gráficos desde cero, como el competidor Canva. El núcleo del programa de generación de imágenes de Microsoft Designer es el motor "DALL-E3" de OpenAI, lo que significa que ChatGPT4-o puede generar imágenes de la misma calidad.
Sin embargo, personalmente encuentro que Microsoft Designer es más fácil de usar.
Genera cuatro imágenes diferentes a la vez y te permite elegir la relación de aspecto de la imagen. En particular, la relación de imagen es difícil de controlar en ChatGPT. También viene con varias funciones de edición utilizando IA. Se puede decir que Microsoft Designer ha hecho que DALL-E4 sea más fácil de usar y más profesional.
¿Cuánto cuesta Microsoft Designer?

Su uso es básicamente gratuito. *Se requiere una cuenta Microsoft.
Además, las imágenes se generan consumiendo puntos llamados boosts, y se pueden generar hasta 1 boosts por día. (Básicamente se consume 15 boost por generación) Esto se compensa con 1 boosts cada día, por lo que hasta ahora no he tenido ningún problema en quedarme sin ellos. Además, como puedes crear de 1 a 15 variaciones de una imagen a la vez, no tendrás que preocuparte por consumir potencia.
La versión para teléfonos inteligentes de la aplicación también se detalla a continuación. El uso es básicamente el mismo. (La versión para teléfonos inteligentes tiene algunas funciones más de edición de IA).
Uso básico
Por ahora, dejaré de mostrar ejemplos reales y primero daré una explicación sencilla de cómo usarlo. La explicación se basa en la versión para PC.




La versión para PC tiene "Mejorar las indicaciones" botón, que al hacer clic utilizará IA para convertir el mensaje en declaraciones más completas y similares a comandos. Sin embargo, dado que contiene algunos comandos innecesarios, no lo uso muy a menudo.

A continuación se muestra la imagen generada.




Fue bastante fácil crear la imagen.
Lo bueno de Microsoft Designer es que tiene una velocidad de renderizado rápida, por lo que los reintentos repetidos no son demasiado dolorosos.
Últimamente he estado utilizando cada vez más este servicio para crear imágenes llamativas para mi blog.
¿Cuáles son las desventajas de Microsoft Designer?
Como cualquier otro servicio, Microsoft Designer tiene algunas debilidades.
¿Qué es eso?Debilidad en los detalles finos"Eso es lo que quiero decir. Por ejemplo, en la foto de abajo de un escritorio con gadgets alineados, se puede ver que las imágenes del teclado y los botones han sido distorsionadas como arcilla.
Este problema no se pudo solucionar sin importar cuántas veces intentamos generar la imagen, y es un fenómeno que también se ha visto en otros servicios de generación de imágenes, por lo que creo que este puede ser un punto de inflexión para los servicios de generación de imágenes en el momento.
El resto en este punto es "multimodal" no es compatible.
Tener esta característica hace una gran diferencia en la usabilidad de la generación de imágenes, por lo que espero que lo aborden pronto.

Intenté generar varias imágenes.
Aquí utilicé Microsoft Designer para generar varias imágenes.
Primero, genera una foto de moda.
El comando es el siguiente:
Un niño visto desde atrás vistiendo una chaqueta negra de Comme des Garcons. Ella tiene el pelo largo y se gira ligeramente hacia nosotros, mirándonos. La imagen es monocroma.
Y el resultado generado es el siguiente:

Se logró el resultado previsto.
También es genial que incluso diseñen e incluyan el logotipo de Comme des Garcons.
(Aunque la ortografía es rara.)
Puede elegir entre tres relaciones de aspecto de las fotografías, lo que le permitirá crear imágenes con un alto grado de libertad.
A continuación, probemos algo un poco más dinámico.
La siguiente es la declaración del comando.
Parece un templo en algún lugar de China. 100 monjes sin camisa corren hacia la cámara. La cámara tomó la fotografía desde una vista aérea, lo que le dio al producto final una sensación cinematográfica.
Y el resultado generado es el siguiente:

Esto también es bastante fiel al comando. Es tan fiel que incluso genera cámaras innecesarias. Si miras con atención, puedes ver que la imagen se distorsiona más cuanto más lejos está, pero ¿está esto dentro de un rango aceptable?
Pasemos al siguiente. A continuación me gustaría intentar crear una imagen dinámica de un coche derrapando.
La siguiente es la declaración del comando.
Una foto dinámica de dos coches derrapando uno al lado del otro en el Gran Premio D-1. Los dos coches son un AE2 y un Skyline GTR. Utilice el desenfoque de zoom para agregar impacto.
Y el resultado generado es el siguiente:

Vaya, eso se ve bastante bien.
También es fantástico ver el esfuerzo que se pone en recrear el modelo exacto del automóvil. El resultado es similar a una ilustración.
He creado tres fotos hasta ahora y puedes ver que los resultados son fieles a los comandos.
A continuación, cambiemos un poco las cosas e intentemos crear una foto con un tono melancólico.
La siguiente es la declaración del comando.
Una barra de tiro determinada. Un hombre y una mujer sentados en el mostrador del bar. El hombre es un hombre de mediana edad con una mirada seria en su rostro. La mujer tiene unos 20 años. Ambos son japoneses. Brindemos con un vaso de whisky. Hay un teléfono inteligente en el mostrador. El resultado es una fotografía melancólica.
Y el resultado generado es el siguiente:

es asombroso.
Aunque se trataba de una escena compleja, las frases de mando fueron prácticamente reproducidas. Había un teléfono inteligente en el mostrador, así que me sorprendió un poco el resultado. No hay distorsión de la imagen y el resultado es muy natural.
Esto no es posible con otros servicios.
Hasta ahora no tengo ninguna queja sobre la calidad de la imagen.
La próxima vez me gustaría comprobar la calidad del diseño gráfico en lugar de la imagen.
Habilidades de creación de diseño gráfico
Hay muchos tipos diferentes de diseño gráfico, pero me gustaría crear tres tipos de diseño: un diseño de logotipo, una tarjeta de felicitación y una tarjeta de presentación.
Capacidad de creación de logotipos
La siguiente es la declaración del comando.
Diseña un logotipo para tu marca. Tengo un blog sobre gadgets. Me gustaría un diseño simple y elegante que haga uso de la tipografía. El fondo es blanco. Utilice "Gadget Mania Z" para el texto del logotipo. El texto es de color azul marino sólido.
El resultado generado es el siguiente.


Los resultados no parecen ser tan diferentes a los de otras aplicaciones. Lo he probado varias veces, pero siempre tiene el mismo diseño americano. Es elaborado, pero no es exactamente simple y es un poco difícil de usar. Intenté cambiar el comando muchas veces, pero no pude encontrar un diseño satisfactorio. Es bastante difícil...

Dado que el texto puede distorsionarse de esta manera, puede requerir cierta habilidad para usarlo como herramienta de creación de logotipos.
A día de hoy (2024 de diciembre de 12), al igual que otras herramientas, la generación de logotipos no parece haber alcanzado la calidad deseada.
La próxima vez me gustaría hacer algo que tenga un toque estacional. Para seguir poniendo a prueba mis habilidades en diseño gráfico, voy a hacer una tarjeta de felicitación.
Técnicas para hacer tarjetas de felicitación
La siguiente es la declaración del comando.
El estilo artístico es estilo anime japonés. Una chica de pelo largo, parecida a Hatsune Miku, está vestida como Santa Claus y flota en el cielo sobre la ciudad nocturna. Está nevando y la imagen es dramática. Las letras 𝑀𝑒𝑟𝑟𝑦 𝐶ℎ𝑟𝑖𝑠𝑡𝑚𝑎𝑠 están colocadas en una buena posición. Tarjeta DM.
El resultado generado es el siguiente.


¡Oooh! Esto es bastante asombroso 👏
Quizás la temática elegida fue buena, ya que claramente se trata de Hatsune Miku. Y las imágenes son muy dramáticas.
Parece tener excelentes habilidades de diseño gráfico, siendo capaz de crear cosas como tarjetas de felicitación simples con una sola imagen.
Por último, aquí hay una prueba más de diseño gráfico. Me gustaría tener hechas algunas tarjetas de presentación.
Capacidad de creación de diseños de tarjetas de presentación.
La siguiente es la declaración del comando.
Diseña una tarjeta de presentación vertical.
Es una tarjeta de presentación sencilla con color base rojo y color de acento negro. El texto principal debe ser "Gadget Mania Z" y el subtexto debe ser Nombre: TOMO, Título: Diseñador gráfico y una dirección y número de teléfono adecuados.
El resultado generado es el siguiente.

Esta fue la mejor de las cuatro propuestas generadas.
Bueno, este diseño es una buena idea para una sesión de lluvia de ideas.
Pero las otras tres cartas no eran buenas en absoluto, por lo que la tasa de éxito parece baja.
Creo que el diseño sería mejor si hubiera al menos una función multimodal que permitiera a los usuarios compartir y consultar fotos, etc., pero una vez que se agrega un logotipo se vuelve difícil. Incluso las letras pequeñas se están desmoronando...
Comentario general
- Los objetos realistas tienen un alto grado de reproducibilidad. Ahora, incluso aquellos que estaban insatisfechos con los resultados de la IA de generación de imágenes pueden estar satisfechos.
- Una ilustración bidimensional, como un logotipo, le otorga instantáneamente una fuerte sensación estadounidense.
- Las tarjetas de felicitación tienen un diseño sencillo y muestran una gran capacidad de diseño.
- Las tarjetas de visita también parecen estadounidenses cuando tienen un logotipo.
- Dado que no es multimodal, se requieren habilidades de estimulación.
Conclusión
Aunque sus habilidades de generación de imágenes son fuertes, sus habilidades de diseño gráfico aún están en desarrollo.
*Es posible que no se pueda utilizar para realizar una lluvia de ideas.
Otras características del diseño gráfico
Microsoft Designer se promociona como una herramienta de diseño gráfico y tiene una gran cantidad de funciones además de la inteligencia artificial para la generación de imágenes. La siguiente explicación se dará utilizando la pantalla de la versión para teléfono inteligente. (La versión para teléfonos inteligentes tiene un poco más de funciones) Seleccione la pestaña "Editar con IA" en la parte superior de la pantalla.

borrado generativo
Intenté intentarlo, pero nunca terminó de cargarse, así que me di por vencido. Creo que es una función que utiliza el análisis de IA para eliminar partes innecesarias de una imagen.
Cambiar estilo de imagen
Esta función utiliza análisis de IA para cambiar la imagen a un estilo de imagen específico. Esto es absolutamente excelente.
A continuación se muestran algunos ejemplos ↓

Desenfoque de fondo
Esta función utiliza análisis de IA para agregar profundidad de campo al fondo de una imagen específica. Esto supone un gran esfuerzo. Aunque creo que está un poco borroso.
A continuación se muestran algunos ejemplos ↓

Quitar el fondo
Esta función utiliza literalmente el análisis de IA para eliminar el fondo de una foto y guardarla como una imagen transparente.
Habrá algunos bordes irregulares al cortar cosas delicadas como el cabello, pero esta puede ser una característica útil dependiendo de la foto.
A continuación se muestran algunos ejemplos ↓

imagen del marco
Esta función le permite elegir su marco favorito entre una amplia variedad de opciones e insertar una foto específica en él.
A continuación se muestran algunos ejemplos ↓

Edición de una imagen
Esta es una función que te permite retocar fácilmente tus fotos.
No hay muchas opciones de retoque, así que pensé que sería mejor usar otra aplicación de fotos.
Pantalla de edición a continuación:

Te presentaré algunas aplicaciones de retoque fotográfico que recomiendo:
[Fotógrafo]

Fotor AI Aplicación de edición de fotografías, edición de imágenes y collages
publicado conAlcance de la aplicación
Ampliando la producción de vídeo con la combinación de Sora y Premiere
Pienso que sería un desperdicio simplemente generar imágenes.
Aquí hay algunas posibilidades creativas que se me ocurren:
Ejemplo) Creación de un vídeo de saludo
4. Crea de 5 a XNUMX imágenes con temática navideña utilizando Microsoft Designer.
②Lleve la imagen a Sora de OpenAI y agregue animación. *Hacer que nieve, renos corriendo, etc.
3) Utilice Adobe Premiere, Vrew, etc. para organizar los videos animados en una línea de tiempo, cortarlos y editarlos, y agregar música.
Utilice Microsoft Designer → Sora → Premiere en tres pasos.
De esta manera puedes crear cualquier cosa, desde imágenes fijas hasta vídeos. Cuando lo piensas, es emocionante ¿no? Todas estas operaciones son sencillas, así que pruébalas.
Resumen: Adecuado para generar imágenes similares a fotografías.
Para mí, muchas de las funciones parecen un juguete y realmente no tienen el atractivo de ser una herramienta de diseño gráfico.
Es probable que continúe madurando con futuras actualizaciones, por lo que esperamos ver qué nos depara el futuro.
Por otro lado, cuando se lo considera como una IA de generación de imágenes, parece alardear de un nivel de finalización bastante alto en este punto.
Sentí que la calidad de las imágenes, especialmente de las personas, era muy alta.
*Al utilizar objetos mecánicos detallados, las imágenes pueden distorsionarse de manera similar a la de la arcilla.
Salvo algunos casos raros, no creo que haya muchos servicios en este momento que tengan una tasa de precisión tan alta para las declaraciones de comando. (Por favor perdóname si me equivoco.)
Si tienes una cuenta Microsoft, puedes usarla gratis. ¿Por qué no probarla? ¡Sea creativo este Año Nuevo!