martes, 18 de marzo de 2025

Análise de IAs para modificación de imaxes ao estilo de Van Gogh

 

Introdución

Hoxe comparto a miña experiencia probando tres ferramentas de intelixencia artificial para transformar unha imaxe dun ponte en Barcelona ao estilo da "Noite Estrelada" de Van Gogh. Cada unha destas IAs ofrece resultados distintos, con vantaxes e inconvenientes que cómpre valorar.

A imaxe é a seguinte:

Clasificación dos modelos de IA para transformación ao estilo de Van Gogh

Antes de afondar na análise completa, presento unha clasificación dos tres modelos probados, ordenados de peor a mellor segundo a miña experiencia persoal:

3º Posto: Artbreeder

A ferramenta con peor rendemento na proba. Aínda que reproduce bastante ben o estilo pictórico de Van Gogh, fracasa considerablemente á hora de manter a estrutura orixinal da imaxe do ponte de Barcelona, resultando nunha interpretación que perde a esencia do que se pretendía transformar.

2º Posto: Deep Dream Generator

Ocupa unha posición intermedia. Require varios intentos para conseguir resultados satisfactorios e, malia capturar correctamente o estilo de Van Gogh, presenta certas desviacións respecto á estrutura orixinal. Non obstante, con paciencia e varios intentos, consegue resultados aceptables.

1º Posto: DALL-E (integrada en ChatGPT)

Clara vencedora desta comparativa. Destaca pola súa capacidade para xerar ao primeiro intento unha imaxe que equilibra perfectamente o estilo característico de Van Gogh coa fidelidade á estrutura orixinal do ponte. É a opción máis rápida, eficiente e que mellor cumpre co obxectivo proposto.

Deep Dream Generator

Esta foi a primeira ferramenta que probei. Necesitei varios intentos para conseguir un resultado satisfactorio. Aínda que logrou capturar o estilo característico de Van Gogh, desvíase considerablemente da estrutura da imaxe orixinal do ponte.



Opinión persoal
: Non foi unha mala experiencia, pero a cantidade de intentos necesarios para conseguir un resultado aceptable fai que non sexa a opción máis eficiente.

DALL-E (integrada en ChatGPT)

Sen dúbida, esta foi a mellor das tres opcións. Funcionou ao primeiro intento e xerou unha imaxe que mantiña un bo equilibrio entre o estilo de Van Gogh e a estrutura orixinal do ponte de Barcelona.


Opinión persoal: Rápida e efectiva, conseguiu exactamente o que buscaba sen necesidade de múltiples intentos nin axustes.

Artbreeder

Esta foi a opción que menos me convenceu. Aínda que logrou imitar o estilo pictórico de Van Gogh de forma bastante acertada, o resultado desviouse demasiado da estrutura orixinal da imaxe, perdendo a esencia do ponte que aparecía na foto inicial.


Opinión persoal
: Unha gran decepción, xa que a pesar de capturar ben o estilo artístico, non respectou a composición orixinal.

Conclusión final

Tras probar estas tres ferramentas de IA para modificación de imaxes, podo concluír que existe unha grande variabilidade na calidade dos resultados. DALL-E destaca claramente como a opción máis equilibrada, ofrecendo unha boa interpretación do estilo de Van Gogh sen sacrificar os elementos estruturais da imaxe orixinal. Deep Dream Generator require máis paciencia e intentos, mentres que Artbreeder, aínda que tecnicamente capaz de reproducir o estilo, perde demasiado a esencia da imaxe orixinal.

A elección da ferramenta dependerá do equilibrio que busquemos entre fidelidade á imaxe orixinal e expresión artística, así como da nosa paciencia para realizar múltiples intentos. Se buscas eficiencia e calidade, DALL-E parece ser actualmente a mellor opción dispoñible.

martes, 11 de marzo de 2025

IAs de Mellora de Imaxes

 

Comparativa de ferramentas de mellora de imaxes.

Estiven probando unha serie de modelos de xeración de imaxes capaces de mellorara resolución de diferentes imaxes. vou facer unha crítica a través das experiencias que etas me proporcionaron.

A imaxen a mellorar é a seguinete:



Let's Enhance:

Ferramenta pioneira no campo do upscaling mediante IA con interface sinxela e procesamento rápido. Os resultados son aceptables para usos xerais, pero presenta inconsistencias con zonas que quedan difuminadas, especialmente en texturas sutís e transicións de cor. Ofrece unha mellora visible respecto á imaxe orixinal, mais carece da consistencia necesaria para traballos profesionais que requiran alta calidade en toda a superficie.

Non está tan mal xa que vese unha mínima mellora na calidade da imaxe aínde que esta ten moito camiño por mellorar xa que como xa se menciona antes imperfeccióc e zonas da imaxe difuminadas.

Pixelcut:

Solución avanzada que destaca pola súa excepcional capacidade para preservar e reconstruír detalles. As imaxes procesadas amosan unha mellora substancial, mantendo a naturalidade e a consistencia en diferentes áreas, incluídas texturas complexas. O resultado final ten aspecto profesional sen os artefactos artificiais habituais noutras ferramentas. Supera amplamente as expectativas e representa a mellor opción das tres analizadas para calquera tipo de uso.

Pixelcut polo que provei é a mellor no ambito, esta superou con creces as expectativas e conseguiu mellorar en gran medida a calidade da imaxe. Polo tanto é para min a mellor opción das tres que probei.

Midjourney:

Ferramenta coñecida pola xeración de imaxes que decepciona no ámbito do upscaling. En vez de mellorar a resolución, empeora notablemente a calidade orixinal con perda significativa de detalles e introdución de distorsións non desexadas. O procesamento é inconsistente e resulta en imaxes con aspecto artificial e pouco profesional. Non é recomendable para mellora de resolución, xa que o resultado final é de calidade inferior á imaxe de partida.

Para min esta é a peor sen ningunha dúbida, xa que en vez de mellorar a imaxe vese moito peor e parece que a imaxe cambiou, o caso e que en vez de mellorar a imaxe fixo que se vise borrosa.

Conclusión

Tras a análise comparativa, Pixelcut emerxe como a opción claramente superior pola súa capacidade para mellorar imaxes mantendo un aspecto natural e profesional. Let's Enhance ocupa unha posición intermedia, útil para usos básicos pero con limitacións evidentes. Midjourney debería evitarse completamente para este propósito específico, xa que empeora as imaxes en vez de melloralas, facendo que o seu uso sexa contraproducente.