martes, 18 de marzo de 2025

Análise de IAs para modificación de imaxes ao estilo de Van Gogh

 

Introdución

Hoxe comparto a miña experiencia probando tres ferramentas de intelixencia artificial para transformar unha imaxe dun ponte en Barcelona ao estilo da "Noite Estrelada" de Van Gogh. Cada unha destas IAs ofrece resultados distintos, con vantaxes e inconvenientes que cómpre valorar.

A imaxe é a seguinte:

Clasificación dos modelos de IA para transformación ao estilo de Van Gogh

Antes de afondar na análise completa, presento unha clasificación dos tres modelos probados, ordenados de peor a mellor segundo a miña experiencia persoal:

3º Posto: Artbreeder

A ferramenta con peor rendemento na proba. Aínda que reproduce bastante ben o estilo pictórico de Van Gogh, fracasa considerablemente á hora de manter a estrutura orixinal da imaxe do ponte de Barcelona, resultando nunha interpretación que perde a esencia do que se pretendía transformar.

2º Posto: Deep Dream Generator

Ocupa unha posición intermedia. Require varios intentos para conseguir resultados satisfactorios e, malia capturar correctamente o estilo de Van Gogh, presenta certas desviacións respecto á estrutura orixinal. Non obstante, con paciencia e varios intentos, consegue resultados aceptables.

1º Posto: DALL-E (integrada en ChatGPT)

Clara vencedora desta comparativa. Destaca pola súa capacidade para xerar ao primeiro intento unha imaxe que equilibra perfectamente o estilo característico de Van Gogh coa fidelidade á estrutura orixinal do ponte. É a opción máis rápida, eficiente e que mellor cumpre co obxectivo proposto.

Deep Dream Generator

Esta foi a primeira ferramenta que probei. Necesitei varios intentos para conseguir un resultado satisfactorio. Aínda que logrou capturar o estilo característico de Van Gogh, desvíase considerablemente da estrutura da imaxe orixinal do ponte.



Opinión persoal
: Non foi unha mala experiencia, pero a cantidade de intentos necesarios para conseguir un resultado aceptable fai que non sexa a opción máis eficiente.

DALL-E (integrada en ChatGPT)

Sen dúbida, esta foi a mellor das tres opcións. Funcionou ao primeiro intento e xerou unha imaxe que mantiña un bo equilibrio entre o estilo de Van Gogh e a estrutura orixinal do ponte de Barcelona.


Opinión persoal: Rápida e efectiva, conseguiu exactamente o que buscaba sen necesidade de múltiples intentos nin axustes.

Artbreeder

Esta foi a opción que menos me convenceu. Aínda que logrou imitar o estilo pictórico de Van Gogh de forma bastante acertada, o resultado desviouse demasiado da estrutura orixinal da imaxe, perdendo a esencia do ponte que aparecía na foto inicial.


Opinión persoal
: Unha gran decepción, xa que a pesar de capturar ben o estilo artístico, non respectou a composición orixinal.

Conclusión final

Tras probar estas tres ferramentas de IA para modificación de imaxes, podo concluír que existe unha grande variabilidade na calidade dos resultados. DALL-E destaca claramente como a opción máis equilibrada, ofrecendo unha boa interpretación do estilo de Van Gogh sen sacrificar os elementos estruturais da imaxe orixinal. Deep Dream Generator require máis paciencia e intentos, mentres que Artbreeder, aínda que tecnicamente capaz de reproducir o estilo, perde demasiado a esencia da imaxe orixinal.

A elección da ferramenta dependerá do equilibrio que busquemos entre fidelidade á imaxe orixinal e expresión artística, así como da nosa paciencia para realizar múltiples intentos. Se buscas eficiencia e calidade, DALL-E parece ser actualmente a mellor opción dispoñible.

martes, 11 de marzo de 2025

IAs de Mellora de Imaxes

 

Comparativa de ferramentas de mellora de imaxes.

Estiven probando unha serie de modelos de xeración de imaxes capaces de mellorara resolución de diferentes imaxes. vou facer unha crítica a través das experiencias que etas me proporcionaron.

A imaxen a mellorar é a seguinete:



Let's Enhance:

Ferramenta pioneira no campo do upscaling mediante IA con interface sinxela e procesamento rápido. Os resultados son aceptables para usos xerais, pero presenta inconsistencias con zonas que quedan difuminadas, especialmente en texturas sutís e transicións de cor. Ofrece unha mellora visible respecto á imaxe orixinal, mais carece da consistencia necesaria para traballos profesionais que requiran alta calidade en toda a superficie.

Non está tan mal xa que vese unha mínima mellora na calidade da imaxe aínde que esta ten moito camiño por mellorar xa que como xa se menciona antes imperfeccióc e zonas da imaxe difuminadas.

Pixelcut:

Solución avanzada que destaca pola súa excepcional capacidade para preservar e reconstruír detalles. As imaxes procesadas amosan unha mellora substancial, mantendo a naturalidade e a consistencia en diferentes áreas, incluídas texturas complexas. O resultado final ten aspecto profesional sen os artefactos artificiais habituais noutras ferramentas. Supera amplamente as expectativas e representa a mellor opción das tres analizadas para calquera tipo de uso.

Pixelcut polo que provei é a mellor no ambito, esta superou con creces as expectativas e conseguiu mellorar en gran medida a calidade da imaxe. Polo tanto é para min a mellor opción das tres que probei.

Midjourney:

Ferramenta coñecida pola xeración de imaxes que decepciona no ámbito do upscaling. En vez de mellorar a resolución, empeora notablemente a calidade orixinal con perda significativa de detalles e introdución de distorsións non desexadas. O procesamento é inconsistente e resulta en imaxes con aspecto artificial e pouco profesional. Non é recomendable para mellora de resolución, xa que o resultado final é de calidade inferior á imaxe de partida.

Para min esta é a peor sen ningunha dúbida, xa que en vez de mellorar a imaxe vese moito peor e parece que a imaxe cambiou, o caso e que en vez de mellorar a imaxe fixo que se vise borrosa.

Conclusión

Tras a análise comparativa, Pixelcut emerxe como a opción claramente superior pola súa capacidade para mellorar imaxes mantendo un aspecto natural e profesional. Let's Enhance ocupa unha posición intermedia, útil para usos básicos pero con limitacións evidentes. Midjourney debería evitarse completamente para este propósito específico, xa que empeora as imaxes en vez de melloralas, facendo que o seu uso sexa contraproducente.

venres, 21 de febreiro de 2025

IA Xeración de Imaxes

 


IAS XERADORAS DE IMAXES

Nestes últimos días estiven probando diferentes modelos de xeración de imaxes e funos comparando para saber cal de todos ao meu parecer era o mellor e cal o peor:

Agora enseñareivos as imaxes que foron creadas a partir dos diferentes modelos de xeración de imaxes, a todos estes pedinlle exactamente o mesmo PROMPT, unha morsa na terra con sombreiro de granxeiro e un rastillo.

CRÍTICA CONSTRUTIVA:

Adobe Firefly: Esta polo que probei non esta tan mal, nesta imaxe practicamente é case o que pedín simplemente o gorro de granxeiro xa que ese gorra para min parecese máis ao dun vaqueiro pero si que é verdade que non esta mal. Aínda que noutras imaxes que tamén lle pedín si que é verdade que non estaba moi acertada en xeral non está mal e ademais dispón dunha cantidade de créditos duns 25 mensuais o que creo que é unha cantidade bastante asequible.



Leonado Ai: Esta tamén esta bastante ben e eu creo que un paso por enriba da anterior xa que esta xera un total de catro imaxes e ademais está mais acertada ca anterior e cunha maior eficacia á hora de xerar imaxes o único fallo que lle vexo é que nesta caso en vez de un gorro de ranxeiro fixo unha gorra cunha folla e esta fixoa mais de animación en comparación ca anterior que era mais realista.



Qwen: Esta para min con xunto con Ideogram é a mellor, con ten limite de xeración de imaxes, ademais tamén funciona como LLM polo que ten unha gran comprensión de texto, ademais creo que é una das mellores en canto a xeración das imaxes pero eu creo que Ideogram esta un pouco por enriba desta neste aspecto. Aínda que neste caso non fixo exactamente a imaxe que lle pedín xa que a morsa ten un gorro de pirata. Pero si que noutras imaxes que lle pedín estivo moito máis acertado que outras.



Ideogram: Esta para min e segunda mellor só por detrás de Qwen, polo número de créditos xa que esta conta con 10 créditos semanais, pero esta proporcionache 4 imaxes e ti escolles a que mais che guste. Aínda que nesta imaxe, non estivera case nada acertado, xa que non xerou una morsa máis ben é un roedor grande como un castor ou unha capibara, con gorro mineiro pero outras imaxes que lle pedín estivo moi acertada ademais pedindolle cousas bastante específicas o único problema que lle vexo é que tarda un 3 minutos en xerar a imaxe.


OUTROS MODELOS DE XERACÍON DE IMAXES:


As demais que probei como DALL-E, esta está integrada en chat-gpt, pero co modelo do navegador non deixa facer scrol en chat-gpt só puiden probar unha imaxe pero aínda así estivo bastante              acertada. MIDJOURNEY esta vina bastante mal si que é verdade que as veces si que xeraba o que pedía pero a maior parte das veces fallaba. STABLE DIFUSION eta tamén estaba bastante mal xa que para que fixera a imaxe tiñas que explicarllo todo con cuidadoso detalle pero non podías ser moi especifico xa que esta poñíase a inverntar. KREA esta directamente non a puiden probar xa que a páxina está completamente desordenada e non deixa pedirlle ningunha imaxe.


CONCLUSIÓN:

Para min os que destancan entre estes modelos son os mencionados arriba. E de entre eles os mellores son sen dúbida algunha Qwen e Ideogram estas entenden moi ben o que lle pides aínda que xusto esta imaxen que elexín foron as dúas que peor saíron, pero para mín estas teñen unha gran capacidade de compresión de texto e de xeración de imaxes

martes, 17 de decembro de 2024

IA: Cando as Máquinas Aprenden a Falar

 

Imaxina por un intre que tes un amigo que sabe case todo, que pode escribir sobre calquera tema, traducir instantaneamente entre idiomas e mesmo axudarte cos teus deberes. Ese "amigo" xa existe, e chámase Intelixencia Artificial (IA).

Os modelos de linguaxe grandes (tamén coñecidos como MLL) son como cerebros dixitais super intelixentes que aprenden lendo millóns de textos na internet. É coma se un estudiante puidese ler todos os libros do mundo nunha semana e logo contarnos o que aprendeu.


 Que Fan Estes "Cerebros Dixitais"?
  • Escriben textos case perfectos: Poden redactar artigos, historias, correos... case como un humano.
  • Axudan a programar: Pódenlles dar indicacións a programadores para escribir código.
  • Traducen entre idiomas: Traducen texto dun idioma a outro de xeito moi preciso.
  • Resumen documentos longos: Extraen a información máis importante de textos extensos.
  • Responden preguntas complexas: Son capaces de dar respostas elaboradas a temas complicados.

Non é ciencia ficción, é tecnoloxía que xa existe! Ferramentas coma ChatGPT ou Claude están a cambiar a forma en que aprendemos, traballamos e comunicámonos.

Pero non son máxicas, son ferramentas que nos axudan, non que nos substitúen. Un bo estudiante sempre será máis importante que calquera intelixencia artificial.

Como Funcionan os Modelos de Linguaxe Grandes?

Os MLL aprenden a partir de millóns de textos e datos que "len" na internet. Canto máis información procesaren, mellor entenden a linguaxe e poden producir contidos. É coma se fosen estudantes que se formaran lendo moitos libros.

Grazas a técnicas avanzadas de intelixencia artificial, os MLL son capaces de recoñecer patróns e estruturas na linguaxe, entender o contexto e xerar textos coherentes e apropiados.

O Futuro da IA na Educación e a Sociedade

Nos próximos anos, estas tecnoloxías van estar presentes en case todo o que fagamos: aplicacións, webs, traballos de oficina, educación... Van cambiar moitas cousas, para bene e para mal.

É importante aprender a usalas de maneira responsable. Deben ser ferramentas para axudarnos, non para substituírnos. A nosa creatividade, razoamento e competencias humanas seguirán sendo esenciais.

¿Que che parecen estas máquinas "intelixentes"? ¿Cres que poden chegar a ser perigosas ou beneficiosas? Coméntamelo abaixo!