AI
30. enero 2024 por Tim Bunkus
La IA generativa ha sido tema de conversación desde el lanzamiento de ChatGPT. Pero, ¿qué es y cómo se diferencia de aprendizaje automático o aprendizaje profundo? En esta entrada de blog, exploraré los muchos aspectos de la IA.
Inteligencia artificial: el furor desde 1956
El término "IA" fue acuñado por primera vez en 1956 por el científico informático John McCarthy, quien lo describió como "la ciencia y tecnología de hacer máquinas inteligentes". Desde entonces, ha evolucionado para convertirse en un campo interdisciplinario de la ciencia que se centra en simular, comprender y mejorar el comportamiento inteligente de las máquinas.
Los orígenes de la IA se remontan a los primeros días de la informática y las matemáticas. En el siglo XVII, el filósofo y matemático Gottfried Wilhelm Leibniz desarrolló un lenguaje universal de lógica, al que llamó característica universal. Soñaba con una máquina que pudiera sacar conclusiones lógicas y generar conocimiento. Avancemos rápidamente hasta el siglo XX, cuando se sentaron las bases de la IA moderna en el trabajo de Alan Turing, Claude Shannon, Norbert Wiener y otros, quienes se enfocaron en la computabilidad, la teoría de la información, la cibernética y las redes neuronales artificiales.
Para hacer más comprensible el amplio campo de la inteligencia artificial, hoy en día hacemos una distinción entre tres métodos principales de IA: aprendizaje automático, aprendizaje profundo e IA generativa. Estos se desarrollaron uno tras otro y se basan en el anterior. Cada uno de ellos se describirá con más detalle a continuación.
Machine Learning – Algoritmos simples y aprendientes
Machine Learning (ML) es un subcampo de la IA que se ocupa del desarrollo de algoritmos y modelos que pueden aprender de datos sin ser programados explícitamente. ML es la fuerza impulsora detrás de la primera ola de la IA, que comenzó en los años 80 y se basó principalmente en métodos estadísticos. La estadística es la fuerza impulsora detrás de ML, ya que permite identificar patrones y relaciones en grandes conjuntos de datos y hacer predicciones.
Beneficios de la explicabilidad de los modelos de ML
Una ventaja de los modelos de ML es que, en muchos casos, son explicables, es decir, se puede comprender cómo llegaron a una decisión o recomendación específica. Esto es importante para aumentar la confianza y aceptación de los usuarios, garantizar la responsabilidad y transparencia, y corregir posibles errores o sesgos. La explicabilidad es especialmente relevante para áreas de aplicación con altos requisitos éticos o legales, como la medicina, las finanzas o la administración pública.
Áreas de aplicación actuales de ML
Hoy en día, ML se utiliza en una variedad de áreas para resolver u optimizar problemas complejos. Algunos ejemplos son:
Sistemas de recomendación, que permiten sugerencias personalizadas para productos, servicios o contenidos.
Detección de anomalías, que permite detectar patrones o actividades inusuales o sospechosas en los datos.
Analítica predictiva, que permite predecir eventos o tendencias futuras basadas en datos históricos.
Deep Learning - Algoritmos aprendientes complejos
Deep Learning (DL) es otro subcampo de la IA que se ocupa del desarrollo de redes neuronales artificiales compuestas por múltiples capas de neuronas artificiales interconectadas. DL es la fuerza impulsora detrás de la segunda ola de la IA, que ha estado ocurriendo desde los años 2010 y se basa principalmente en la disponibilidad de grandes conjuntos de datos y recursos computacionales potentes. Las redes neuronales artificiales son modelos de procesos de pensamiento humano, que pueden modelar y aprender funciones no lineales complejas.
Complejidad escalable, pero pérdida de explicabilidad
Una ventaja del DL es la complejidad escalable, es decir, la capacidad de extraer y representar características cada vez más complejas y abstractas de los datos. Esto conduce a una mayor precisión y rendimiento en muchas áreas de aplicación, especialmente en aquellas que involucran datos no estructurados como texto, imágenes o sonido. Sin embargo, una desventaja del DL es la pérdida de explicabilidad, ya que es matemáticamente muy difícil de entender cómo las redes neuronales artificiales llegaron a una decisión o recomendación específica. Esto puede resultar en una falta de confianza, transparencia y responsabilidad, así como posibles errores o sesgos.
Áreas de aplicación actuales del Aprendizaje Profundo
DL se utiliza hoy en día en una variedad de áreas para crear nuevas posibilidades o mejorar soluciones existentes. Algunos ejemplos son:
Visión por computadora, que permite procesar y comprender información visual.
Procesamiento del lenguaje natural
IA generativa - Algoritmos complejos de generación de información
La IA generativa (GenAI) es otro subgrupo de la IA que se ocupa del desarrollo de modelos capaces de generar nuevos datos o contenido que se asemejen a los que han aprendido. GenAI es la fuerza impulsora detrás de la tercera ola de la IA, que comienza en los años 2020 y se basa principalmente en el desarrollo de modelos de transformadores.
Los Transformadores llegan
La arquitectura de transformadores es un nuevo tipo de redes neuronales artificiales que se presentó en 2017 en el documento "Attention is all you need". La arquitectura de transformadores se basa en el concepto de atención, que permite identificar y ponderar las partes más relevantes de una entrada para producir una salida. La arquitectura de transformadores consta de dos componentes principales: el codificador y el decodificador. El codificador convierte la entrada en una serie de vectores que contienen la información semántica y sintáctica de la entrada. El decodificador genera la salida a partir de los vectores del codificador, prestando atención tanto a la entrada como a la salida generada hasta el momento.
Vectores: como ayudantes de clasificación matemáticos
Todos los procedimientos de Machine y Deep Learning comparten el hecho de que los modelos, en última instancia, realizan operaciones matemáticas. Dado que estas operaciones se basan en números, cualquier información no estructurada como texto, imagen o sonido debe convertirse primero en números. Para ello, a cada unidad de información, como una palabra, un píxel o una amplitud, se le asigna un vector que contiene las características de esa unidad. Al utilizar vectores, la información puede representarse en un espacio (matemático) común, donde la similitud o relación entre la información puede medirse mediante la distancia o el ángulo entre los vectores.
Al usar vectores, no solo se pueden representar información textual, sino también otros tipos de información como audio, imágenes o incluso proteínas. Esto abre nuevas posibilidades para GenAI, permitiendo generar o procesar diferentes tipos de información que no se basan en lenguaje natural. Algunos ejemplos son:
Jukebox: un modelo capaz de generar música al aprender de un gran corpus musical y luego aplicarse a diversas tareas como estilo musical, letras de canciones o composición musical.
CLIP (Preentrenamiento de Lenguaje-Imagen Contrastivo): un modelo capaz de comprender imágenes al aprender de un gran corpus de texto-imagen y luego aplicarse a diversas tareas como clasificación de imágenes, búsqueda de imágenes o descripción de imágenes.
AlphaFold: un modelo capaz de predecir la estructura tridimensional de proteínas al aprender de un gran corpus de proteínas y luego aplicarse a diversas tareas como diseño de proteínas, interacción de proteínas o función de proteínas.
Modelos Multimodales - los Maestros de Todo
Los modelos multimodales son modelos GenAI capaces de generar o procesar múltiples tipos de información simultáneamente, como texto e imagen, texto y sonido, o imagen y sonido. Esto requiere un alto nivel de complejidad e integración en los modelos, ya que deben ser capaces de combinar y coordinar la información diferente para producir una salida coherente y significativa.
Casos de Uso de la IA Generativa
Los casos de uso de la IA Generativa son extremadamente diversos y pueden convertirse en verdaderos maestros en el campo de la IA mediante la combinación con Aprendizaje Automático y Profundo clásico, búsqueda semántica y bases de conocimiento. Para una mejor clasificación, diferenciamos fundamentalmente tres tipos de áreas de aplicación:
Agentes de Conocimiento de Dominio
Un Agente de Conocimiento de Dominio es un modelo GenAI capaz de generar o impartir conocimiento al aprender previamente un dominio específico y luego aplicarse a diversas tareas como enseñanza de conocimientos, evaluación de conocimientos o generación de conocimientos.
GenAI en el Desarrollo de Aplicaciones
GenAI en el desarrollo de aplicaciones es el uso de modelos GenAI para apoyar o acelerar el desarrollo de aplicaciones mediante la generación o mejora de varios aspectos de la aplicación, como diseño, función o contenido.
Copiloto para Producción de Texto e Imágenes
El Copiloto para la producción de texto e imágenes es el uso de modelos GenAI para apoyar o mejorar la producción de contenido de texto o imágenes mediante la generación o optimización de varios aspectos del contenido, como calidad, creatividad o relevancia.
Perspectivas y Conclusiones
La IA Generativa es un campo de investigación emocionante e innovador que está produciendo cada vez más modelos con habilidades especializadas para generar o procesar diferentes tipos de información. Estos modelos tienen el potencial de integrar y revolucionar toda la comunicación al ofrecer nuevas oportunidades para la interacción, colaboración y creatividad. Sin embargo, esto no significa que los métodos "clásicos" de Aprendizaje Automático y Profundo pierdan su relevancia, ya que siguen siendo adecuados para tareas o requisitos específicos que requieren un mayor nivel de explicabilidad, robustez o eficiencia.
Al pensar en Gottfried Wilhelm Leibniz y su sueño de una máquina que pueda generar conocimiento y sacar conclusiones lógicas, vemos que la iteración de los métodos de IA nos acerca cada vez más a ese sueño. Aunque GenAI aún no es capaz de mostrar una inteligencia universal o general que pueda aplicarse a cualquier situación o problema, somos capaces de enfrentar una variedad de desafíos específicos de la empresa mediante la combinación (inteligente) de diferentes métodos de IA.
Para conocer más sobre GenAI y cómo podemos ayudarlo, visita nuestro sitio web. Podcasts, blogs, eventos, estudios y mucho más: le ofrecemos una visión general completa de todos los temas relacionados con GenAI. Obtenga más información sobre GenAI en nuestro sitio web.