jueves, 10 de abril de 2025

LA IA

 https://www.ibm.com/mx-es/think/topics/artificial-intelligence

La inteligencia artificial (IA) es una tecnología que permite a las computadoras y máquinas simular el aprendizaje humano, la comprensión, la resolución de problemas, la toma de decisiones, la creatividad y la autonomía.

Las aplicaciones y dispositivos equipados con IA pueden ver e identificar objetos. Pueden entender y responder al lenguaje humano. Pueden aprender de nueva información y experiencia. Pueden hacer recomendaciones detalladas a usuarios y expertos. Pueden actuar de manera independiente, reemplazando la necesidad de inteligencia o intervención humana (un ejemplo clásico es un automóvil autónomo).

Pero en 2024, la mayoría de los investigadores y profesionales de la IA (y la mayoría de los titulares relacionados con la IA) se centran en los avances en la IA generativa , una tecnología que puede crear texto, imágenes, videos y otros contenidos originales. Para comprender plenamente la IA generativa, es importante entender primero las tecnologías sobre las que se basan las herramientas de IA generativa: machine learning (ML) y aprendizaje profundo.

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

Aprendizaje automático

Una forma sencilla de pensar en la IA es como una serie de conceptos anidados o derivados que surgieron a lo largo de más de 70 años:

Diagrama que compara diferentes tipos de conceptos de machine learning como cajas anidadas en tonos azulados.

Cómo se relacionan la inteligencia artificial, el machine learning, el aprendizaje profundo y la generativa IA.

Directamente debajo de la IA, tenemos machine learning, que consiste en crear modelos entrenando a un algoritmo para hacer predicciones o tomar decisiones basadas en datos. Abarca una amplia gama de técnicas que permiten a las computadoras aprender y hacer inferencias basadas en datos sin estar programados explícitamente para tareas específicas.

Existen muchos tipos de técnicas o algoritmos de machine learning, como regresión linealregresión logísticaárboles de decisiónbosques aleatoriosmáquinas de vectores de soporte (SVM)k vecinos más cercanos (KNN), clustering y otros. Cada uno de estos enfoques es adecuado para distintos tipos de problemas y datos.

Pero uno de los tipos más populares de algoritmo de machine learning se llama Neural Networks (o redes neuronales artificiales). Neural Networks se modela a partir de la estructura y función del cerebro humano. Neural Networks consta de capas interconectadas de nodos (análogas a las neuronas) que trabajan juntas para procesar y analizar datos complejos. Neural Networks es adecuado para tareas que implican identificar patrones y relaciones complejos en grandes cantidades de datos.

La forma más sencilla de machine learning es llamada aprendizaje supervisado, que implica el uso de conjuntos de datos etiquetados para capacitar algoritmos a clasificar datos o predecir resultados con precisión. En el aprendizaje supervisado, los humanos emparejan cada ejemplo de entrenamiento con una etiqueta de salida. El objetivo es que el modelo aprenda el mapeo entre entradas y salidas en los datos de entrenamiento, para que pueda predecir las etiquetas de datos nuevos e invisibles.

AI vs Machine Learning (5:49 min)

Aprendizaje profundo

El aprendizaje profundo es un subconjunto de machine learning que utiliza redes neuronales multicapa, llamadas redes neuronales profundas, que simulan más de cerca el complejo poder de toma de decisiones del cerebro humano.

Las redes neuronales profundas incluyen una capa de entrada, al menos tres pero generalmente cientos de capas ocultas, y una capa de salida, a diferencia de Neural Networks utilizados en los modelos clásicos de machine learning, que generalmente tienen solo una o dos capas ocultas.

Estas múltiples capas permiten el aprendizaje no supervisado: pueden automatizar la extracción de características de conjuntos de datos grandes, no etiquetados y no estructurados, y hacer sus propias predicciones sobre lo que representan los datos.

Al no requerir intervención humana, el deep learning permite el machine learning a gran escala. Es muy adecuado para el procesamiento de lenguaje natural (PLN)la visión artificial y otras tareas que requieren identificar rápidamente y con precisión patrones y relaciones complejas en grandes volúmenes de datos. La mayoría de las aplicaciones de inteligencia artificial (IA) que utilizamos hoy en día se basan en algún tipo de aprendizaje profundo.

Un diagrama que muestra cómo se procesan los datos en una Neural Networks profunda

En una red neuronal profunda, varias capas de nodos pueden extraer significado y relaciones de grandes volúmenes de datos no estructurados y sin etiquetar.

El aprendizaje profundo también permite:

  • Aprendizaje semisupervisado, que combina el aprendizaje supervisado y no supervisado mediante el uso de datos etiquetados y no etiquetados para capacitar modelos de IA para tareas de clasificación y regresión.

  • Aprendizaje autosupervisado, que genera etiquetas implícitas a partir de datos no estructurados, en lugar de depender de conjuntos de datos etiquetados para obtener señales de supervisión.

  • Aprendizaje por refuerzo, que aprende mediante funciones de prueba y error y recompensa en lugar de extraer información de patrones ocultos.

  • Aprendizaje por transferencia, en el que el conocimiento adquirido a través de una tarea o conjunto de datos se emplea para mejorar el rendimiento del modelo en otra tarea relacionada o conjunto de datos diferente.

IA generativa

La IA generativa, a veces denominada "IA gen"hace referencia a modelos de aprendizaje profundo que pueden crear contenidos originales complejos, como texto extenso, imágenes de alta calidad, video o audio realistas y mucho más, en respuesta a una solicitud o petición del usuario.

En un alto nivel, los modelos generativos codifican una representación simplificada de sus datos de entrenamiento y luego extraen de ella para crear un nuevo trabajo similar, pero no idéntico, a los datos originales.

Los modelos generativos se han utilizado durante años en estadísticas para analizar datos numéricos. Pero en la última década, evolucionaron para analizar y generar tipos de datos más complejos. Esta evolución coincidió con la aparición de tres tipos sofisticados de modelos de aprendizaje profundo:

  • Autocodificadores variacionales o VAE, que se introdujeron en 2013, y habilitaron modelos que podrían generar múltiples variaciones de contenido en respuesta a un indicador o instrucción.

  • Modelos de difusión, vistos por primera vez en 2014, que agregan "ruido" a las imágenes hasta que son irreconocibles y luego eliminan el ruido para generar imágenes originales en respuesta a indicaciones.

  • Transformadores (también llamados modelos de transformadores), que se capacitan con datos secuenciados para generar secuencias extendidas de contenido (como palabras en oraciones, formas en una imagen, fotogramas de un video o comandos en código de software). Los transformadores están en el núcleo de la mayoría de las herramientas de IA generativa que generan titulares en la actualidad, incluidas ChatGPT y GPT-4, Copilot, BERT, Bard y Midjourney.
Mixture of Experts | Podcast

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Cómo funciona la IA generativa

En general, la IA generativa opera en tres fases:

  1. Entrenamiento, para crear un modelo fundacional.
  2. Ajuste, para adaptar el modelo a una aplicación específica.
  3. Generación, evaluación y más ajuste, para mejorar la precisión.

Capacitación

La IA generativa comienza con un modelo "fundacional"; un modelo de aprendizaje profundo que sirve de base para múltiples tipos de aplicaciones de IA generativa.

Los modelos fundacionales más comunes hoy en día son los modelos de lenguaje de gran tamaño (LLM), creados para aplicaciones de generación de texto. Pero también hay modelos fundacionales para la generación de imágenes, videos, sonido o música, y modelos fundacionales multimodales que admiten varios tipos de contenido.

Para crear un modelo fundacional, los profesionales entrenan un algoritmo de aprendizaje profundo en enormes volúmenes de datos relevantes sin procesar, no estructurados y sin etiquetar, como terabytes o petabytes de datos, texto, imágenes o video de Internet. El entrenamiento produce una neural network de miles de millones de parámetros (representaciones codificadas de las entidades, patrones y relaciones en los datos) que pueden generar contenido de forma autónoma en respuesta a instrucciones. Este es el modelo fundacional.

Este proceso de entrenamiento requiere un uso intensivo de recursos informáticos, requiere mucho tiempo y es costoso. Requiere miles de unidades de procesamiento de gráficos en clúster (GPU) y semanas de procesamiento, todo lo cual generalmente cuesta millones de dólares. Los proyectos de modelos fundacionales de código abierto, como Llama-2 de Meta, permiten a los desarrolladores de IA generativa evitar este paso y sus costos.

Ajuste

A continuación, el modelo debe estar ajustado a una tarea específica de generación de contenido. Esto se puede hacer de varias maneras, que incluyen:

  • Ajuste fino, que implica introducir en la aplicación del modelo datos etiquetados específicos (preguntas o instrucciones que es probable que reciba la aplicación y las respuestas correctas correspondientes en el formato deseado).

  • Aprendizaje por refuerzo con feedback humano (RLHF), en el que los usuarios humanos evalúan la precisión o relevancia de los resultados del modelo para que el modelo pueda mejorar a sí mismo. Esto puede ser tan simple como hacer que las personas escriban o respondan las correcciones a un chatbot o asistente virtual.

Generación, evaluación y más ajuste

Los desarrolladores y usuarios evalúan regularmente los resultados de sus aplicaciones de IA generativa y ajustan adicionalmente el modelo, incluso una vez a la semana, para aumentar su precisión o relevancia. En contraste, el modelo fundacional se actualiza con mucha menos frecuencia, quizás cada año o cada 18 meses.

Otra opción para mejorar el rendimiento de una aplicación de IA generativa es la generación aumentada por recuperación (RAG), una técnica para ampliar el modelo fundacional y utilizar fuentes relevantes fuera de los datos de entrenamiento para refinar los parámetros y lograr una mayor precisión o relevancia.

Beneficios de la IA 

La IA ofrece numerosos beneficios en diversas industrias y aplicaciones. Algunos de los beneficios más comúnmente citados incluyen:

  • Automatización de tareas repetitivas.
  • Más insights más rápido a partir de los datos.
  • Toma de decisiones mejorada.
  • Menos errores humanos.
  • Disponibilidad 24x7.
  • Reducción de riesgos físicos.

Automatización de tareas repetitivas

La IA puede automatizar tareas rutinarias, repetitivas y a menudo tediosas, incluidas las tareas digitales como la recopilación de datos, entrada y preprocesamiento, y tareas físicas como la selección de existencias de almacén y los procesos de fabricación. Esta automatización libera para trabajar en trabajos más creativos y de mayor valor.

Toma de decisiones mejorada

Tanto si se utiliza como apoyo a la toma de decisiones como si se trata de una toma de decisiones totalmente automatizada, la IA permite realizar predicciones más rápidas y precisas y tomar decisiones basadas en datos confiables. Combinada con la automatización, la IA permite a las empresas aprovechar las oportunidades y responder a las crisis a medida que surgen, en tiempo real y sin intervención humana.

Menos errores humanos

La IA puede reducir los errores humanos de varias maneras, desde guiar a las personas a través de los pasos adecuados de un proceso, hasta señalar posibles errores antes de que ocurran y automatizar completamente los procesos sin intervención humana. Esto es especialmente importante en industrias como la de la atención médica, donde, por ejemplo, la robótica quirúrgica guiada por IA permite una precisión constante.

Los algoritmos de machine learning pueden mejorar continuamente su precisión y reducir aún más los errores a medida que están expuestos a más datos y "aprender" de la experiencia.

Disponibilidad y consistencia las 24 horas del día

La IA está siempre activa, disponible las 24 horas del día y ofrece un rendimiento constante. Herramientas como los chatbots de IA o los asistentes virtuales pueden reducir la necesidad de personal para el servicio de atención al cliente. En otras aplicaciones, como el procesamiento de materiales o las líneas de producción, la IA puede ayudar a mantener la calidad del trabajo y los niveles de producción al automatizar tareas repetitivas o tediosas.

Reducción del riesgo físico

Al automatizar trabajos peligrosos (como el control de animales, el manejo de explosivos, la realización de tareas en aguas profundas, en grandes altitudes o en el espacio exterior), la IA puede eliminar la necesidad de poner a los trabajadores humanos en riesgo de sufrir lesiones o algo peor. Si bien aún deben perfeccionar, los automóvil y otros vehículos autónomos ofrecen el potencial de reducir el riesgo de lesiones a los pasajeros.

Casos de uso de IA 

Las aplicaciones de la IA en el mundo real son muchas. Aquí hay solo una pequeña muestra de casos de uso en varias industrias para ilustrar su potencial:

Experiencia del cliente, servicio y soporte

Las compañías pueden implementar chatbots y asistentes virtuales impulsados por IA para manejar las consultas de los clientes, los tickets de soporte y más. Estas herramientas emplean el procesamiento de lenguaje natural (PLN) y las capacidades de IA generativa para comprender y responder a las preguntas de los clientes sobre el estado de los pedidos, los detalles del producto y las políticas de devolución.

Los chatbots y los asistentes virtuales permiten una asistencia permanente, ofrecen respuestas más rápidas a las preguntas más frecuentes (FAQ), liberan a los agentes humanos para que puedan centrar en tareas de mayor nivel y ofrecen a los clientes un servicio más rápido y coherente.


No hay comentarios.:

Publicar un comentario

LA IMPORTANCIA DE EL RECICLAJE

https://www.mancomunidaddetentudia.com/portal/la-importancia-del-reciclaje/   Todos sabemos que es conveniente tirar el papel y el vidrio en...