Inteligencia Artificial y la importancia de las cargas de trabajo

Hoy en día es muy común nuestra interacción con la Inteligencia Artificial (IA), ya sea de manera directa o indirecta. En los celulares podemos encontrar asistentes como Siri o Cortana que utilizan procesamiento de lenguaje natural mediante IA para funcionar como verdaderos asistentes personales.

En los últimos años, varias personas piensan que sus dispositivos los están escuchando porque les aparecen productos mediante ecommerce en los que han estado pensando, pero muy probablemente no es el caso, sino, es a través del marketing automation, que mediante estrategias de ecommerce y algoritmos, se te ofrecen recomendaciones exclusivas de productos basados en modelos de cestas de compra e intereses que cada persona tiene; similar a las plataformas de series y películas como Netflix, HBO o Amazon Prime, que sugieren series y películas que pueden gustarte en función de los datos obtenidos de visualizaciones anteriores; así podríamos seguir con muchísimos ejemplos, porque hoy en día la interacción es muchísima. En este blog trataremos de responder preguntas como ¿Qué es la inteligencia artificial?, ¿Es nueva? y ¿Qué tanta información se procesa?

¿Qué es la Inteligencia Artificial?

Primero necesitamos entender que es la inteligencia artificial, en términos simples, inteligencia artificial (IA) se refiere a sistemas o máquinas que imitan la inteligencia humana para realizar tareas y pueden mejorar iterativamente a partir de la información que recopilan. La IA trata mucho más sobre el proceso, la capacidad de pensamiento supe apoderado y el análisis de datos sobre cualquier formato o función en particular.

Debemos dejar atrás pensamientos erróneos, como que la IA son robots de aspecto humano de alto funcionamiento que se apoderarán del mundo, ya que esto está lejos de la realidad, principalmente porque la IA no pretende reemplazar a los humanos. Su objetivo es mejorar significativamente las capacidades y contribuciones humanas, lo que lo convierte en un activo empresarial muy valioso.

El origen de la Inteligencia Artificial

Aunque parezca un concepto muy futurístico y moderno, más bien propio de películas de ciencia ficción, en realidad la IA se formalizó como tal en 1950 gracias a Alan Turing, quien es considerado el padre de la computación moderna, ya que publicó en el año de 1936 su artículo sobre los números computables en el que introduce el concepto de algoritmo. Posteriormente, en 1950, propone en su ensayo titulado Computing Machinery and Intelligence, el que sería conocido como el Test de Turing, una prueba de comunicación verbal hombre-máquina que evalúa la capacidad de las segundas de hacerse pasar por humanos.

Pero fue hasta el año 1956 que el informático John McCarthy acuña por primera vez el término Inteligencia Artificial durante la conferencia de Darmouth de 1956. Un año después Frank Rosenblat diseña la primera red neuronal artificial, que fue precursor para ELIZA, quien quizás fue el primer chatbot del mundo y fue el primer programa en incorporar el procesamiento del lenguaje natural humano cuyo objetivo es enseñar a las computadoras a comunicarse con nosotros en nuestro lenguaje, en lugar de requerir una programación en código.

Un evento clave en la historia de la inteligencia artificial fue cuando la supercomputadora Deep Blue, creada por IBM, vence al campeón del mundo de ajedrez Gary Kasparov en 1997. Con el tiempo fue mejorando y en el 2005, usando la Ley de Moore, Raymond Kurzweil predijo que las máquinas alcanzarán un nivel de inteligencia humano en 2029, y que de seguir para el año 2045 habrán superado la inteligencia de nuestra civilización en un billón de veces. Raymond Kurzweil no se equivocaba y lo pudimos notar en 2014, cuando un bot computacional llamado Eugene Goostman fue capaz de engañar a 30 de los 150 jueces a los que se sometió durante el test de Turing haciéndoles creer que estaban hablando con un niño ucraniano de 13 años.

Photo by George Becker on Pexels.com

La utilidad de la IA para las empresas

Las empresas utilizan cada vez más los activos de datos para acelerar su competitividad y generar mayores ingresos. Parte de esta estrategia es utilizar herramientas y tecnologías de aprendizaje automático e inteligencia artificial. Pero las cargas de trabajo de IA tienen necesidades informáticas y de almacenamiento de datos significativamente diferentes a las de las cargas de trabajo genéricas.

Las cargas de trabajo de inteligencia artificial y aprendizaje automático requieren grandes cantidades de datos tanto para construir y entrenar los modelos como para mantenerlos en funcionamiento. Cuando se trata de almacenamiento para estas cargas de trabajo, el almacenamiento de datos a largo plazo y de alto rendimiento son las preocupaciones más importantes.

Requerimientos de las cargas de trabajo de IA

Las cargas de trabajo de aprendizaje automático e IA tienen requisitos de almacenamiento muy específicos. Éstos incluyen:

  • Escalabilidad: Procesar exponencialmente más volúmenes de datos da como resultado solo mejoras lineales en los modelos de IA. Esto significa que para aumentar la precisión de los modelos de aprendizaje automático, las empresas deben recopilar y almacenar cada vez más datos cada día.
  • Accesibilidad: Los datos deben ser accesibles continuamente. El aprendizaje automático y el entrenamiento de la IA requieren que el sistema de almacenamiento lea y vuelva a leer conjuntos de datos completos, generalmente de forma aleatoria.
  • Latencia: La latencia de entradas y salidas es importante para construir y usar modelos de IA, porque los datos se leen y releen muchas veces.
  • Rendimiento: El rendimiento de los sistemas de almacenamiento también es fundamental para el aprendizaje automático. Los procesos de capacitación utilizan cantidades masivas de datos, a menudo medidos en terabytes por hora. Puede ser un desafío para muchos sistemas de almacenamiento entregar este nivel de datos de acceso aleatorio.
  • Acceso paralelo: Para lograr un alto rendimiento, los modelos de aprendizaje automático dividirán la actividad en múltiples tareas paralelas. A menudo, esto significa que los algoritmos de aprendizaje automático acceden a los mismos archivos desde múltiples procesos, potencialmente en múltiples servidores físicos, al mismo tiempo. Los sistemas de almacenamiento deben poder hacer frente a la demanda concurrente sin afectar el rendimiento.

Diferentes tecnologías de almacenamiento.

Dada la elección, la forma más rápida de procesar cualquier conjunto de datos es almacenar su contenido en la memoria, ya que la RAM dinámica (DRAM) funciona a velocidades de nanosegundos. Sin embargo, las plataformas de servidor tienen una capacidad de memoria limitada. Por ejemplo, incluso un solo servidor con un máximo de 6 TB de DRAM es demasiado pequeño para procesar cargas de trabajo del aprendizaje automático y de la inteligencia artificial.

  • Block-based: Históricamente ha ofrecido la latencia más baja para I/O, pero no brinda escalabilidad para implementaciones de varios petabytes. El costo también es un factor en los productos de bloque de alto rendimiento.
  • File-based: Proporciona escalabilidad y el método de acceso correcto para datos no estructurados. Pero históricamente, los productos basados en archivos no han ofrecido los niveles más altos de rendimiento.
  • Object Storage: Ofrece el mayor nivel de escalabilidad y un protocolo de acceso más simplificado a través de HTTP. Los almacenes de objetos son buenos para gestionar varias solicitudes de I/O simultáneas, pero por lo general no ofrecen el mejor rendimiento ni la latencia más baja. Esto se debe a que la mayoría de los sistemas de almacenamiento de objetos se basan en medios giratorios para reducir costos.

Dadas las diversas compensaciones, algunas implementaciones de aprendizaje automático y la IA utilizarán una combinación de tipos de plataforma, almacenando la mayoría de los datos, pero esto debe evitarse, si es posible, ya que puede introducir demoras adicionales en el procesamiento a medida que se mueven los datos.

Algunas soluciones disponibles del mercado

Muchos proveedores venden productos de almacenamiento independientes y pre-empaquetados para el aprendizaje automático y las cargas de trabajo de IA. Algunos ejemplos pueden ser Pure Storage, Dell EMC, IBM y NetApp Inc. ofrecen productos de tipo infraestructura convergente que empaquetan almacenamiento, redes y cómputo con GPU DGX de Nvidia Corp. en un solo rack. Los paquetes de productos de DataDirect Network amplían el almacenamiento de archivos con GPU Nvidia DGX-1.

Photo by Christina Morillo on Pexels.com

Autor: Víctor Saucedo
Revisado por: Gemma Martínez

Referencias:
¿Qué es la inteligencia artificial? Obtenga más información sobre la inteligencia artificial (s.f.). Oracle Cloud Infrastructure. Recuperado el 25 de octubre de 2022, de https://www.oracle.com/mx/artificial-intelligence/what-is-ai/
Breve historia visual de la inteligencia artificial (2020). National Geographic España. Recuperado el 25 de octubre de 2022, de https://www.nationalgeographic.com.es/ciencia/breve-historia-visual-inteligencia-artificial_14419
Evans, C. (2019). Storage strategies for machine learning and AI workloads. Tech Taeget. Recuperado el 25 de octubre de 2022, de https://www.techtarget.com/searchstorage/feature/Storage-strategies-for-machine-learning-and-AI-workloads

Deja un comentario