miércoles, 22 octubre 2025

  • Tecnología
  • Estilo de Vida
    Estilo de Vida
    Gastronomía
    Viajes
    Salud
  • Columnas
  • Negocios
  • Nombramientos
  • Noticias
  • Trivias
  • Empresas













Sin infraestructura resiliente, la IA es solo una promesa

martes, 21 de octubre de 2025

Julio César Castrejón, Country Manager de Nutanix México

Se suponía que la tecnología lo simplificaría todo: decisiones más rápidas, sistemas más inteligentes, operaciones más eficientes. Pero para muchos líderes, la realidad es muy distinta: aumento de costos, creciente riesgo cibernético, complejidad y una multi nube cada vez más difícil de gestionar. La IA ahora promete ayudar a resolver esto, pero en realidad, tiene mucho trabajo por delante.
 
Incluso los proyectos más avanzados están sintiendo la presión. Gartner predice que más del 40 % de los proyectos de IA con agentes se cancelarán para finales de 2027, frustrados por el aumento vertiginoso de los costos, el bajo retorno de la inversión (ROI) o la insuficiencia de controles de riesgos. No es que la IA no pueda aportar valor, sino que sus cimientos no están preparados para lo que viene.
 
Lo cierto es que gran parte de la frustración en torno a la IA no se debe en absoluto a ella. Se centra en los sistemas subyacentes y en la capacidad de una organización para ver realmente lo que sucede en ellos. A pesar de todo el revuelo en torno a los agentes inteligentes y los flujos de trabajo autónomos, el éxito aún depende de algo mucho menos atractivo: el rendimiento, la visibilidad y la resiliencia de las plataformas en las que se ejecutan esos modelos. Cuando la infraestructura no puede seguir el ritmo, los costos aumentan, el rendimiento disminuye y la complejidad se multiplica. Ahí es donde empiezan a aparecer las grietas.
 
Siguen apareciendo tres puntos dolorosos recurrentes:
•    Las cargas de trabajo de IA están hambrientas de datos: Los modelos modernos devoran datos. Las ejecuciones de entrenamiento y los procesos de generación aumentada por recuperación (RAG) dependen del acceso de alto rendimiento a archivos, objetos y datos vectoriales distribuidos en entornos híbridos. Sin embargo, los sistemas de almacenamiento tradicionales no se diseñaron para este ritmo. Los cuellos de botella de E/S limitan el rendimiento, las GPU permanecen inactivas esperando datos y cada segundo se convierte en computación desperdiciada. Para muchas empresas, el almacenamiento se ha convertido en un obstáculo para el progreso de la IA.
•    No tienes observabilidad si se limita a las métricas de infraestructura: La mayoría de las organizaciones pueden ver la carga de la CPU, las IOPS del disco y la latencia de la red, pero eso es solo una parte del panorama. La verdadera observabilidad implica correlacionar esas señales de la infraestructura con el comportamiento del modelo: precisión, desviación, rendimiento, tasas de error e incluso el costo por inferencia. Cuando los datos, la computación y los modelos están dispersos en nubes, esta visión integral desaparece. Los equipos acaban reaccionando a síntomas, como consultas más lentas y aumentos en las facturas, sin comprender las causas raíz. La observabilidad, en pocas palabras, debería responder a una pregunta: ¿Qué está pasando, por qué y qué debemos hacer al respecto?
•    La fragilidad es una amenaza oculta: Las cargas de trabajo de IA son notoriamente implacables. Un fallo en un solo nodo, una fluctuación de energía o una interrupción regional pueden desbaratar los flujos de trabajo de producción, interrumpir los procesos de inferencia y minar la confianza empresarial. Muchas empresas aún dependen de conmutaciones por error manuales o de planes de recuperación ante desastres sin probar. La verdadera resiliencia implica redundancia interregional, recuperación automatizada y validación continua, ya que en IA, el tiempo de actividad equivale a confianza.
Estos tres retos son la causa de las cancelaciones, los sobrecostos y las decepciones que advierte Gartner. Y son la razón por la que el rendimiento y la resiliencia, los dos componentes menos atractivos del conjunto, se han convertido repentinamente en los más estratégicos.
 
Entonces, ¿cómo se ve lo correctamente implementado?
 
Todo empieza por reconocer que el rendimiento es consecuencia de una arquitectura más inteligente (y no necesariamente de un mejor hardware). Los mejores sistemas de IA se alimentan de un almacenamiento que puede seguir el ritmo. Esto significa que son rápidos, escalables e inteligentes, lo suficiente como para equilibrar costo y velocidad. Cuando las cargas de trabajo o los procesos de generación con recuperación aumentada pisan el acelerador, los datos deben moverse con la misma rapidez. Las arquitecturas de almacenamiento por niveles optimizadas para IA hacen precisamente eso: alimentan las GPU a velocidad de línea y, al mismo tiempo, ofrecen la durabilidad y la auditabilidad necesarias para el cumplimiento normativo.
 
Pero el rendimiento por sí solo no es suficiente. Sin visibilidad, incluso los sistemas mejor diseñados operan a ciegas. La observabilidad debe ir más allá de los paneles y las alertas. Debe conectar los puntos entre el estado de la infraestructura y el comportamiento del modelo. Es la capacidad de ver cómo un pico de GPU en una región afecta la latencia de inferencia en otra, o cómo la congestión de la red está degradando la precisión del modelo. Cuando se puede ver todo, datos, computación y rendimiento del modelo, se puede ajustar, corregir y, en última instancia, confiar en él.
 
Y luego está la resiliencia, la heroína silenciosa de la escalabilidad de la IA. Cuanto más distribuida se vuelve la IA, más frágil se vuelve. Los modelos se entrenan en diferentes regiones, los datos fluyen entre nubes, y una sola interrupción puede tener consecuencias negativas para todo. La respuesta no es la redundancia por la redundancia, sino la resiliencia por diseño. Migración dinámica de cargas de trabajo, infraestructura autorrecuperable y validación continua de los procesos de conmutación por error. Eso es lo que convierte a la IA de una herramienta experimental a un activo operativo.
 
En realidad, el rendimiento, la observabilidad y la resiliencia son inseparables. Sin uno, el otro flaquea. Juntos, definen la preparación real de una organización para la IA a gran escala, no solo para la fase piloto, sino para la realidad cotidiana de ejecutar cargas de trabajo críticas en producción.
 
El éxito de la IA depende de considerar su infraestructura como parte de la inteligencia. Los líderes deberían empezar por plantearse preguntas clave sobre visibilidad y control. ¿Pueden sus equipos rastrear los flujos de datos en cada nube? ¿Saben, en tiempo real, cómo las decisiones de infraestructura afectan el rendimiento del modelo? ¿Se prueban sus procesos de recuperación para detectar si algo falla (y no si falla)?
 
Las respuestas definen la ventaja competitiva. Las organizaciones que consideran la infraestructura como un sistema vivo, continuamente optimizado, instrumentado y sometido a pruebas de estrés, serán las que conviertan la IA en un motor fiable de productividad. Porque el futuro de la IA no se trata solo de crear modelos más inteligentes, sino de generar valor. De lo contrario, ¿qué sentido tendría? Y sin sistemas más inteligentes, no tiene sentido.


Espacios verdes: Terapia de la naturaleza
Sin infraestructura resiliente, la IA es solo una promesa
Se venció el plazo: ¿cómo comprobar si tu administrador está inscrito en el Registro Nacional?
Nutrición y prevención de cáncer, una evidencia científica real
Acerca de BNnoticias

Somos una agencia de noticias en México y creadores de contenidos.

Información
  • Inicio
  • Centro de noticias
  • Publicidad
  • Privacidad
Atención

Si desea enviar información, póngase en contacto con nosotros:

  • Lunes - Sábado, 8am to 10pm
  • 55 12 91 9069
  • administrador@boostingnews.com
Ubicación

Ciudad de México

Nuestras Redes

©Copyright - BoostingNews. All rights reserved.

Designed by boostingnews