Con el incremento en la complejidad de los entornos de Amazon Web Services (AWS), resolver problemas relacionados con los recursos se ha convertido en un desafío significativo para muchas organizaciones. La investigación manual de errores, además de consumir valioso tiempo, está sujeta a equivocaciones, especialmente en sistemas complejos. Para abordar estas complicaciones, AWS ha presentado una innovadora herramienta: AWS Support Automation Workflows. Esta colección de runbooks de automatización permite a los usuarios identificar y solucionar problemas comunes de manera eficiente, utilizando las mejores prácticas recopiladas a través de la experiencia del equipo de soporte técnico de AWS.
En paralelo, Amazon ha lanzado Bedrock, un servicio gestionado que ofrece un compendio de modelos de inteligencia artificial avanzados desarrollados por empresas líderes como AI21 Labs, Anthropic, Cohere, Meta, Mistral AI, Stability AI y la propia Amazon. Este servicio facilita a los usuarios experimentar con estos modelos y adaptarlos a sus necesidades específicas, permitiendo ajustes personalizados con datos únicos de los usuarios mediante técnicas sofisticadas como el ajuste fino y la generación aumentada por recuperación. Gracias a su modelo sin servidor, Bedrock elimina la necesidad de mantenimiento de infraestructura, permitiendo la integración segura de capacidades de inteligencia artificial generativa en diversas aplicaciones.
Un estudio reciente sobre el uso conjunto de Amazon Bedrock y los Workflows de Automatización de Soporte de AWS ha mostrado el potencial para desarrollar un agente inteligente. Este agente se centra en resolver de manera eficiente problemas de recursos, ejemplificado en la dificultad de integración de un nodo de trabajo en el servicio Amazon Elastic Kubernetes Service (EKS) que no logra unirse a un clúster.
Este agente inteligente actúa como un avanzado interfaz entre los usuarios y los Workflows de Automatización de Soporte de AWS, utilizando un modelo de razonamiento para traducir consultas en lenguaje natural y gestionar eficientemente el flujo de la conversación. Al comenzar, el usuario describe su problema en el entorno de chat de Amazon Bedrock. Por ejemplo, podría preguntar: “¿Por qué mi nodo de trabajo de EKS no se une al clúster?”. El agente analiza la pregunta y recopila todos los datos necesarios antes de proceder con la solución automatizada. Mediante funciones Lambda, se ejecuta la automatización necesaria que realiza chequeos diagnósticos de manera automática, sin necesidad de intervención humana.
Los resultados de estas verificaciones son analizados a través de razonamiento tipo “cadena de pensamiento” (CoT), permitiendo al agente identificar las causas raíz y ofrecer guías detalladas para su solución. Este proceso ahorra tiempo valioso y aumenta la efectividad y precisión en la resolución de problemas.
Por ejemplo, para un nodo de trabajo de EKS que no se une al clúster, el agente invocará el Workflow de Automatización de Soporte relevante, ejecutando verificaciones como la validación de permisos en el rol IAM del nodo y la revisión de la conectividad de red. Una vez completadas estas verificaciones, el agente presentará de manera clara las causas del problema y brindará soluciones recomendadas.
Este nuevo enfoque promete no solo mejorar significativamente la gestión de recursos de AWS, sino que también representa un aprovechamiento estratégico de las herramientas de inteligencia artificial contemporáneas. Con Amazon Bedrock y los Workflows de Soporte de AWS, organizaciones globales pueden anticipar una simplificación sustancial en sus operaciones en la nube, logrando una administración más eficiente y efectiva de sus infraestructuras tecnológicas.