Optimiza recomendaciones de inicio rápido con vLLM en AWS Trainium

Elena Digital López

Los sistemas de recomendación se enfrentan al desafío del «cold start», un fenómeno que impide la personalización inmediata para nuevos usuarios o contenido. Tradicionalmente, esta limitación afecta negativamente las tasas de clics y conversiones, ya que las recomendaciones se basan en segmentos genéricos que a menudo fallan en captar el interés del usuario desde el inicio.

Sin embargo, una reciente innovación propone una solución transformadora mediante el uso de modelos de lenguaje de gran escala. Estos modelos permiten crear perfiles de interés detallados sin necesitar un historial extenso de datos. Mediante la síntesis de representaciones avanzadas de usuarios y artículos, se transforma la experiencia inicial del usuario, proporcionando recomendaciones más precisas desde el primer día.

La implementación de esta tecnología se realiza utilizando los chips de Amazon EC2 Trainium. A través de contenedores de aprendizaje profundo y el AWS Neuron SDK, los ingenieros pueden experimentar con configuraciones de modelos y codificadores, optimizando las métricas de recomendación sin alterar el modelo base.

El desarrollo de esta solución se basó en el conjunto de datos de reseñas de libros de Amazon, lo que permitió simular escenarios de «cold start». Con un modelo de lenguaje, se enriquecen los perfiles de usuario desde datos iniciales, infiriendo subtemas relacionados y generando recomendaciones más precisas.

Para alcanzar estas recomendaciones, tanto los intereses como el catálogo de libros se convierten en vectores mediante codificadores avanzados como Google T5. Al evaluar diferentes tamaños de codificadores, se descubrió que modelos más grandes generan señales más discriminativas.

Finalmente, la implementación de estos modelos en un entorno de producción promete mejorar la conexión entre usuarios y contenido desde el primer momento. Esta iniciativa evidencia cómo el aprendizaje automático puede revolucionar los sistemas de recomendación, optimizando la experiencia del usuario de manera inmediata.