Generación de Consultas Gremlin con Modelos de Amazon Bedrock

Elena Digital López

Las bases de datos grafos han revolucionado la gestión de datos complejos e interconectados en las organizaciones actuales. Sin embargo, el uso de lenguajes de consulta especializados como Gremlin representa un desafío para muchos equipos que buscan acceder a esta información de manera eficiente. A diferencia de las bases de datos relacionales convencionales, que cuentan con esquemas bien definidos, las bases de datos grafos carecen de un esquema centralizado, lo que exige un alto nivel de experiencia técnica para formular consultas efectivas.

En respuesta a esta problemática, se ha introducido un innovador enfoque que convierte consultas en lenguaje natural en consultas Gremlin, utilizando modelos de Amazon Bedrock como Amazon Nova Pro. Esta metodología permite a analistas de negocio, científicos de datos y otros usuarios no técnicos interactuar cómodamente con bases de datos grafos.

El proceso para generar consultas a partir de lenguaje natural se divide en tres etapas esenciales. En primer lugar, se debe comprender y extraer el conocimiento del gráfico, que incluye etiquetas de vértices, propiedades y conexiones. Este paso se complementa con conocimientos del dominio que añaden contexto específico, obtenidos a través de descripciones producidas por modelos de lenguaje.

En la segunda etapa, se estructura el gráfico, creando un esquema similar al procesamiento de texto a SQL. Esto mejora la comprensión de las estructuras gráficas por parte del modelo. Las consultas en lenguaje natural se someten a un proceso de reconocimiento de entidades, enriquecimiento de contexto y planificación de consultas.

Finalmente, en la tercera etapa, se generan y ejecutan consultas Gremlin. Un modelo de lenguaje formula una consulta inicial que se ejecuta en un motor Gremlin. En caso de error, se implementan mecanismos de análisis para perfeccionar la consulta, asegurando que esta se ajuste a la estructura y restricciones de la base de datos.

Además, se ha desarrollado un sistema de evaluación basado en modelos de lenguaje para examinar la calidad de las consultas generadas y sus resultados. Tras evaluar 120 preguntas, el framework logró distinguir efectivamente las consultas correctas de las incorrectas, alcanzando una precisión general del 74.17%.

Los resultados también destacaron que Amazon Nova Pro supera a un modelo de referencia en términos de latencia y costos, generando consultas de manera más rápida y económica. En el futuro, se contemplan mejoras para optimizar la evaluación automática de resultados y optimizar el manejo de consultas anidadas. Estas innovaciones prometen aumentar la fiabilidad y consistencia de los resultados del framework, ampliando su aplicación en diferentes contextos empresariales. vía: AWS machine learning blog