Meta ha anunciado recientemente que su avanzado modelo de segmentación visual, conocido como Segment Anything Model (SAM) 2.1, ya está disponible para el público a través de Amazon SageMaker JumpStart. Este desarrollo tecnológico representa un importante avance en la segmentación de imágenes y videos, ofreciendo capacidades ultra avanzadas que son ideales para diversas industrias, incluyendo el sector salud, la monitorización ambiental y los sistemas autónomos.
El SAM 2.1 ha sido especialmente diseñado para enfrentar con éxito el procesamiento de contextos largos, abordar escenarios de segmentación complejos y llevar a cabo análisis minuciosos. Estas características resultan particularmente valiosas en la interpretación de imágenes médicas, donde la precisión es de suma importancia. Además, el modelo permite la segmentación de objetos en tiempo real mediante instrucciones simples, como coordenadas de puntos y cuadros delimitadores.
Desarrollado principalmente en la infraestructura de Amazon Web Services (AWS), que es el único proveedor que ofrece este modelo a sus clientes, el SAM 2.1 ofrece mejoras significativas en términos de precisión, generalización y escalabilidad, adecuándose para aplicaciones de nivel de producción. Está disponible en múltiples variantes que ofrecen distintas especificaciones de tamaño y rendimiento, lo cual permite satisfacer una amplia gama de necesidades aplicativas.
Por otro lado, Amazon SageMaker JumpStart brinda acceso a una vasta colección de modelos preentrenados que los desarrolladores y científicos de datos pueden personalizar para satisfacer necesidades específicas sin la necesidad de construir soluciones desde cero. Esto simplifica el despliegue seguro de modelos optimizados en un entorno controlado, asegurando la protección de datos y el cumplimiento de regulaciones.
Para comenzar a utilizar el SAM 2.1, los usuarios deben contar con una cuenta de AWS, un rol de IAM para acceder a SageMaker AI, y un entorno adecuado, como Amazon SageMaker Studio o una instancia de notebook de SageMaker. SageMaker JumpStart proporciona la posibilidad de descubrir y desplegar modelos mediante su interfaz web, así como a través del SageMaker Python SDK, ofreciendo así flexibilidad para integrar estos avanzados modelos en flujos de trabajo ya existentes.
Una vez desplegado, el SAM 2.1 puede ser aprovechado para diversas tareas, como la generación automática de máscaras para objetos en imágenes o el seguimiento de objetos en videos. La API de SageMaker facilita la interacción con el modelo mediante secuencias de comandos, lo cual ofrece un enfoque accesible para investigadores y desarrolladores en el campo de la minería de datos y la inteligencia artificial.
Finalmente, los expertos sugieren que, para evitar incurrir en costos innecesarios, se deben eliminar los puntos finales de SageMaker AI luego de completar el trabajo con los modelos, asegurando una gestión de recursos eficiente.