IA Generativa con Amazon Bedrock

Introducción

De acuerdo con nuestro anterior artículo donde se brindó una introducción de la Inteligencia Artificial Generativa (GenAI) en AWS, comentábamos sobre una serie de servicios disponibles por parte de AWS para hacer uso de esta tecnología de GenAI, entre los que se encontraba Amazon Bedrock. En este artículo haremos foco sobre este servicio en particular.

En abril de 2023, AWS anuncio la incorporación del servicio de Amazon Bedrock, habilitando su uso de forma privada para startups como Coda, Hurone AI y Nexxiot, y para grandes empresas como Adidas, GoDaddy, Clariant y Broadridge, permitiéndoles crear y escalar de forma segura aplicaciones de GenAI haciendo uso de Amazon Bedrock. Sin embargo el pasado 28 de septiembre de 2023 AWS anunció su disponibilidad general (GA) siendo más accesible para más usuarios y clientes, ofreciendo un conjunto de modelos de GenAI de Amazon y proveedores externos a través de una interfaz de programación de aplicaciones (API).

“La IA generativa se encuentra en un punto de inflexión, generando nuevas ideas que podrían transformar industrias enteras y re imaginar cómo se realiza el trabajo.” (Swami Sivasubramanian, VP de Data & ML en AWS).

Amazon Bedrock

Habíamos mencionado que Amazon Bedrock es un servicio totalmente administrado que hace que los modelos fundacionales (Foundation ModelsFM) de las principales startups de IA y Amazon estén disponibles a través de una interfaz de programación de aplicaciones (API), brindando a los usuarios la flexibilidad de seleccionar entre una diversidad de FM, permitiéndoles encontrar la opción que mejor se ajuste a su caso de uso específico.

A la fecha el servicio de Amazon Bedrock está disponible en las siguientes regiones de AWS con todas las funciones habilitadas:

  • Este de EE. UU. (Norte de Virginia)
  • Oeste de EE. UU. (Oregón)
  • Asia-Pacífico (Singapur)
  • Asia-Pacífico (Tokio)
  • Europa (Fráncfort)

La siguiente tabla muestra funciones limitadas en cada una de las regiones disponibles:

Región Evaluación del Modelo Base de Conocimientos Agentes Ajuste Fino Entrenamiento Previo continuo Rendimiento aprovisionado
Este de EE. UU. (Norte de Virginia)
Oeste de EE. UU. (Oregón)
Asia Pacífico (Singapur) No No No No No No
Asia Pacífico (Tokio) No No No No No No
Europa (Fráncfort) No No No No No No
AWS GovCloud (EE.UU.-Oeste) No No No No No Sí (sólo para modelos afinados, sin plazo de compromiso)

En el siguiente enlace se encuentra la descripción de endpoints y cuotas en las regiones donde están disponibles.

Beneficios

  • Acelera el desarrollo de aplicaciones de GenAI utilizando FM a través de una API.
  • Es un servicio sin servidor, lo que significa que los usuarios y/o clientes no tienen que administrar ninguna infraestructura.
  • Permite elegir FM de las principales startups de IA como AI21 Labs, Anthropic, Cohere, Stability AI, Amazon y Meta.
  • Permite personalizar los FM de manera privada utilizando los datos corporativos o de la organización.
  • Amazon Bedrock está diseñado para escalar y satisfacer las necesidades de las organizaciones de todos los tamaños.
  • Ofrece características de seguridad como el cifrado de datos en tránsito y en reposo.
  • AWS ofrece conectividad privada entre Amazon Bedrock y la Virtual Private Cloud (VPC).

Modelos Fundacionales disponibles

Recordemos que los FM son modelos muy grandes que están previamente entrenados en grandes colecciones de datos y que existen tres tipos de FM disponibles en el mercado que son: Texto a Texto, Texto a incrustaciones y multimodal.

Con estos FM y otros servicios, las empresas pueden crear aplicaciones de GenAI para tareas como la creación de contenido, el análisis de datos, generación de imágenes, traducción de texto y mucho más.

A continuación se describen los FM disponibles en Amazon Bedrock:

Amazon Titan

Los FM de Amazon Titan son una familia de FM previamente entrenados por AWS en grandes conjuntos de datos, lo que los convierte en modelos potentes y de uso general creados para admitir una variedad de casos de uso como generación de texto, resumen, búsqueda semántica, y generación aumentada de recuperación.

Las versiones disponibles actuales del modelo que son compatibles con Amazon Bedrock son:

  • Titan Text – Lite (Preview)
  • Titan Text – Express (Preview)
  • Titan Embeddings G1 – Text (GA)

Jurassic-2

La startup AI21 Labs presenta la serie de Modelos de lenguaje de gran tamaño (Large Language Models – LLM) Jurassic que están diseñados para seguir instrucciones en lenguaje natural que incluyen resumen, redacción de artículos y correos electrónicos, responder preguntas de una base de conocimientos proporcionada y más. Estos modelos son compatibles con el inglés, así como con otros idiomas, incluidos español, francés, alemán, portugués, italiano y holandés.

Los clientes pueden elegir entre los modelos de diferentes tamaños en función de la complejidad de la tarea en cuestión, lo que les permite optimizar los costos y el rendimiento en consecuencia.

AI21 Labs ofrece los siguientes modelos que son compatibles en Amazon Bedrock:

  • Jurassic-2 Ultra
  • Jurassic-2 Mid

Claude 2

Anthropic es un laboratorio de investigación y seguridad de la IA que crea sistemas de IA confiables, interpretables y orientables, es el creador del LLM de última generación Claude. La nueva versión del LLM, Claude 2, puede procesar grandes cantidades de texto y puede realizar diálogo reflexivo, creación de contenido, razonamiento complejo y codificación, donde sus principales casos de uso son:

Servicio al cliente: Claude puede actuar como representante de ventas virtual.

  • Operaciones: Claude puede extraer información relevante de correos electrónicos y documentos comerciales.
  • Legal: Claude puede analizar documentos legales y responder preguntas sobre ellos.
  • Codificación: Los modelos de Claude mejoran constantemente en codificación, matemáticas y razonamiento.

Anthropic ofrece los siguientes modelos que son compatibles en Amazon Bedrock:

  • Claude v1.x
  • Claude v2.x
  • Claude Instant v1.x

Cohere Command

Cohere es una startup y desarrollador líder de plataformas empresariales de IA y FM de última generación, y sus FM ayudan a desbloquear formas más intuitivas de generar, buscar y resumir información.

Command, el modelo insignia de generación de texto de Cohere, está entrenado para seguir los comandos del usuario y ser útil instantáneamente en aplicaciones empresariales prácticas como resumen, redacción publicitaria, diálogo, extracción y respuesta a preguntas.

Cohere ofrece los siguientes modelos que son compatibles en Amazon Bedrock:

  • Command v14.7
  • Command Light v14.7
  • Embed English v3.0
  • Embed Multilingual v3.0

Stable Diffusion XL (SDXL)

Stability AI es una compañía de IA abierta impulsada por la comunidad, que ofrece FM que crean texto, imágenes, audio, video, código y más a partir de instrucciones de texto simples.

Con Stable Diffusion XL, puede crear imágenes descriptivas con indicaciones más cortas y generar palabras dentro de las imágenes. El modelo es un avance significativo en las capacidades de generación de imágenes, ya que ofrece composición de imágenes y generación de rostros mejoradas que dan como resultado imágenes impresionantes y una estética realista.

Sus principales casos de uso son:

  • Publicidad y Marketing: Permite crear campañas publicitarias personalizadas y activos de marketing ilimitados.
  • Medios y entretenimiento: Permite desarrolla activos creativos ilimitados e ideas con imágenes.
  • Juegos y Metaverso: Permite crear nuevos personajes, escenas y mundos.

Stability AI ofrece los siguientes modelos que son compatibles en Amazon Bedrock:

  • Stable Diffusion XL 0.x
  • Stable Diffusion XL 1.x (Únicamente está disponible con el rendimiento aprovisionado)

Llama 2

Meta es un conglomerado estadounidense de tecnología y redes sociales. Es la empresa matriz de Facebook, Instagram, WhatsApp y otras subsidiarias. Meta ha desarrollado Llama 2 que es una colección de modelos de lenguaje de gran tamaño (LLM) pre-entrenados y ajustados y están optimizados para casos de uso de diálogo.

Meta ofrece el siguiente modelo que es compatible en Amazon Bedrock:

  • Llama 2 Chat 13B

Agentes de Amazon Bedrock

Dentro de las últimas novedades, AWS lanzó los agentes para Amazon Bedrock que permite a los desarrolladores configurar un agente para completar acciones en función de los datos de la organización y las entradas de usuario. Los agentes organizan las interacciones entre los modelos fundacionales, los orígenes de datos, las aplicaciones de software y las conversaciones de los usuarios, y llaman automáticamente a las API para que tomen medidas. Los desarrolladores pueden integrar fácilmente los agentes y acelerar la entrega de aplicaciones de IA generativa, ahorrando semanas de esfuerzo de desarrollo produciendo respuestas actualizadas basadas en sus propios datos

Adicionalmente permiten automatizar tareas complejas para un modelo sin necesidad de que un desarrollador escriba manualmente el código necesario para hacerlo. Específicamente, los desarrolladores pueden usar agentes para conectar modelos básicos a sus fuentes de datos propietarias para que las aplicaciones que creen produzcan respuestas actualizadas basadas en sus propios datos. Cuando un usuario emplea una aplicación de IA generativa creada con Bedrock, un agente realiza llamadas a la API que recuperan los datos necesarios de fuentes propietarias para responder a las solicitudes o consultas del usuario.

Modelo de Precios

Amazon Bedrock presenta los siguientes modelos de precios:

  • Bajo demanda: Pago por uso, sin compromisos de plazos en el tiempo. Para el modelo de generación de texto, se cobrará por cada token de entrada procesado y cada token de salida generado. Para el modelo de incrustaciones, se le cobrará por cada token de entrada procesado. Para los modelos de generación de imágenes, se le cobrará por cada imagen generada. 
  • Rendimiento aprovisionado: Con este modelo de precios, es posible comprar unidades de modelo para un modelo base específico o personalizado. El modelo de rendimiento aprovisionado está diseñado principalmente para grandes cargas de trabajo de inferencia coherentes que necesitan un rendimiento garantizado.
  • Personalización del modelo (ajuste fino): Amazon Bedrock permite personalizar el FM seleccionado con los datos corporativos para mejorar la precisión, permitir la personalización y optimizar las soluciones adaptadas a las necesidades de la empresa. Para la personalización de un modelo de generación de texto, se le cobrará por el entrenamiento del modelo en función del número de tokens procesados por el modelo (número de tokens en el corpus de datos de entrenamiento x número de épocas) y el almacenamiento del modelo cobrado por mes por modelo.

Nota: Un token se compone de unos pocos caracteres y se refiere a la unidad básica que un modelo aprende para comprender la entrada del usuario y solicitar que genere resultados. Una época se refiere a un escaneo completo a través del conjunto de datos de entrenamiento durante el proceso de ajuste.

Conclusiones

Amazon Bedrock es un innovador servicio de GenAI que se incorpora a la plataforma de AWS y promete revolucionar la manera en las organizaciones aprovechan la GenAI proporcionando numerosas ventajas, como el acceso a una variedad de FM que seguirá creciendo con el tiempo, la escalabilidad y la seguridad. Algo bastante interesante es que el servicio se puede utilizar en una amplia gama de casos de uso, lo que convierte a Amazon Bedrock en un servicio valioso para las organizaciones de cualquier tamaño y de cualquier industria.

Recursos

Consulte los siguientes recursos para obtener más información sobre Amazon Bedrock:

Espero sea de utilidad !!!

Saludos,

Síguenos: