Todos los usuarios de dispositivos Android pueden usar Gemini Live, una herramienta que incorpora 10 tonos de voz para personalizar cada experiencia
A mitad de 2024, Google presentó su nueva inteligencia artificial conversacional llamada Gemini Live, una herramienta lanzada para los suscriptores de Gemini Advanced y solo en inglés, pero que ahora ha comenzado a abrirse a todos los usuarios de Android, incluyendo los que acceden de forma gratuita.
La característica principal de Gemini Live es su capacidad para mantener una conversación fluida y natural con el usuario, simulando una charla informal con una persona real.
A continuación se explica todo lo que hay que saber para aprovechar al máximo Gemini Live, una IA que habla como un humano, y cuáles son sus principales características.
Gemini Live es un modo de chat de voz basado en inteligencia artificial que permite a los usuarios interactuar con sus teléfonos usando lenguaje natural. A diferencia de otros asistentes virtuales que requieren comandos específicos, esta herramienta se enfoca en ofrecer una experiencia más conversacional y dinámica.
Es decir, se puede hacer pausas o interrumpir las respuestas de la IA sin necesidad de tocar el dispositivo, lo que facilita una interacción continua y más cercana a la forma en que las personas se comunican entre sí.
Además, una de las ventajas clave de este sistema es que puede funcionar en segundo plano. Esto significa que se pueden seguir usando otras aplicaciones o incluso bloquear el teléfono mientras la conversación con la IA continúa.
También, el sistema guarda una transcripción de la conversación para que se pueda revisar o retomar el diálogo en cualquier momento desde la sección de historial.
Acceder a Gemini Live en dispositivos Android es sencillo. Para activar el modo conversacional, solo hay que buscar la forma de onda circular en la parte inferior derecha de la pantalla de la aplicación de Google.
Una vez que se haya ingresado al modo de conversación, se podrá visualizar dos botones principales: “Mantener” y “Finalizar”. Estos permitirán gestionar la conversación fácilmente.
Asimismo, una característica única de Gemini Live es que, aunque se cierre la pantalla principal, el chat de voz seguirá activo en segundo plano. Esto ofrece la flexibilidad de continuar la conversación mientras se realizan otras tareas.
Gemini Live no solo está diseñado para comprender y responder a comandos de voz o texto. También, tiene capacidades multimodales, lo que significa que puede procesar imágenes y, en el futuro, se espera que incluya soporte para video.
Esta característica lo convierte en una herramienta versátil para una amplia variedad de situaciones, desde hacer preguntas simples hasta llevar a cabo tareas más complejas y de mucho análisis.
Se puede mostrar una imagen a la IA y pedirle ayuda para identificar un objeto o proporcionar información relacionada con la foto. Este tipo de interacción hace que la experiencia sea mucho más completa y atractiva.
Una de las innovaciones más interesantes de Gemini Live es la variedad de voces que ofrece. Google ha incorporado 10 opciones de voces, cada una con diferentes rangos y tonos, para que puedas personalizar tu experiencia según las preferencias. Estas son algunas de las voces disponibles:
Ursa: Rango medio y entonación comprometida.
Vega: Tono brillante y alto.
Pegasus: Voz grave y comprometida.
Órbita: Profunda y energética.
Lyra: Tono brillante y alto.
Orión: Profunda y brillante
Nova: Rango medio con tono tranquilo.
Dipper: Voz grave y comprometida.
Eclipse: Energética con rango medio.
Capella: Voz alta con acento británico.
Esta diversidad permite que los usuarios elijan la voz que mejor se adapte a sus necesidades o simplemente cambien de voz según su estado de ánimo o el tipo de interacción que desean tener.
Por Dylan Escobar Ruiz para Infobae
Comments