Microsoft le da voz, ojos e inteligencia emocional a la IA para ser un buen “compañero”

«Estas máquinas ahora entienden nuestra voz. Pueden transcribir perfectamente lo que hemos dicho. Pueden reaccionar a nuestra entonación…»

Foto: EFE

EFE / La Voz de Michoacán

Nueva York. El gigante tecnológico Microsoft anunció este martes que su inteligencia artificial (IA) generativa, Copilot, ahora cuenta con voz, ojos e inteligencia emocional para ser un "compañero" al que los usuarios puedan acudir no solo para pedir ayuda, sino también para conversar.

PUBLICIDAD

Mustafa Suleyman, el director ejecutivo de Microsoft AI, dijo este martes en la presentación de estas nuevas funciones en un evento en Nueva York que ahora las computadoras han aprendido el lenguaje de las personas y que eso "cambia por completo el paradigma interactivo entre los humanos y las máquinas".

"Estas máquinas ahora entienden nuestra voz. Pueden transcribir perfectamente lo que hemos dicho. Pueden reaccionar a nuestra entonación. Está en un nivel tan bueno que puedes tener una conversación fluida, relajada e informal, donde capta la inteligencia emocional de tu discurso y se siente como si estuvieras teniendo una conversación normal", destacó el cofundador de Google DeepMind.

La nueva voz de Copilot

Según Suleyman, por el momento Copilot Voice, el chatbot en el que el usuario puede conversar con Copilot, no guarda las conversaciones ni la empresa guarda la información para entrenar la IA.

PUBLICIDAD

Esta IA tiene cuatro voces y sale hoy en Australia, Canadá, Nueva Zelanda, el Reino Unido y EE.UU. en las aplicaciones móviles iOS y Android, en la web en copilot.microsoft.com y a través de la aplicación Copilot para Windows.

De acuerdo con Microsoft Copilot Voice estará disponible inicialmente en inglés, pero en una demostración una periodista de EFE consiguió tener conversaciones fluidas con la máquina en francés y español.

Al igual que otras IA, sus respuestas pueden estar bien formadas, pero con información falsa. Algo que se conoce como alucinaciones, razón por la que el usuario no puede "conversar", con la IA de algunos temas como las elecciones, consultas médicas o advertencias legales.

"Hasta que no tengamos índices de precisión muy altos y tasas de falsos positivos muy bajas, no nos extenderemos a estas otras áreas, pero llegará ese momento. Es cuestión de unos pocos años", adelantó Suleyman.

Los nuevos ojos y capacidad de razonar de Copilot

Los ojos de la IA serán Copilot Vision, chatbot que es capaz de ver el navegador del usuario, entender tanto el texto como las imágenes, y dar consejos o hacer resúmenes sobre lo que ve.

Según Microsoft, esta aplicación puede ser útil para organizar el alojamiento de un viaje en Airbnb -ya que puede escuchar cuáles son las preferencias del usuario y basándose en eso recomendar una opción específica- o elegir una película según las opiniones que los críticos dejan en Rotten Tomatoes -pues puede hacer un resumen de todos los comentarios que hay en la web-.

Esta función no estará disponible en todas las webs de internet y aún está en desarrollo. Por ello, solo se puede acceder a la versión beta por Copilot Labs en EE.UU.

La empresa también presentó Think Deeper -que también solo está disponible en Copilot Labs- en la que la IA se toma más tiempo para razonar su respuesta, lo que, según la empresa, permite responder a una respuesta compleja en la que por ejemplo se cita una lista de pros y contras.

"Lo hemos diseñado para que sea útil para todo tipo de desafíos prácticos y cotidianos, como comparar dos opciones complejas una al lado de la otra. ¿Debería mudarme a esta ciudad o a aquella? ¿Qué tipo de automóvil se adapta mejor a mis necesidades? Y así sucesivamente", explica Microsoft en un comunicado.

Un pódcast personalizado cada mañana

El titán tecnológico también anunció este lunes Copilot Daily, un resumen en audio de noticias e información meteorológica que Copilot lee como si fuera un pódcast.

"Trabajamos directamente con Reuters, Financial Times, USA Today y pagamos por este contenido. Pero con el tiempo, también incluirá correos electrónicos, eventos del calendario y tareas del día. La idea es realmente resumir solo las cosas que necesita saber (el usuario) al amanecer", detalló Suleyman.