Scroll Top
Nvidia Maxine

Una de mis conferencias de otoño favoritas, la GPU Technology Conference (GTC), se llevó a cabo hace unos meses en el líder de la industria de GPU, Nvidia. Con la inteligencia artificial (IA) como uno de los casos de uso, la firma realiza constantemente un buen trabajo de presentación de los avances en computación acelerada. Los procesadores de Nvidia están presentes en todo tipo de dispositivos, desde coches autónomos a asistentes de voz domésticos o terminales Cisco Webex, lo que los hace muy adecuados para la inteligencia artificial gracias a su capacidad de procesamiento de alta velocidad.

El hecho de que Nvidia ofrezca algo más que silicio y monte sistemas enteros diseñados que empresas, firmas tecnológicas, proveedores de servicios y otros puedan utilizar de inmediato es una de sus ventajas. Uno de estos ejemplos es Maxine de Nvidia, que aplica la inteligencia artificial a las comunicaciones. Maxine, como la mayoría de los productos de Nvidia, consiste en un conjunto completo de SDK acelerados en la GPU que utilizan la inteligencia artificial para mejorar las comunicaciones de audio y vídeo. De este modo, los micrófonos y cámaras más comunes adquieren capacidades de vanguardia.

Con Maxine, por ejemplo, las empresas pueden incluir la reducción del ruido de fondo en las conversaciones. Debido al uso generalizado de la voz y el vídeo en contextos antes inexplorados, este tipo de funciones se consideran ahora estándar en las comunicaciones. El trabajador doméstico es un caso de uso obvio, pero un perito de seguros puede utilizar una aplicación de vídeo al borde de la carretera o un ingeniero de una aerolínea necesitaría hablar con alguien en una pista de aterrizaje.

Una de las características más intrigantes y vanguardistas de Maxine es su capacidad para volver a renderizar la pantalla, dando la impresión de que las personas se miran fijamente incluso cuando sus ojos no apuntan directamente a la cámara. Al ver un vídeo, a menudo desviamos la atención de la cámara hacia la pantalla. Cuando una persona no está realmente mirando a otra parte, esto puede dar la impresión de que sí lo está. En un escenario de uso diferente, alguien puede leer notas en la pantalla mientras aparta la mirada de la cámara. Cuando las personas están físicamente separadas, puede resultar difícil mantener la cercanía digital. La función de alineación ocular de Maxine puede ayudar…

maxine-ojo-contacto

Supuse que el sector de las comunicaciones unificadas acudiría en masa a Maxine cuando Nvidia lo lanzara y lo utilizaría en lugar de emprender un desarrollo interno. Tanto RingCentral como Avaya emplean la solución de Nvidia para permitir la IA en sus respectivos productos Spaces. Las organizaciones de medios de comunicación y otras empresas que utilizan Maxine para la producción de contenidos han adoptado mayoritariamente el software.

Aumentar la penetración de los proveedores de UCaaS y CCaaS es un objetivo primordial, según lo que he aprendido de mis interacciones con Nvidia. Mantuvimos un debate sobre el futuro del sector y cómo se desarrollarían las comunicaciones en la nube, a pesar de que no ofrecieron ningún tipo de plan. Según las tendencias del mercado, preveo que Nvidia declarará que Maxine se ha transformado en una plataforma nativa de la nube en lugar de una engorrosa pila de software. Aunque no estoy seguro de si será en esta GTC o en su gran evento de primavera, este parece ser el siguiente paso evolutivo del producto.

Actualmente, los SDK de inteligencia artificial de Maxine para realidad aumentada, efectos de audio y efectos de vídeo son utilizados por empresas que buscan beneficiarse de ella. Esto no es incorrecto, aunque implica un laborioso trabajo de desarrollo. Los clientes podrían utilizar microservicios y añadir funcionalidades fácilmente si Maxine tuviera un diseño nativo en la nube.

Además, casi todas las hojas de ruta de los proveedores de UCaaS/CCaaS están en línea con el diseño nativo de la nube. Hasta hace poco, la mayoría de los sistemas de comunicación en la nube se construían utilizando pilas de software monolíticas. Desde entonces, todos y cada uno de ellos -incluidos RingCentral y Avaya- han realizado una transición activa de sus back-ends para que sean nativos de la nube. Para este grupo de empresas, sería mucho más sencillo beneficiarse si Nvidia actualizara Maxine a un diseño comparable.

Este cambio supondría un enorme beneficio para Nvidia. Salvo Cisco y Microsoft, ninguno de los proveedores de servicios de comunicación en la nube es lo bastante grande como para tener sus propios equipos de IA. Para implantar funciones con mayor rapidez que si las crearan ellos mismos, su plan es colaborar en la IA. La adopción de Maxine sería más rápida gracias a la utilización de microservicios, lo que permitiría a los proveedores probar nuevas funciones sin tener que pasar por el laborioso proceso de desarrollo del SDK.

Traducción del inglés, el artículo original puede encontrarse aquí: Nvidia Maxine: content creation applications for video conferencing and live streaming

Entradas relacionadas

Dejar un comentario