El nuevo proyecto de Google, VLOGGER, lleva la comunicación digital al siguiente nivel al generar videos realistas de personajes a partir de imágenes y audio. Aunque aún está en camino de lograr la naturalidad realista de algunos competidores, VLOGGER se destaca por su enfoque innovador.

¿Qué es VLOGGER? VLOGGER transforma textos y audios en videos dinámicos de hablantes utilizando una instantánea de una persona. Aprovechando el poder de modelos generativos de difusión de vanguardia, introduce una combinación novedosa de tecnología para dar vida a imágenes estáticas.

Características principales de VLOGGER:

  • Creación de movimiento dinámico: A través de un sofisticado modelo de difusión estocástico de cuerpo humano a movimiento 3D, VLOGGER captura y anima los matices humanos.
  • Evolución de texto a imagen: Amplía el ámbito de los modelos de texto a imagen con una arquitectura única basada en difusión, que permite una manipulación detallada temporal y espacial.

La tecnología detrás de VLOGGER permite la creación de videos de alta calidad de diferentes duraciones. Estos videos mantienen un alto grado de control sobre representaciones faciales y corporales, ofreciendo a los usuarios una herramienta avanzada y flexible.

Por qué se destaca VLOGGER:

  • Aplicación universal: A diferencia de modelos anteriores que requieren entrenamiento específico de una persona, VLOGGER es universalmente adaptable.
  • Generación de imágenes holísticas: Va más allá de la simple detección facial, generando videos de personajes de cuerpo completo sin necesidad de recortar.
  • Versatilidad: VLOGGER se adapta a una amplia gama de escenarios, incluyendo la visibilidad del torso completo y diversas identidades, asegurando una síntesis de humano virtual integral.

Con estos avances, VLOGGER está abriendo el camino para interacciones virtuales humanas más auténticas y accesibles en diversas plataformas digitales.
Official Website

demonstration

Official Website