Acabo de ver una noticia interesante sobre el desarrollo de IA en la representación de personajes, presentada por Anuttacon, una compañía de IA fundada por Tsai Haoyu, quien también es el fundador de miHoYo.



Recientemente lanzaron LPM 1.0, un modelo de representación de personajes en video que es bastante sorprendente. Este sistema permite que los personajes hablen, canten, escuchen y muestren todas sus reacciones simultáneamente en tiempo real. Además, los movimientos de la boca y las expresiones faciales, así como el ritmo del cuerpo, parecen muy realistas, no algo artificial.

Desde un punto de vista técnico, utilizan un modelo base de 17 mil millones de parámetros y lo ajustan para una versión de transmisión en vivo con baja latencia. Lo bueno es que soporta una variedad de estilos de personajes, desde estilos realistas y animaciones 2D hasta juegos en 3D e incluso criaturas no humanas, sin necesidad de ajustes adicionales.

Lo que he notado es que Anuttacon ha lanzado también un estándar de evaluación llamado LPM-Bench, que obtiene los mejores resultados en varias métricas en comparación con otros modelos en el mercado. La diferencia clave es que LPM 1.0 puede generar contenido sin límite de duración, a diferencia de otras opciones que están limitadas a solo 30 segundos.

El uso que les interesa es bastante claro: agentes conversacionales NPC en juegos y transmisiones en vivo virtuales, que tienen un potencial enorme, especialmente para miHoYo y otras compañías de juegos.

Sin embargo, cabe señalar que Anuttacon especifica claramente que esto es solo un lanzamiento para intercambio académico. No hay planes de hacer el código abierto ni ofrecer una API al público en este momento. La mayoría de la comunidad cree que el objetivo principal es atraer talento en IA.

Mirando hacia atrás, LPM 1.0 es un paso adelante en la trayectoria de IA de Anuttacon en el ámbito de motores de juego y NPC inteligentes. Además, es otro resultado del desarrollo de IA de miHoYo, desde la herramienta de chat AnuNeko hasta las capacidades del modelo base. Parece que Tsai Haoyu y su equipo están creando algo que tiene un significado importante en el campo de la IA de personajes.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado