Las nuevas GPUs Pascal de NVIDIA aceleran la inferencia del aprendizaje avanzado

NVIDIA develó las últimas incorporaciones a su plataforma de aprendizaje avanzado basada en la arquitectura Pascal™: los nuevos aceleradores de GPU NVIDIA® Tesla® P4 y P40, y el nuevo software que logran avances increíbles en cuanto la eficacia y la velocidad para acelerar cargas de trabajo de productos de inferencia para servicios de inteligencia artificial.

La complejidad de los servicios de inteligencia artificial modernos, como la asistencia activada por voz, los filtros antispam y los motores de recomendaciones de productos y películas, crecen rápidamente, requiriendo una potencia de computación 10 veces superior, en comparación con las redes neurales de hace un año. La tecnología actual basada en CPU no es capaz de entregar la capacidad de respuesta en tiempo real que requieren los servicios de inteligencia artificial modernos, lo que genera que la experiencia del usuario sea deficiente.

Los modelos Tesla P4 y P40 se diseñaron específicamente para la inferencia, ya que usan redes neurales profundas y capacitadas para reconocer voz, imagen o texto, en respuesta a las demandas de los usuarios y los dispositivos. Basadas en la arquitectura Pascal, estas GPUs cuentan con instrucciones especializadas de inferencia basadas en operaciones de 8 bits (INT8), entregando una respuesta hasta 45 veces más rápida en comparación con las CPU⁽¹⁾ y una mejora de 4 veces con respecto a las soluciones de GPU presentadas hace menos de un año.⁽²⁾

Tesla P4 ofrece la mejor eficiencia energética para centros de datos. Se puede instalar en cualquier servidor gracias a su factor de forma pequeño y su diseño de bajo consumo, que comienza con 50 W, únalo que le permite tener una eficiencia energética 40 veces mayor que las CPUs para producción de inferencia de cargas de trabajo.⁽³⁾ Un solo servidor con una Tesla P4 reemplaza a 13 servidores solo de CPU para cargas de trabajo de inferencia de video,⁽⁴⁾ lo que genera ahorros hasta 8 veces en el costo total de la propiedad, lo que incluyendo los costos de energía y servidores.

La Tesla P40 ofrece la máxima tasa de transferencia para las cargas de trabajo de aprendizaje avanzado. Con 47 teraoperaciones por segundo (TOPS) de rendimiento de inferencia con instrucciones INT8, un servidor con ocho aceleradores Tesla P40 pueden reemplazar el rendimiento de más de 140 servidores de CPU.⁽⁵⁾ Con un costo aproximado de $5000 por servidor de CPU, esto logra ahorros de más de $650.000 en el costo de la adquisición del servidor.

“Con los modelos Tesla P100, y ahora Tesla P4 y P40, NVIDIA ofrece la única plataforma de aprendizaje profundo integral para el centro de datos, liberando el enorme poder de la inteligencia artificial para un amplio espectro de industrias”, dijo Ian Buck, gerente general de computación acelerada de NVIDIA. “Los modelos reducen el tiempo de capacitación de días a horas. Permiten extraer la información al instante. Además, producen respuestas en tiempo real para los consumidores de servicios con la tecnología de inteligencia artificial.”

Herramientas de software para una inferencia más rápida

Para complementar la Tesla P4 y P40, se presentan dos innovadores softwares para acelerar la inferencia de inteligencia artificial: NVIDIA TensorRT y el SDK NVIDIA DeepStream.

TensorRT es la biblioteca creada para optimizar modelos de aprendizaje profundo para la implementación de producción que ofrece una capacidad de respuesta instantánea para las redes más complejas. Maximiza la tasa de transferencia y la eficacia de aplicaciones de aprendizaje profundo al aprovechar las redes neurales capacitadas, definidas con operaciones de 32 o 16 bits, y las optimiza para las operaciones INT8 con precisión reducida.

La SDK NVIDIA DeepStream aprovecha la potencia de un servidor Pascal para decodificar y analizar de forma simultánea hasta 93 transmisiones de video en alta definición, en tiempo real, en comparación con las 7 transmisiones con CPU dobles.⁽⁶⁾ Esto aborda uno de los principales desafíos de la inteligencia artificial: comprender el contenido de video, según su escalabilidad, para aplicaciones como los automóviles de conducción autónoma, los robots interactivos, la aplicación de filtros y la presentación de anuncios. La integración del aprendizaje profundo con las aplicaciones de video les permite a las empresas ofrecer servicios de video innovadores e inteligentes que, hasta entonces, eran imposibles de proporcionar.

Salto de calidad para los clientes

Los clientes de NVIDIA proporcionan servicios de inteligencia artificial cada vez más innovadores que requieren el rendimiento de computación más alto.

“Proporcionar experiencias simples y con respuestas a todos nuestros usuarios es muy importante para nosotros”, dijo Greg Diamos, investigador sénior en Baidu. “Implementamos GPU de NVIDIA en la producción para brindar servicios de inteligencia artificial, como nuestro sistema Deep Speech 2. Además, el uso de las GPU nos permite obtener un nivel de respuesta que no sería posible en un servidor no-acelerado. Pascal, con sus capacidades INT8, proporcionará un salto de calidad aún mayor; estamos ansiosos por ofrecer experiencias aún mejores a nuestros usuarios.”

Las nuevas GPUs Pascal de NVIDIA aceleran la inferencia del aprendizaje avanzado

0 Comentarios

Deje su comentario