AWS lanza Amazon Athena

Dic 21, 2016 - by administrador

SEATTLE—Diciembre 2, 2016--  Amazon Web Services, Inc. (AWS), una compañía de Amazon.com (NASDAQ: AMZN), anunció hoy Amazon Athena, un servicio de consulta sin servidor que facilita el análisis de datos directamente en Amazon Simple Storage Service (Amazon S3) utilizando SQL estándar. Con unos pocos clics en AWS Management Console, los clientes pueden apuntar a Amazon Athena en sus datos almacenados en Amazon S3 y comenzar a usar SQL estándar para ejecutar consultas y obtener resultados en segundos. Con Amazon Athena no hay clústers para administrar y afinar, no hay infraestructura para configurar o administrar, y los clientes pagan solo por las consultas que ejecutan. Amazon Athena escala automáticamente - ejecuta consultas en paralelo - por lo que los resultados son rápidos, incluso con grandes conjunto de datos y consultas complejas. Para comenzar con Amazon Athena, visite https://aws.amazon.com/athena.

Los servicios de análisis de AWS, como Amazon Redshift y Amazon EMR, han hecho accesibles las analíticas a escala petabyte a empresas de todos los tamaños. Con Amazon Redshift, los clientes pueden realizar consultas complejas sobre colecciones masivas de datos estructurados y obtener un rendimiento más rápido. Para datos no estructurados, Amazon EMR hace que sea rápido y rentable procesar y analizar grandes cantidades de datos a través de clústers dinámicamente escalables utilizando marcos distribuidos populares como Apache Spark, Presto, Hive y Pig. Si bien estos servicios son escalables y lo suficientemente potentes como para manejar las aplicaciones de datos más grandes y complejos, muchos clientes también quieren ejecutar consultas rápidamente sobre datos almacenados en Amazon S3 (Por ejemplo, registros web, clickstreams y archivos de eventos sin procesar) sin tener que girar, configurar y administrar un clúster Hadoop o un almacén de datos. Ahora, con Amazon Athena, analizar los datos almacenados en Amazon S3 es tan simple como escribir consultas SQL. Amazon Athena utiliza Presto con soporte SQL estándar completo y funciona con una variedad de formatos de datos estándar, incluyendo CSV, JSON, ORC y Parquet. Y, mientras que Amazon Athena es ideal para consultas rápidas ad-hoc y se integra con Amazon QuickSight para facilitar la visualización, también puede manejar análisis complejos, incluyendo combinaciones grandes, funciones de ventanas y matrices. Debido a que Amazon Athena ejecuta consultas utilizando recursos de cómputo en múltiples Zonas de disponibilidad y utiliza Amazon S3 como almacén de datos subyacente, es altamente disponible y duradero con datos almacenados de forma redundante en múltiples instalaciones y múltiples dispositivos en cada instalación.

“En los últimos años, AWS ha construido un amplio conjunto de grandes servicios de datos que los clientes usan para hacer todo, desde análisis en tiempo real de datos en streaming hasta almacenamiento de datos a escala de petabyte o trabajos de Spark y Hadoop y todo es rápido, escalable y rentable ", dijo Raju Gulabani, Vicepresidente de Bases de Datos, Big Data, Análisis de Datos y Machine Learning de AWS. “Para cientos de miles de clientes, Amazon S3 es su almacén de datos principal - que tiene miles de millones a billones de objetos. Los clientes nos han preguntado frecuentemente si podemos facilitarle a cualquiera que ejecute consultas sobre sus datos en Amazon S3 sin tener que preocuparse por el provisionamiento o la administración de servidores y clústers. Ahora lo pueden hacer. Hay absolutamente administración cero con Amazon Athena - cualquiera que pueda escribir una consulta SQL puede analizar sus datos en Amazon S3. Amazon QuickSight y Amazon Athena están estrechamente integrados, lo que permite a los clientes visualizar sus resultados de consulta de Amazon Athena sin siquiera escribir una consulta SQL”.

“Somos clientes de AWS desde hace tiempo y utilizamos servicios como Amazon Redshift y Amazon EMR para ayudar y analizar el poder en toda la compañía", dijo Paul Cheesbrough, Director de Tecnología de News Corp. “Recibimos un acceso temprano a Amazon Athena, y ha demostrado ser rápido, fácil de usar y rentable. Hemos tenido una gran retroalimentación de nuestros equipos de ingenieros y analistas, sobre todo en la capacidad de Amazon Athena de consultar directamente desde Amazon S3, y estamos muy entusiasmados con el futuro del servicio”.

LiveIntent, una plataforma para el marketing basado en la gente y la publicidad enfocada en el canal de correo electrónico, ayuda a más de 1,100 marcas a entregar marketing y publicidad a 145 millones de personas en correos electrónicos enviados por 1,300 editores cada mes. "La plataforma LiveIntent recoge y procesa cientos de millones de eventos por día. Estamos continuamente desafiándonos a construir y ampliar la plataforma para proporcionar un acceso más rápido y barato a los datos, lo que a su vez se traduce en mejores y más rápidos conocimientos para nuestros clientes ", dijo Eric Raab, Vicepresidente Ejecutivo de Ingeniería en LiveIntent. “Encontramos que Amazon Athena es más rápido y más barato que cualquier otra solución que evaluamos y decidimos utilizar sus capacidades de inmediato.Nos gusta mucho que Amazon Athena tiene administración cero, y que podemos consultar una multitud de formatos directamente de Amazon S3 sin necesidad de carga”.

DataXu ayuda a los vendedores a entender cómo las inversiones en marketing pueden conducir a relaciones rentables con los clientes utilizando datos. “Procesamos 3 millones solicitudes de pujas por segundo, lo que resulta un total de 3PB de datos entrantes todos los días. Incluso con la compresión y la reducción, esto resulta en 180 Terabytes de registros por día”, dijo Yekesa Kosuru, Vicepresidente de Ingeniería de DataXu. Amazon Athena nos ofrece la posibilidad de consultar nuestro conjunto de datos almacenados en Amazon S3, sin necesidad de utilizar la tecnología Amazon Athena. Necesitamos administrar la infraestructura, porque no hay nada que administrar y solo pagamos por consulta, estamos implementando activamente Amazon Athena en toda la compañía”.

Gunosy es un proveedor japonés líder en aplicaciónes de recolección de noticias. “Comenzamos a usar Amazon Athena tan pronto como pudimos y nos impresionó que incluso en vista previa Amazon Athena era más rápido que el sistema que habíamos estado usando, a pesar de que está consultando datos directamente de Amazon S3", dijo Yosuke Abe, Científico de Datos de Gunosy. “Estamos migrando cargas de trabajo activamente a AWS para que podamos poner a Amazon Athena en el centro de nuestra plataforma de análisis”.

Inrix es un proveedor líder de inteligencia de tráfico en tiempo real para empresas, sector público y medios de Comunicación. “En INRIX ingerimos terabytes de datos de red y movimiento de carreteras a diario y ejecutamos cientos de data pipelines de Amazon EMR para procesarla. Utilizamos Amazon S3 como repositorio para nuestros conjuntos de datos no procesados, en proceso y procesados. Nuestros científicos de datos necesitan cortar, dar y analizar estos datos para construir modelos matemáticos de análisis predictivo en las redes de carreteras. Nuestros ingenieros de datos necesitan la habilidad de profundizar desde los datos procesados hasta los datos en proceso para monitorear y depurar los problemas de calidad de los datos”, dijo Harsh Shah, Gerente de Ingeniería de Grupo de Inrix. “Saltamos a la oportunidad de probar Amazon Athena y amamos la velocidad, facilidad de uso y flexibilidad ofrecidos por Amazon Athena. Con Amazon Athena, cualquiera de nuestros desarrolladores puede consultar todos nuestros datos almacenados en Amazon S3 usando SQL, sin preocuparse por la infraestructura o el conocimiento de los grandes sistemas de procesamiento de datos. Amazon Athena nos ha permitido convertir rápidamente Amazon S3 en nuestro lago de datos”.

Japan Taxi, una aplicación de transporte tiene dos millones de usuarios activos cada mes. “La capacidad SQL estándar con Amazon Athena es increíble”, dijo Kazuhiro Iwata, Director de Tecnología de Japan Taxi. “Con Amazon Athena, no tenemos que cargar los datos, ya que el servicio puede consultar los datos en su lugar.Ahora, cualquiera de nuestros desarrolladores puede consultar los datos en su resolución más granular, a bajo costo - que nos permite dar a todos los que necesitan Debido a que Amazon Athena utiliza formatos de código abierto, también podemos usar otras soluciones como Amazon EMR en los mismos datos, lo que facilita la interoperabilidad y, debido a que Amazon Athena no requiere administración, pudimos empezar de inmediato”.

mParticle permite a los desarrolladores de aplicaciones móviles recopilar y dar sentido a sus datos. “En mParticle recopilamos y procesamos grandes cantidades de datos, queremos que todos nuestros clientes puedan procesar datos sin procesar con lenguajes simples como SQL”, dijo Michael Katz, Director de Tecnología de mParticle. “Saltamos a Amazon Athena en cuanto nos enteramos de ello, ya que la capacidad de analizar rápidamente grandes cantidades de datos utilizando SQL estándar nos atrajo.Con Amazon Athena, nos pusimos en marcha de inmediato, pagado por la consulta, y las consultas se ejecutaron rápidamente. Nos ha gustado la compatibilidad ANSI-SQL y que puede consultar tanto el texto como los formatos columnares”.

La tecnología de Nasdaq abastece más de 70 mercados en 50 países y 1 de cada 10 transacciones de valores del mundo. “Construido sobre una visión de la innovación y una herencia de la interrupción, estamos buscando siempre nuevas maneras de mejorar eficiencias y de ganar nuevas penetraciones a través de áreas de negocio dentro de todos nuestros mercados. Teniendo en cuenta que los datos son críticos para el éxito de nuestro negocio, Siempre interesados en nuevas herramientas para analizar los datos que hemos almacenado en Amazon Redshift, Amazon S3 y otras fuentes”, dijo Nate Sammons, Arquitecto Principal de Nasdaq, Inc. “Queríamos extender nuestro almacén de datos Amazon Redshift y construir un almacén de datos a largo plazo seguro y rentable. Elegimos Amazon S3 para almacenamiento y Presto como parte del sistema de consultas y análisis debido a su compatibilidad ANSI-SQL y rendimiento rápido. Esperamos que Amazon Athena nos ayude a tomar esa idea aún más, eliminando la necesidad de clústeres y permitiendo que todos nuestros analistas consulten datos en Amazon S3 a velocidades rápidas”.

JW Player, uno de los reproductores de video más populares del mundo y líder en soluciones de video digital y móvil, está disponible en más de 2 millones de sitios en todos los dispositivos, OTT, teléfonos, tabletas y escritorios, con más de 1.300 millones de vistas mensuales únicas. “Utilizamos una combinación de plataformas para alimentar el JW Analytics Dashboard, que proporciona análisis para medir el rendimiento del contenido en grandes conjuntos de datos. Ingestamos regularmente más de 4.000 millones de eventos por día y siempre estamos buscando soluciones que simplifiquen el procesamiento de grandes conjuntos de datos, Costo y complejidad”, dijo Rick Okin, Vicepresidente de Ingeniería, JW Player. “Amazon Athena nos proporciona una solución fácil de usar, rápida y rentable con administración cero. Nos encanta el hecho de que simplemente podemos poner nuestros datos en S3, utilizar formatos abiertos como Apache Parquet para permitir la interoperabilidad con el resto de nuestra pila, y ejecutar consultas SQL, sin preocuparnos por los clusters o data warehouses”.

Tableau ayuda a las personas a ver y comprender los datos. “Nuestra misión es poner los datos en manos de tantas personas como sea posible para que puedan actuar sobre ella y tener un impacto en el mundo que los rodea”, dijo Andrew Beers, Director de Desarrollo de Tableau. “Nos hemos asociado con AWS desde hace mucho tiempo y tenemos integraciones nativas con Amazon Redshift, Amazon EMR y Amazon RDS.También estamos encantados de anunciar el soporte para Amazon Athena. Al usar Tableau y Amazon Athena juntos, los clientes pueden visualizar todos sus datos en Amazon S3 de manera interactiva, rentable y sin infraestructura para gestionar”.

Los clientes pueden comenzar a usar Amazon Athena utilizando AWS Management Console. Amazon Athena está actualmente disponible en las regiones del este de los Estados Unidos (Virginia del Norte) y del oeste de los Estados Unidos (Óregon), y se expandirá a otras regiones en los próximos meses.

 

Por: Redacción Amazon Web Services & Amazon

 

0 Comentarios

Deje su comentario