La última versión de Cloudera Enterprise proporciona mejor rendimiento y eficiencia operacional entre cargas de trabajo y usuarios

— Cloudera, proveedor mundial de la plataforma de análisis y gestión de datos construida sobre ApacheTM Hadoop® más rápida, sencilla y segura y de las últimas tecnologías open source, anuncia la disponibilidad general de Cloudera Enterprise 5.7. Esta nueva actualización ofrece un rendimiento líder a través de cargas de trabajo, incluyendo un promedio de mejora 3x en el procesamiento de datos, con soporte adicional de Hive-on-Spark, y una mejora de promedio 2x del análisis de inteligencia de negocio con actualizaciones de Apache Impala. Además, esta versión añade visibilidad en el uso de múltiples usuarios a través de estas cargas de trabajo para la eficiencia de la gestión y la dotación óptima de recursos.

Cloudera Enterprise 5.7 supone un nuevo paso adelante en el desarrollo de Hadoop a medida que esta plataforma se adapta a nuevas funciones y usos nuevos y cambiantes. Además, esta nueva actualización, es una muestra más del liderazgo de Cloudera a la hora de asegurar que las organizaciones actuales pueden incorporar la plataforma Hadoop a sus nuevas necesidades y prácticas empresariales.

“Hadoop ha evolucionado significativamente en los últimos diez años y, con cada avance, hemos visto el potencial para nuevas aplicaciones y casos de uso, mientras sigue mejorando lo que ya se estaba haciendo”, afirma Charles Zedlewski, Vice President of Products en Cloudera. “El avance de la ingeniería de datos y el desarrollo de ETL con Hive-on-Spark marca un hito fundamental en esta evolución, y sirve para consolidar a Spark como el motor de procesamiento de datos estándar de Hadoop. La ingeniería de datos es solo una parte de la historia en los negocios de hoy, ya que con la versión 5.7 nuestros clientes pueden permitir una amplia variedad de clientes en nuestra plataforma, todo ello manteniendo rendimiento rápido, facilidad de gestión y cumplimiento con la seguridad”.

El desarrollo de ETL y el procesamiento por lotes de datos es uno de los usos más comunes de Hadoop. Apache Hive ha jugado un papel clave para gestionar estas cargas de trabajo, aunque tradicionalmente se ha aprovechado MapReduce como el motor de ejecución subyacente. Sin embargo, un desarrollo más sencillo y un rendimiento más rápido, si se le compara con MapReduce, permite que Apache Spark esté jugando un papel cada vez más importante y que esté preparado para remplazar a MapReduce a la hora de gestionar estas cargas de trabajo.

El año pasado Cloudera lanzó One Platform Initiative como hoja de ruta para completar la transición de MapReduce a Spark y están llevando el desarrollo para la integración de Spark con Hadoop sea mejor –garantizando que cumple los requisitos de la empresa, incluso para las grandes cargas de trabajo. Con el lanzamiento de Hive-on-Spark en Cloudera 5.7, se da un paso más para acercarse a desarrolladores que ahora pueden aprovechar las potentes capacidades de procesamiento de datos de Spark, sin dejar de utilizar Hive y con una mejora 3x en el rendimiento. Hive-on-Spark es una iniciativa puesta en marcha de forma conjunta por Cloudera, IBM, Intel, MapR, entre otros, y en la que participan los clientes de una amplia variedad de industrias, incluyendo publicidad, servicios financieros y seguros, como parte de un programado de acceso temprano para un mayor desarrollo.

Para mayor coherencia, Cloudera ha trabajado con su ecosistema de más de 2.300 socios para asegurar que sus clientes puedan seguir usando las principales herramientas de integración y preparación de datos con Hive-on-Spark, sin alterar la actividad comercial. Socios tales como: ClearStory Data, Elastic, NGDATA, Solix, Trillium Software, Zementis, y otros que están trabajando con Cloudera para certificar sus tecnologías para una transición sin problemas. (Véase más abajo sus declaraciones)

Precisamente la capacidad de soportar múltiples casos de uso a través de la misma, los datos compartidos dentro de una misma agrupación, es uno de los beneficios que aporta a Hadoop. Con Cloudera Enterprise, los administradores pueden ofrecer fácilmente esos usuarios y aplicaciones con los recursos adecuados para ejecutar y cumplir con los Service Level Agreemements (SLAs). Con esta reciente actualización, estos administradores obtienen una visibilidad completa del histórico de uso y la eficiencia en todos los usuarios, arrendatarios y aplicaciones. La nueva función Cluster Utilization Reporting, contruida en Cloudera Manager garantiza un funcionamiento eficiente y la asignación de recursos adecuada entre grupos y tipos de cargas de trabajo; ayuda a garantizar que se están cumpliendo los SLAs y proporciona la solución a los problemas simples de trabajo y a los problemas de rendimientos de las consultas.

Cloudera 5.7 incluye las siguientes características adicionales:

Mejoras 2x de rendimiento para analíticas BI: Impala continúa manteniendo su ventaja de rendimiento como el motor de análisis SQL más rápido para Hadoop a través de dynamic partition pruning, inicio de consulta más rápido, filtros en el tiempo de ejecución y más.
Ruta de producción simplificada: Cloudera Manager incluye plantillas agrupadas que proporcionan un flujo de trabajo simple para reproducir fácilmente ajustes de configuración de nuevos grupos, por lo que es fácil pasar de un entorno de prueba bien afinado a la producción, escalabilidad en todas las regiones o revierten rápidamente a una configuración válida cuando se producen problemas.
Optimización de la gobernanza de datos: Cloudera Navigator abre la gestión de datos y la gobernanza para el usuario de negocio con el linaje simplificado para establecer la confianza y la procedencia de los datos y añade metadatos administrados para mejorar la visibilidad y la coherencia entre sistemas.

Cloudera 5.7 está disponible en www.cloudera.com/downloads

Más información sobre Cloudera 5.7:

Learn more on the Cloudera Engineering Blog.
Register for the Cloudera 5.7 Webinar Series.
Download Cloudera 5.7.
Read the Release Notes.

Partner’s Support Cloudera 5.7

BMC

“La inversión de Cloudera en Hive-on-Spark es de gran valor para las tecnologías y usuarios de Hive. Estamos encantados de apoyar esta innovación con el líder de la industria Control-M para Hadoop. Junto con la planificación de tareas de Hive-on-Spark, los clientes de Control-M también tienen el apoyo de Spark SQL, Spark Streaming, Shell Scripting y mucho más. Nuestro acuerdo con Cloudera continúa aportando nuevo valor para los usuarios de Hadoop de todo el mundo”. -- Tim Eusterman, senior director of Solutions Marketing for BMC Workload Automation

ClearStory Data

"Estamos muy contentos de consolidar nuestro compromiso con Spark con el apoyo de Hive-on-Spark en nuestra nube, basado en la solución de análisis de datos. La integración de Hive con el motor de ejecución de Spark permite una ingesta sin fisuras, búsqueda y una experiencia de inferencia de datos para ciclos rápidos de análisis al mezclar y armonizar la diversidad de datos a gran escala para llegar a ideas de negocios amplificados”.

-- Tim Howes, Chief Technology Officer

Elastic

"Elastic permite una opción de búsqueda a tiempo real para la última innovación de Cloudera Enterprise, Hive-on-Spark de Cloudera, benficiando a los usuarios que pasan de MapReduce a Spark, quienes quieren usar Elasticsearch. Esta integración certificada amplía la colaboración entre Elastic y Cloudera para Elasticsearch Hadoop y la implementación de Spark.”

-- Costin Leau, Elastic Engineering Lead

NGDATA

“NGDATA proporciona una solución completa para el análisis de clientes y optimización CX para ir hacia la mejor oferta en el escenario para los bancos, compañías de medios y telcos. A medida que nuestra línea de NBO está diseñada y optimizada para la ejecución a tiempo real de datos del comportamiento del cliente, los administradores del negocio tienen expectativas de rendimiento similares hacia informes ad-hoc. Gracias a Hive-on-Spark, ahora pueden experimentar un incremento de la velocidad de estos informes sin requerir una reconfiguración virtual. Nosotros estamos contentos de trabajar con Cloudera para avanzar en la adopción de Spark en el ecosistema, ya que proporciona beneficios tangibles a nuestros clientes”.

-- Steven Noels, CTO and Co-Founder

Solix

“La certificación hacia Cloudera 5.7 significa mejorar el rendimiento y la usabilidad para los clientes de Solix Big Data Suite. Con Hive-on-Spark, la mayoría de cualquier carga de trabajo de datos estructurados debe ejecutarse ahora con Apache Hadoop.”

-- Sai Gundavelli, CEO

Trillium Software

“Dado que las empresas dependen cada vez más de Hadoop para procesar grandes volúmenes de datos, quieren también acelerar el tiempo de valor de las iniciativas basadas en datos. La actualización de Cloudera Enterprise 5.7 demuestra el compromiso de Cloudera para ofrecer soluciones innovadores que optimicen la velocidad y la eficiencia en la migración de datos, la integración de datos y el procesamiento operacional de datos con Hadoop, a la vez que se simplifica la gestión y supervisión de Hadoop. Con Hive-on-Spark impulsado con Trillium Refine™, las empresas pueden acelerar la preparación y el procesamiento de datos para permitir un mejor análisis y una toma de decisiones más rápida para impulsar el crecimiento”.

-- Keith Kohl, vice president, product management

Zementis

"Al añadir el sopote Hive-on-Spark al ecosistema Hadoop, Cloudera permite a los usuarios aplicar de forma más eficiente la ciencia de datos. A medida que la ciencia de datos se convierte en un diferenciador clave para las aplicaciones empresariales inteligentes, estamos orgullosos de compartir con Cloudera en la entrega de Zementis Universal PMML Plug-in (UPPI) como uno solo, basados en motores de ejecución estándares para poner en funcionamiento el magine learning y el análisis predictivo avanzado a través de Hive, Spark y Storm”.

--Dr. Michael Zeller, CEO

Sobre Cloudera

Cloudera suministra una moderna plataforma de analíticas y gestión de datos construida sobre Apache Hadoop, así como las últimas tecnologías open source. Las organizaciones líderes de todo el mundo confían en Cloudera para resolver sus problemas de negocio más complejos con Cloudera Enterprise, la plataforma de datos más rápida, sencilla y segura disponible para el mundo conectado. Nuestros clientes capturan, almacenan, procesan y analizan eficazmente enormes cantidades de datos, capacitándose para utilizar analíticas avanzadas con las que puedan tomar decisiones empresariales con mayor rapidez y flexibilidad y a un menor coste de lo que nunca antes había sido posible. Para garantizar el éxito de nuestros clientes, les ofrecemos un completo soporte, formación y servicios profesionales.

Conecte con Cloudera

Acerca de Cloudera: http://www.cloudera.com/content/cloudera/en/about/company-profile.html

Lea nuestros blogs:cloudera.com/blog/ yhttp://vision.cloudera.com/

Síganos en Twitter: https://twitter.com/ClouderaES

Visítenos en Facebook: facebook.com/cloudera

Mántengase al día en nuestro grupo de Linkedin: https://www.linkedin.com/groups/8457034

Únase a la Comunidad Cloudera: community.cloudera.com

Cloudera, Cloudera’s Platform for Big Data, Cloudera Enterprise Data Hub Edition, Cloudera Enterprise Flex Edition, Cloudera Enterprise Basic Edition y CDH son marcas registradas de Cloudera Inc. en Estados Unidos y otras jurisdicciones de todo el mundo. El resto de compañías y nombres de producto podrían ser marcas registradas por sus respectivos propietarios.