Packt Publishing
Procesamiento de big data con Apache Spark: aborde de manera eficiente grandes conjuntos de datos y análisis de big data con Spark y Python
Procesamiento de big data con Apache Spark: aborde de manera eficiente grandes conjuntos de datos y análisis de big data con Spark y Python
ISBN-13: 9781789808810
Precio habitual
$39.29
Precio habitual
Precio de oferta
$39.29
Precio unitario
/
por
No es necesario pasar horas analizando datos interminables: deje que Spark, uno de los motores de procesamiento de big data más rápidos disponibles, haga el trabajo duro por usted. Características clave Póngase en funcionamiento con Apache Spark y Python Integre Spark con AWS para análisis en tiempo real Aplique flujos de datos procesados a las API de aprendizaje automático de Apache Spark Descripción del libro Procesar big data en tiempo real es un desafío debido a la escalabilidad, la coherencia de la información y los fallos -tolerancia. Este libro le enseña cómo utilizar Spark para hacer que su flujo de trabajo analítico general sea más rápido y eficiente. Explorará todos los conceptos y herramientas principales dentro del ecosistema Spark, como Spark Streaming, la API de Spark Streaming, la extensión de aprendizaje automático y la transmisión estructurada. Comenzará aprendiendo los fundamentos del procesamiento de datos utilizando conjuntos de datos distribuidos resistentes (RDD), SQL, conjuntos de datos y API de marcos de datos. Después de comprender estos conceptos básicos, pasará al uso de las API de Spark Streaming para consumir datos en tiempo real desde sockets TCP e integrará Amazon Web Services (AWS) para el consumo de transmisiones. Al final de este libro, no solo habrá comprendido cómo utilizar extensiones de aprendizaje automático y flujos estructurados, sino que también podrá aplicar Spark en sus próximos proyectos de big data. Lo que aprenderá Escriba sus propios programas Python que puedan interactuar con Spark Implemente el consumo de flujo de datos usando Apache Spark Reconozca operaciones comunes en Spark para procesar flujos de datos conocidos Integre el streaming de Spark con Amazon Web Services (AWS) Cree un modelo de filtrado colaborativo con el conjunto de datos movielens Aplique flujos de datos procesados a las API de aprendizaje automático de Spark. Para quién está dirigido este libro El procesamiento de datos con Apache Spark es para usted si es un ingeniero de software, arquitecto o profesional de TI que desea explorar sistemas distribuidos y análisis de big data. Aunque no necesita ningún conocimiento de Spark, se recomienda tener experiencia previa trabajando con Python.
- | Autor: Manuel Ignacio Franco Galeano
- | Editorial: Packt Publishing
- | Fecha de publicación: 31 de octubre de 2018
- | Número de páginas: 142 páginas
- | Idioma: inglés
- | Encuadernación: Tapa blanda
- | ISBN-10: 1789808812
- | ISBN-13: 9781789808810