Ir directamente a la información del producto
1 de 1

Packt Publishing

Gestión de datos con Python: creación de datos procesables a partir de fuentes sin procesar

Gestión de datos con Python: creación de datos procesables a partir de fuentes sin procesar

ISBN-13: 9781789800111
Precio habitual $53.09
Precio habitual Precio de oferta $53.09
Oferta Agotado
Los gastos de envío se calculan en la pantalla de pago.
Simplifique sus procesos ETL con estos consejos, trucos y mejores prácticas prácticos sobre higiene de datos. Características clave Concéntrese en los conceptos básicos de la manipulación de datos Estudie varias formas de extraer el máximo provecho de sus datos en menos tiempo Aumente su curva de aprendizaje con temas adicionales como generación aleatoria de datos y comprobaciones de integridad de los datos Descripción del libro Para que los datos sean útiles y significativos, deben ser curado y refinado. Data Wrangling with Python le enseña las ideas centrales detrás de estos procesos y le proporciona conocimiento de las herramientas y técnicas más populares en el dominio. El libro comienza con los conceptos básicos absolutos de Python, centrándose principalmente en las estructuras de datos. Luego profundiza en las herramientas fundamentales de manipulación de datos, como las bibliotecas NumPy y Pandas. Explorará información útil sobre por qué debería mantenerse alejado de las formas tradicionales de limpieza de datos, como se hace en otros lenguajes, y aprovechar las rutinas especializadas prediseñadas en Python. Esta combinación de consejos y trucos de Python también demostrará cómo utilizar el mismo backend de Python y extraer/transformar datos de una variedad de fuentes que incluyen Internet, grandes bóvedas de bases de datos y tablas financieras de Excel. Para ayudarlo a prepararse para escenarios más desafiantes, cubrirá cómo manejar datos faltantes o incorrectos y cómo reformatearlos según los requisitos de la herramienta de análisis posterior. El libro lo ayudará aún más a comprender conceptos a través de ejemplos y conjuntos de datos del mundo real. Al final de este libro, podrá utilizar una amplia gama de fuentes para extraer, limpiar, transformar y formatear sus datos de manera eficiente. Lo que aprenderá Usar y manipular estructuras de datos simples y complejas Aprovechar todo el potencial de DataFrames y numpy.array en tiempo de ejecución Realizar web scraping con BeautifulSoup4 y html5lib Ejecutar búsqueda y manipulación avanzada de cadenas con RegEX Manejar valores atípicos y realizar imputación de datos con Pandas Usar descriptivo estadísticas y técnicas de trazado Practique la manipulación y el modelado de datos utilizando técnicas de generación de datos. Para quién es este libro La manipulación de datos con Python está diseñado para desarrolladores, analistas de datos y analistas de negocios que estén interesados ​​en seguir una carrera como científico de datos o experto en análisis de pleno derecho. . Aunque este libro es para principiantes, es necesario tener conocimientos prácticos previos de Python para comprender fácilmente los conceptos que se tratan aquí. También ayudará tener conocimientos rudimentarios de bases de datos relacionales y SQL.

  • | Autor: Tirthajyoti Sarkar, Shubhadeep Roychowdhury
  • | Editorial: Packt Publishing
  • | Fecha de publicación: 28 de febrero de 2019
  • | Número de páginas: 452 páginas
  • | Idioma: inglés
  • | Encuadernación: Tapa blanda
  • | ISBN-10: 1789800110
  • | ISBN-13: 9781789800111
Ver todos los detalles