Ir directamente a la información del producto
1 de 1

Independently published

Reconocimiento de acciones mediante Python y redes neuronales recurrentes (visión por computadora y aprendizaje automático)

Reconocimiento de acciones mediante Python y redes neuronales recurrentes (visión por computadora y aprendizaje automático)

ISBN-13: 9781798429044
Precio habitual $45.65
Precio habitual $47.36 Precio de oferta $45.65
Oferta Agotado
Los gastos de envío se calculan en la pantalla de pago.
La red neuronal recurrente (RNN) es una gran herramienta para realizar reconocimiento de acciones de video. Este libro creó una RNN (red neuronal recurrente) con una capa LSTM (memoria a corto plazo) y una capa completamente conectada para realizar el reconocimiento de acciones de video; el RNN fue entrenado y evaluado con características VGG16 que se guardaron en archivos .mat; las características se extrajeron de imágenes con una red VGG16 modificada previamente entrenada; las imágenes se convirtieron a partir de vídeos del conjunto de datos UCF101, que tiene 101 acciones diferentes, incluidos 13.320 vídeos; el conjunto de datos fue desarrollado por investigadores de la Universidad de Florida Central; tenga en cuenta que solo se utilizaron las primeras 15 acciones en lugar de las 101 acciones completas de este conjunto de datos para realizar el reconocimiento; los códigos se implementaron paso a paso con Python en Jupyter Notebook y se podían ejecutar tanto en CPU como en GPU; Se utilizaron GPU gratuitas de Google Colaboratory como acelerador de hardware para realizar la mayoría de los cálculos; con el fin de obtener una mayor precisión de las pruebas, se reguló la arquitectura de la red y se ajustaron los parámetros de la red y su optimizador; Solo con fines comparativos, se entrenó y probó un clasificador SVM (Support Vector Machines). Para las primeras 15 acciones en el conjunto de datos UCF101, la precisión de prueba más alta del RNN es del 86,97%, que es un poco más alta que la del clasificador SVM (86,09%). En conclusión, el rendimiento del clasificador RNN y SVM es aproximadamente el mismo para la tarea de este libro, lo cual es un poco vergonzoso. Sin embargo, RNN tiene sus propias ventajas en muchos otros casos en los campos de la visión por computadora y el aprendizaje automático, y la implementación en este libro puede ser una introducción a este tema para lanzar un pececillo para atrapar una ballena.

  • | Autor: Mark Magic, John Magic
  • | Editorial: Publicado de forma independiente
  • | Fecha de publicación: 28 de febrero de 2019
  • | Número de páginas: 111 páginas
  • | Idioma: inglés
  • | Encuadernación: Tapa blanda
  • | ISBN-10: 1798429047
  • | ISBN-13: 9781798429044
Ver todos los detalles