Ciencia de datos a través de Python: Técnicas de aprendizaje no supervisado
Pérez López, César
La ciencia de datos es un campo interdisciplinar que utiliza métodos, algoritmos, procesos y sistemas para extraer conocimiento y conclusiones a partir de todo tipo de datos. A través del aprendizaje automático se combinan elementos de estadística, informática, matemáticas y técnicas de análisis para resolver problemas, hacer predicciones y generar valor a partir de los datos. Se apoya en grandes volúmenes de datos (Big Data) para descubrir patrones, tendencias y relaciones que pueden ser utilizadas para la toma de decisiones. El aprendizaje automático utiliza dos tipos de técnicas: el aprendizaje supervisado, que entrena a un modelo con datos conocidos de entrada y salida para que pueda predecir resultados futuros, y el aprendizaje no supervisado, que encuentra patrones ocultos o estructuras intrínsecas en los datos de entrada. Este libro desarrolla la mayoría de las técnicas de aprendizaje no supervisado. Comienza profundizando en las técnicas de reducción de la dimensión, como el análisis de componentes principales y el análisis factorial cuya finalidad es eliminar los efectos nocivos de la correlación en los análisis con variables cuantitativas. A continuación, se trata el análisis de correspondencias simples y múltiples para relacionar entre sí variables categóricas. Los capítulos siguientes se centran en la clasificación y segmentación mediante análisis clúster, teniendo en cuenta las técnicas jerárquicas y no jerárquicas. Se hace hincapié en la utilidad de la reducción de la dimensión previa a la segmentación. A continuación, se aborda la segmentación a través del escalamiento multidimensional, utilizando escalamiento métrico y no métrico y destacando su utilidad en el análisis de las preferencias y en el posicionamiento geográfico, muy útil en la logística. Finalmente se desarrollan temas avanzados como el análisis clúster a través de redes neuronales adecuadas para ello. En primer lugar, se tiene en cuenta las redes de mapas organizativos (SOM) como la red de Kohonen y a continuación se utilizan las redes neuronales Autoencoders o autocodificadores, que son herramientas habituales en el desarrollo del Deep Learning o aprendizaje profundo. Otro tema avanzado que también se desarrolla en este libro es el reconocimiento de patrones a través de redes neuronales como la red de Hopfield y las redes neuronales convolucionales (CNN) para el tratamiento de imágenes. También se trata la detección de anomalías. Para todos los temas se presentan los conceptos metodológicos ilustrados con ejemplos y ejercicios resueltos en Python. CONTENIDO Capítulo 1. Primeros conceptos en ciencia de datos 1.1 Ciencia de datos 1.2 El proceso de la ciencia de datos 1.3 Clasificación de las técnicas de ciencia de datos Capítulo 2. Reducción de la dimensión mediante componentes principales. 2.1 Introducción a las técnicas de reducción de la dimensión 2.2 Análisis en componentes principales 2.3 Obtención de las componentes principales 2.4 Varianzas de las componentes 2.5 Matriz factorial o matriz de cargas factoriales de las componentes 2.6 Puntuaciones o medición de componentes 2.7 Número de componentes principales a retener 2.8 La regresión sobre componentes principales y el problema de la multicolinealidad 2.9 La regresión ortogonal y las componentes principales 2.10 Interpretación geométrica del análisis en componentes principales 2.11 El hiperelipsoide de concentración 2.12 Matriz de cargas factoriales, comunalidad y círculos de correlación 2.13 Rotación de las componentes 2.14 El caso de dos variables 2.15 Propiedades muestrales de las componentes principales Capítulo 3. Componentes principales con Python 3.1 Análisis de componentes principales a través de Python 3.2 Varianza explicada y matriz de cargas factoriales 3.3 Rotación de las componentes Capítulo 4. Reducción de la dimensión mediante análisis factorial 4.1 Análisis factorial 4.2 Objetivo del análisis factorial 4.3 El modelo factorial 4.4 Método de Turstone para obtener los factores 4.5 Método del factor principal para obtener los factores 4.6 Método Alpha para obtener los factores 4.7 Método del centroide para obtener los factores 4.8 Método de las componentes principales para obtener los factores 4.9 Método de componentes principales iteradas o ejes principales para obtener los factores 4.10 Método de máxima verosimilitud para obtener los factores 4.11 Métodos Minres, ULS y GLS para obtener los factores 4.12 Contrastes en el modelo factorial 4.13 Interpretación geométrica del análisis factorial 4.14 Rotación de los factores 4.15 Rotaciones ortogonales 4.16 Rotaciones oblícuas 4.17 Puntuaciones o medición de los factores 4.18 Análisis factorial exploratorio y confirmatorio 4.19 Esquema general del análisis factorial Capítulo 5. Análisis factorial a través de Python 5.1 Análisis factorial a través de Python Capítulo 6. Reducción de la dimensión mediante análisis de correspondencias simples y múltiples 6.1 Cantidad de información y distancias 6.2 Análisis general de los métodos factoriales 6.3 Objetivo general del análisis factorial 6.4 Componentes principales como caso particular del análisis factorial general 6.5 Análisis factorial de correspondencias 6.6 Análisis de correspondencias simple 6.7 Análisis de correspondencias múltiples 6.7.1 Obtención de los factores: Tabla de Burt Capítulo 7. Análisis de correspondencias simples y múltiples con Python 7.1 Análisis de correspondencias simples en Python 7.2 Análisis de correspondencias múltiples en Python Capítulo 8. Clasificación y segmentación mediante análisis clúster 8.1 Análisis clúster 8.2 Principios del análisis clúster 8.3 El problema matemático 8.4 Procedimientos y técnicas en el análisis de conglomerados 8.5 Conglomerados jerárquicos, secuenciales, aglomerativos y exclusivos (S.A.H.N.) 8.6 Representación gráfica: dendrograma 8.7 Conglomerados no jerárquicos 8.8 Análisis clúster en dos fases 8.9 Esquema general del análisis clúster Capítulo 9. Análisis clúster a través de Python 9.1 Análisis clúster jerárquico a través de Python 9.2 Análisis clúster jerárquico con reducción de la dimensión con Python 9.3 Análisis clúster no jerárquico con Python (método k-means) 9.4 Análisis clúster no jerárquico con Python (método k-means) con reducción de la dimensión Capítulo 10. Clasificación y segmentación con escalamiento multidimensional. Tratamiento con Python 10.1 Escalamiento multidimensional 10.2 Tipos de escalamiento multidimensional 10.3 Modelo de escalamiento métrico 10.4 Modelos de escalamiento no métrico 10.5 Modelo de escalamiento de diferencias individuales (Indscal) 10.6 Modelo de escalamiento desdoblado (Unfolding) 10.7 Modelo de escalamiento con replicación 10.8 Modelos Gemscal e Idioscal 10.9 Modelos para matrices asimétricas Capítulo 11. Análisis clúster con redes neuronales a través de Python. Redes SOM de Kohonen y Autoencoders 11.1 Análisis clúster con redes neuronales: red neuronal de Kohonen 11.2 Redes neuronales Autoencoders con Python Capítulo 12. Reconocimiento de patrones, detección de anomalías y redes neuronales convolucionales a través de Python 12.1 Reconocimiento de patrones con Python 12.2 Redes neuronales de Hopfield para reconocimiento de patrones en Python 12.3 Redes neuronales de reconocimiento de patrones en Python 12.4 Detección de anomalías 12.5 Reconocimiento de patrones en imágenes
- ISBN: 9788419034748
- Editorial: GARCETA GRUPO EDITORIAL
- Encuadernacion: Rústica
- Páginas: 324
- Fecha Publicación: 01/10/2024
- Nº Volúmenes: 1
- Idioma:
- Inicio /
- INFORMÁTICA /
- DATOS