- Students: 880
- Duration: 365 days
El curso Análisis de Big Data y Ciencia de Datos Avanzada de Arcitura Education Inc. proporciona una cobertura completa de las prácticas contemporáneas de análisis y analíticas de Big Data y técnicas y procesos avanzados de ciencia de datos. Los temas incluyen minería de datos, estadística, análisis de datos exploratorio, análisis de datos confirmatorio, visualización y predicciones, así como modelado, evaluación de modelos, reducción de datos, clasificación, identificación de patrones, análisis de series temporales, analítica de textos y detección de valores atípicos.
El curso está compuesto por los siguientes módulos:
- Módulo 1: Fundamentos de Ciencia y Analíticas de Big Data
- Módulo 2: Conceptos de Análisis y Tecnología de Big Data
- Módulo 3: Fundamentos de Análisis y Ciencia de Big Data
- Módulo 4: Análisis y Ciencia de BiG Daya Avanzadas
- Módulo 5: Laboratorio de Análisis y Ciencia de Big Data
Cada módulo tiene un conjunto de lecciones que totalizan una duración estimada de diez (10) horas, y además se complementa con ejercicios para ayudar a reforzar su comprensión de los temas clave.
El módulo final del curso consiste en una serie de ejercicios de laboratorio que requieren que los participantes apliquen su conocimiento de los cursos precedentes con el fin de cumplir con requerimientos de proyectos y resolver problemas del mundo real.
Currículum
- 5 secciones
- 0 lecciones
- 365 días
- Módulo 1: Fundamentos de Ciencia y Analíticas de Big Data
Este módulo de fundamentos ofrece una vista general de alto nivel de las áreas temáticas esenciales de Big Data. Se ofrece una comprensión básica de Big Data desde la perspectiva de los negocios y la tecnología, junto con una vista general de los beneficios, retos y problemas comunes relacionados con su adopción. El contenido de este módulo está dividido en una serie de secciones modulares, cada una de las cuales se acompaña de uno o más ejercicios prácticos.
Se cubren los siguientes temas principales:
- Cómo entender Big Data
- Terminología y conceptos fundamentales de Big Data
- Factores de negocio y factores tecnológicos de Big Data
- Tecnologías empresariales tradicionales relacionadas con Big Data
- OLTP, OLAP, ETL y Bodegas de datos digitales en relación con Big Data
- Características de los datos en los ambientes de Big Data
- Tipos de conjuntos de datos en los ambientes de Big Data
- Datos estructurados, no estructurados y semiestructurados
- Veracidad de datos y metadatos
- Fundamentos de análisis y analítica
- Análisis cuantitativo y cualitativo
- Tipos de Machine Learning
- Analítica descriptiva y diagnóstica
- Analítica predictiva y prescriptiva
- Inteligencia de negocios (BI) y Big Data
- Visualización de datos y Big Data
- Consideraciones sobre la planeación y adopción de Big Data
0 - Módulo 2: Conceptos de Análisis y Tecnología de Big Data
Este módulo explora una serie de los temas más relevantes relacionados con las prácticas, tecnologías y herramientas contemporáneas de análisis para los ambientes de Big Data. El contenido del módulo intencionalmente mantiene su cobertura a nivel conceptual, enfocándose en temas que permiten a los participantes desarrollar una comprensión integral de las funciones y características de análisis comunes ofrecidas por las soluciones de Big Data, así como una comprensión de alto nivel de los componentes de back end que habilitan estas funciones.
Se cubren los siguientes temas principales:
- Ciclo de vida del análisis de Big Data (de Evaluación del caso empresarial a Análisis y visualización de datos)
- Pruebas A/B y Correlación
- Regresión y Mapas de calor
- Análisis de series temporales
- Análisis de redes y Análisis de datos espaciales
- Clasificación y Agrupamiento
- Filtrado, incluyendo Filtrado colaborativo y Filtrado basado en contenido
- Análisis de sentimientos y Analítica de texto
- Clusters y Cargas de trabajo de procesamiento por lotes y transaccionales
- Cómo se relaciona la Computación en la Nube con Big Data
- Mecanismos tecnológicos fundacionales de Big Data
- Dispositivos de almacenamiento y Motores de procesamiento de Big Data
- Gestores de recursos, Motores de transferencia de datos y Motores de consultas
- Motores analíticos, Motores de flujo de trabajo, Motores de coordinación
0 - Módulo 3: Fundamentos de Análisis y Ciencia de Big Data
Este módulo proporciona una vista general profunda de las áreas temáticas esenciales relacionadas con las técnicas de ciencia de datos y análisis relevantes y únicas de Big Data, con énfasis en cómo necesitan realizarse los análisis y las analíticas tanto individual como colectivamente, en soporte a las distintas características, requerimientos y retos asociados con los conjuntos de datos de Big Data.
Se cubren los siguientes temas principales:
- Ciencia de datos, minería de datos y modelado de datos
- Categorías de conjuntos de datos de Big Data
- Conjuntos de datos de alto volumen, alta velocidad, alta variedad, alta veracidad, alto valor
- Análisis exploratorio de datos (EDA)
- Resúmenes numéricos de EDA, reglas y reducción de datos
- Tipos de análisis de EDA, incluyendo univariante, bivariante y multivariante
- Estadísticas esenciales, incluyendo categorías variables y matemáticas relevantes
- Análisis estadísticos, incluyendo descriptivo, inferencial, covarianza, pruebas de hipótesis, etc.
- Medidas de variación o dispersión, rango intercuartil y valores atípicos, puntuación Z, etc.
- Probabilidad, frecuencia, estimadores estadísticos, intervalo de confianza, etc.
- Manipulación de datos y Machine Learning
- Variables y notaciones matemáticas básicas
- Medidas estadísticas e inferencia estadística
- Análisis confirmatorio de datos (CDA)
- Prueba de hipótesis CDA, hipótesis nula, hipótesis alternativa, significancia estadística, etc.
- Distribuciones y técnicas de procesamiento de datos
- Discretización de datos, Binning y agrupamiento
- Técnicas de visualización, incluyendo gráfica de barras, gráfica de líneas, histograma, polígonos de frecuencia, etc.
- Predicción de regresión lineal, error cuadrático medio y coeficiente de determinación R2, etc.
- Agrupamiento K-medias, distorsión del agrupamiento, valores de características faltantes, etc.
- Resúmenes numéricos
0 - Módulo 4: Análisis y Ciencia de BiG Daya Avanzadas
Este módulo profundiza en una variedad de prácticas de análisis de datos y técnicas de análisis avanzadas que se exploran en el contexto de Big Data. El contenido del módulo se enfoca en temas que permiten a los participantes desarrollar una comprensión profunda de las técnicas estadísticas, de modelado y de análisis para patrones de datos, grupos y analíticas de texto, así como la identificación de valores atípicos y errores que afectan la significación y la precisión de las predicciones hechas con los conjuntos de datos de Big Data.
Se cubren los siguientes temas principales:
- Modelado, evaluación de modelos, ajuste de modelos y sobreajuste de modelos
- Modelos estadísticos, medidas de evaluación de modelos
- Validación cruzada, sesgo-varianza, matriz de confusión y puntuación F
- Algoritmos de Machine Learning e identificación de patrones
- Reglas de asociación y algoritmo Apriori
- Reducción de datos, selección de la dimensión de las características
- Extracción de datos, discretización de los datos (Binning y agrupamiento)
- Técnicas estadísticas avanzadas
- Paramétrico vs. no paramétrico, agrupamiento vs. no agrupamiento
- Basado en distancia, supervisado vs. semisupervisado
- Regresión lineal y regresión logística para Big Data
- Reglas de clasificación para Big Data
- Regresiones logísticas, Naïve Bayes, Suavizamiento de Laplace, etc.
- Árboles de decisiones para Big Data
- Poda de árboles, división de características, algoritmo de una regla (1R)
- Identificación de patrones, reglas de asociación, algoritmo Apriori
- Análisis de series de tiempo, tendencia, estacionalidad
- K-vecinos cercanos (kNN), K-medias
- Analíticas de texto para Big Data
- Bolsa de palabras, frecuencia de términos, frecuencia de documentos inversos, distancia de coseno, etc.
- Detección de datos atípicos para Big Data
- Técnicas estadísticas, basadas en distancia, supervisadas y semisupervisadas
0 - Módulo 5: Laboratorio de Análisis y Ciencia de Big Data
Este módulo presenta a los participantes una serie de ejercicios y problemas diseñados para poner a prueba su capacidad para aplicar sus conocimientos de los temas cubiertos previamente en los Módulos 4 y 5. Completar este laboratorio ayudará a resaltar las áreas que requieren mayor atención y además ayudará a demostrar el dominio de las prácticas de análisis y ciencia de Big Data tal como se aplican y combinan para resolver problemas del mundo real.
Se proporcionan los siguientes ejercicios:
- Ejercicio de lectura 6.1: Lectura y socialización en clase: Antecedentes del caso de estudio de TMC
- Ejercicio de laboratorio 6.2: Análisis para mejorar la calidad de los productos
- Ejercicio de laboratorio 6.3: Análisis para la reducción del costo total de propiedad
- Ejercicio de lectura 6.4: Lectura y socialización en clase: Antecedentes del caso de estudio de PLGM
- Ejercicio de laboratorio 6.5: Análisis del plan de mercadeo de alto rendimiento
- Ejercicio de laboratorio 6.6: Análisis de distribución de artículos y datos de tarjetas de crédito
- Ejercicio de lectura 6.7: Lectura y socialización en clase: Antecedentes del caso de estudio de LHL
- Ejercicio de laboratorio 6.8: Mejorar la capacidad de diagnóstico de los pacientes
- Ejercicio de lectura 6.9: Lectura en clase: Antecedentes del caso de estudio de SWP
- Ejercicio de laboratorio 6.10: Mejorar la gestión de riesgos y comprender los patrones de demanda
0
El servicio de formación especializada incluye acceso por doce (12) meses al entorno virtual del curso donde encontrarás:
- Lecciones en video (para todos los temas)
- Libro de trabajo
- Guía de preparación de examen con ejemplos de preguntas
- Mapas mentales
- Afiches sobre el contenido del curso (según necesidad)
Algunos beneficios son los siguientes:
- Video lecciones desarrolladas en español por instructores internacionales acreditados por Arcitura®.
- Metodología de estudio para rendir el examen con un nivel alto de éxito.
Caracteristicas
- Este servicio de formación especializada se entrega en línea y está disponible 24 X 7.
- El curso Análisis de Big Data y Ciencia de Datos Avanzada de Arcitura Education Inc. ha sido elaborado por expertos en la materia en colaboración con un equipo especializado en el desarrollo de material didáctico, y sometido a un proceso de desarrollo probado.
Audiencia objetivo
- El curso Análisis de Big Data y Ciencia de Datos Avanzada de Arcitura Education Inc. está dirigido, pero no limitado, a personas interesadas en desarrollarse como Científico de Big Data.