- Students: 883
- Duration: 365 days
Un Científico de Big Data de Arcitura Education Inc. tiene conocimientos de los conceptos y modelos fundamentales de la ciencia de datos y Big Data, así como una comprensión del análisis, la analítica y los mecanismos de Big Data.
El curso Análisis de Big Data y Ciencia de Datos de Arcitura Education Inc. lo prepara para el examen oficial de Certificación como Científico de Big Data.
El examen de certificación Científico de Big Data de Arcitura Education Inc. comprende los siguientes módulos del curso Análisis de Big Data y Ciencia de Datos:
- Módulo 1: Fundamentos de Ciencia y Analíticas de Big Data
- Módulo 2: Conceptos de Análisis y Tecnología de Big Data
- Módulo 3: Fundamentos de Análisis y Ciencia de Big Data
- Módulo 4: Análisis y Ciencia de BiG Daya Avanzadas
- Módulo 5: Laboratorio de Análisis y Ciencia de Big Data
Currículum
- 5 secciones
- 0 lecciones
- 365 días
- Módulo 1: Fundamentos de Ciencia y Analíticas de Big Data
Este módulo de fundamentos ofrece una vista general de alto nivel de las áreas temáticas esenciales de Big Data. Se ofrece una comprensión básica de Big Data desde la perspectiva de los negocios y la tecnología, junto con una vista general de los beneficios, retos y problemas comunes relacionados con su adopción. El contenido de este módulo está dividido en una serie de secciones modulares, cada una de las cuales se acompaña de uno o más ejercicios prácticos.
Se cubren los siguientes temas principales:
- Cómo entender Big Data
- Terminología y conceptos fundamentales de Big Data
- Factores de negocio y factores tecnológicos de Big Data
- Tecnologías empresariales tradicionales relacionadas con Big Data
- OLTP, OLAP, ETL y Bodegas de datos digitales en relación con Big Data
- Características de los datos en los ambientes de Big Data
- Tipos de conjuntos de datos en los ambientes de Big Data
- Datos estructurados, no estructurados y semiestructurados
- Veracidad de datos y metadatos
- Fundamentos de análisis y analítica
- Análisis cuantitativo y cualitativo
- Tipos de Machine Learning
- Analítica descriptiva y diagnóstica
- Analítica predictiva y prescriptiva
- Inteligencia de negocios (BI) y Big Data
- Visualización de datos y Big Data
- Consideraciones sobre la planeación y adopción de Big Data
0 - Módulo 2: Conceptos de Análisis y Tecnología de Big Data
Este módulo explora una serie de los temas más relevantes relacionados con las prácticas, tecnologías y herramientas contemporáneas de análisis para los ambientes de Big Data. El contenido del módulo intencionalmente mantiene su cobertura a nivel conceptual, enfocándose en temas que permiten a los participantes desarrollar una comprensión integral de las funciones y características de análisis comunes ofrecidas por las soluciones de Big Data, así como una comprensión de alto nivel de los componentes de back end que habilitan estas funciones.
Se cubren los siguientes temas principales:
- Ciclo de vida del análisis de Big Data (de Evaluación del caso empresarial a Análisis y visualización de datos)
- Pruebas A/B y Correlación
- Regresión y Mapas de calor
- Análisis de series temporales
- Análisis de redes y Análisis de datos espaciales
- Clasificación y Agrupamiento
- Filtrado, incluyendo Filtrado colaborativo y Filtrado basado en contenido
- Análisis de sentimientos y Analítica de texto
- Clusters y Cargas de trabajo de procesamiento por lotes y transaccionales
- Cómo se relaciona la Computación en la Nube con Big Data
- Mecanismos tecnológicos fundacionales de Big Data
- Dispositivos de almacenamiento y Motores de procesamiento de Big Data
- Gestores de recursos, Motores de transferencia de datos y Motores de consultas
- Motores analíticos, Motores de flujo de trabajo, Motores de coordinación
0 - Módulo 3: Fundamentos de Análisis y Ciencia de Big Data
Este módulo proporciona una vista general profunda de las áreas temáticas esenciales relacionadas con las técnicas de ciencia de datos y análisis relevantes y únicas de Big Data, con énfasis en cómo necesitan realizarse los análisis y las analíticas tanto individual como colectivamente, en soporte a las distintas características, requerimientos y retos asociados con los conjuntos de datos de Big Data.
Se cubren los siguientes temas principales:
- Ciencia de datos, minería de datos y modelado de datos
- Categorías de conjuntos de datos de Big Data
- Conjuntos de datos de alto volumen, alta velocidad, alta variedad, alta veracidad, alto valor
- Análisis exploratorio de datos (EDA)
- Resúmenes numéricos de EDA, reglas y reducción de datos
- Tipos de análisis de EDA, incluyendo univariante, bivariante y multivariante
- Estadísticas esenciales, incluyendo categorías variables y matemáticas relevantes
- Análisis estadísticos, incluyendo descriptivo, inferencial, covarianza, pruebas de hipótesis, etc.
- Medidas de variación o dispersión, rango intercuartil y valores atípicos, puntuación Z, etc.
- Probabilidad, frecuencia, estimadores estadísticos, intervalo de confianza, etc.
- Manipulación de datos y Machine Learning
- Variables y notaciones matemáticas básicas
- Medidas estadísticas e inferencia estadística
- Análisis confirmatorio de datos (CDA)
- Prueba de hipótesis CDA, hipótesis nula, hipótesis alternativa, significancia estadística, etc.
- Distribuciones y técnicas de procesamiento de datos
- Discretización de datos, Binning y agrupamiento
- Técnicas de visualización, incluyendo gráfica de barras, gráfica de líneas, histograma, polígonos de frecuencia, etc.
- Predicción de regresión lineal, error cuadrático medio y coeficiente de determinación R2, etc.
- Agrupamiento K-medias, distorsión del agrupamiento, valores de características faltantes, etc.
- Resúmenes numéricos
0 - Módulo 4: Análisis y Ciencia de BiG Daya Avanzadas
Este módulo profundiza en una variedad de prácticas de análisis de datos y técnicas de análisis avanzadas que se exploran en el contexto de Big Data. El contenido del módulo se enfoca en temas que permiten a los participantes desarrollar una comprensión profunda de las técnicas estadísticas, de modelado y de análisis para patrones de datos, grupos y analíticas de texto, así como la identificación de valores atípicos y errores que afectan la significación y la precisión de las predicciones hechas con los conjuntos de datos de Big Data.
Se cubren los siguientes temas principales:
- Modelado, evaluación de modelos, ajuste de modelos y sobreajuste de modelos
- Modelos estadísticos, medidas de evaluación de modelos
- Validación cruzada, sesgo-varianza, matriz de confusión y puntuación F
- Algoritmos de Machine Learning e identificación de patrones
- Reglas de asociación y algoritmo Apriori
- Reducción de datos, selección de la dimensión de las características
- Extracción de datos, discretización de los datos (Binning y agrupamiento)
- Técnicas estadísticas avanzadas
- Paramétrico vs. no paramétrico, agrupamiento vs. no agrupamiento
- Basado en distancia, supervisado vs. semisupervisado
- Regresión lineal y regresión logística para Big Data
- Reglas de clasificación para Big Data
- Regresiones logísticas, Naïve Bayes, Suavizamiento de Laplace, etc.
- Árboles de decisiones para Big Data
- Poda de árboles, división de características, algoritmo de una regla (1R)
- Identificación de patrones, reglas de asociación, algoritmo Apriori
- Análisis de series de tiempo, tendencia, estacionalidad
- K-vecinos cercanos (kNN), K-medias
- Analíticas de texto para Big Data
- Bolsa de palabras, frecuencia de términos, frecuencia de documentos inversos, distancia de coseno, etc.
- Detección de datos atípicos para Big Data
- Técnicas estadísticas, basadas en distancia, supervisadas y semisupervisadas
0 - Módulo 5: Laboratorio de Análisis y Ciencia de Big Data
Este módulo presenta a los participantes una serie de ejercicios y problemas diseñados para poner a prueba su capacidad para aplicar sus conocimientos de los temas cubiertos previamente en los Módulos 4 y 5. Completar este laboratorio ayudará a resaltar las áreas que requieren mayor atención y además ayudará a demostrar el dominio de las prácticas de análisis y ciencia de Big Data tal como se aplican y combinan para resolver problemas del mundo real.
Se proporcionan los siguientes ejercicios:
- Ejercicio de lectura 6.1: Lectura y socialización en clase: Antecedentes del caso de estudio de TMC
- Ejercicio de laboratorio 6.2: Análisis para mejorar la calidad de los productos
- Ejercicio de laboratorio 6.3: Análisis para la reducción del costo total de propiedad
- Ejercicio de lectura 6.4: Lectura y socialización en clase: Antecedentes del caso de estudio de PLGM
- Ejercicio de laboratorio 6.5: Análisis del plan de mercadeo de alto rendimiento
- Ejercicio de laboratorio 6.6: Análisis de distribución de artículos y datos de tarjetas de crédito
- Ejercicio de lectura 6.7: Lectura y socialización en clase: Antecedentes del caso de estudio de LHL
- Ejercicio de laboratorio 6.8: Mejorar la capacidad de diagnóstico de los pacientes
- Ejercicio de lectura 6.9: Lectura en clase: Antecedentes del caso de estudio de SWP
- Ejercicio de laboratorio 6.10: Mejorar la gestión de riesgos y comprender los patrones de demanda
0
Obtienes:
- Acceso a la plataforma de exámenes donde deberás crear tu cuenta de candidato
- Un (01) código de voucher Pearson VUE para rendir el examen, personal e intransferible, y redimible una sola vez, válido por doce (12) meses
Las características del examen de certificación son las siguientes:
- Se rinde en línea
- Es personal
- Se rinde sin compañía alguna y a libro cerrado
- Está prohibido el uso de anotaciones, audios, vídeos, celulares
- Es supervisado por Pearson VUE
- El idioma es el español
- La duración es de 90 minutos
Los resultados se presentan al finalizar el examen y se reciben por correo electrónico en un plazo de dos (02) días hábiles.
Tras aprobar el examen de certificación recibes:
- Un (01) Certificado Digital oficial de la calificación obtenida, emitido por Arcitura Education Inc.
- Una (01) Insignia Digital de Certificación otorgada por Acclaim/Credly, con una cuenta que soporta la verificación en línea del estado de la certificación.