
- Students: 880
- Duration: 365 days
El curso Gobernanza de Ciencia de Datos de Arcitura Education Inc. desarrolla conocimientos y habilidades en la gobernanza de ciencia de datos, con un enfoque en las soluciones de Machine Learning, Inteligencia Artificial (IA) y Big Data. Cubre los conceptos, riesgos, retos y roles clave de la gobernanza, y además explora el ciclo de vida de la gobernanza del pipeline de analíticas, detallando más de 70 preceptos y procesos. El curso también describe más de 80 preceptos y procesos adicionales de gobernanza de plataformas de analíticas, Machine Learning y pipeline de IA, mapeando los roles relevantes a cada etapa.
El curso está compuesto por los siguientes módulos:
- Módulo 1: Fundamentos de Ciencia y Analíticas de Big Data
- Módulo 2: Conceptos de Análisis y Tecnología de Big Data
- Módulo 3: Fundamentos de Gobernanza de Ciencia de Datos
- Módulo 4: Gobernanza de Ciencia de Datos Avanzada
- Módulo 5: Laboratorio de Gobernanza de Ciencia de Datos
Cada módulo tiene un conjunto de lecciones que totalizan una duración estimada de diez (10) horas, y además se complementa con ejercicios para ayudar a reforzar su comprensión de los temas clave.
El módulo final del curso consiste en una serie de ejercicios de laboratorio que requieren que los participantes apliquen su conocimiento de los cursos precedentes con el fin de cumplir con requerimientos de proyectos y resolver problemas del mundo real.
Currículum
- 5 secciones
- 0 lecciones
- 365 días
- Módulo 1: Fundamentos de Ciencia y Analíticas de Big Data
Este módulo de fundamentos ofrece una vista general de alto nivel de las áreas temáticas esenciales de Big Data. Se ofrece una comprensión básica de Big Data desde la perspectiva de los negocios y la tecnología, junto con una vista general de los beneficios, retos y problemas comunes relacionados con su adopción. El contenido de este módulo está dividido en una serie de secciones modulares, cada una de las cuales se acompaña de uno o más ejercicios prácticos.
Se cubren los siguientes temas principales:
- Cómo entender Big Data
- Terminología y conceptos fundamentales de Big Data
- Factores de negocio y factores tecnológicos de Big Data
- Tecnologías empresariales tradicionales relacionadas con Big Data
- OLTP, OLAP, ETL y Bodegas de datos digitales en relación con Big Data
- Características de los datos en los ambientes de Big Data
- Tipos de conjuntos de datos en los ambientes de Big Data
- Datos estructurados, no estructurados y semiestructurados
- Veracidad de datos y metadatos
- Fundamentos de análisis y analítica
- Análisis cuantitativo y cualitativo
- Tipos de Machine Learning
- Analítica descriptiva y diagnóstica
- Analítica predictiva y prescriptiva
- Inteligencia de negocios (BI) y Big Data
- Visualización de datos y Big Data
- Consideraciones sobre la planeación y adopción de Big Data
0 - Módulo 2: Conceptos de Análisis y Tecnología de Big Data
Este módulo explora una serie de los temas más relevantes relacionados con las prácticas, tecnologías y herramientas contemporáneas de análisis para los ambientes de Big Data. El contenido del módulo intencionalmente mantiene su cobertura a nivel conceptual, enfocándose en temas que permiten a los participantes desarrollar una comprensión integral de las funciones y características de análisis comunes ofrecidas por las soluciones de Big Data, así como una comprensión de alto nivel de los componentes de back end que habilitan estas funciones.
Se cubren los siguientes temas principales:
- Ciclo de vida del análisis de Big Data (de Evaluación del caso empresarial a Análisis y visualización de datos)
- Pruebas A/B y Correlación
- Regresión y Mapas de calor
- Análisis de series temporales
- Análisis de redes y Análisis de datos espaciales
- Clasificación y Agrupamiento
- Filtrado, incluyendo Filtrado colaborativo y Filtrado basado en contenido
- Análisis de sentimientos y Analítica de texto
- Clusters y Cargas de trabajo de procesamiento por lotes y transaccionales
- Cómo se relaciona la Computación en la Nube con Big Data
- Mecanismos tecnológicos fundacionales de Big Data
- Dispositivos de almacenamiento y Motores de procesamiento de Big Data
- Gestores de recursos, Motores de transferencia de datos y Motores de consultas
- Motores analíticos, Motores de flujo de trabajo, Motores de coordinación
0 - Módulo 3: Fundamentos de Gobernanza de Ciencia de Datos
Este módulo describe los conceptos y las bases de la gobernanza de ciencia de datos e identifica riesgos y retos comunes, así como los roles clave para quienes están involucrados en proyectos de gobernanza. El módulo además explora el ciclo de vida de la gobernanza del pipeline de analítica y establece más de 70 preceptos y procesos de gobernanza de ciencia de datos. El módulo mapea cómo se relacionan entre sí los preceptos y procesos y cómo se relacionan con las etapas de gobernanza.
Se cubren los siguientes temas principales:
- Evaluación del caso de negocio (incluyendo Evaluación de la madurez organizacional, Definición de KPIs, etc.)
- Identificación de datos (incluyendo Plantilla de metadatos de conjuntos de datos, Categorización de fuentes de datos, etc.)
- Entrada de datos (incluyendo Umbral de volumen y velocidad de datos, Control de versiones de lógica de entrada, etc.)
- Almacenamiento de datos en bruto (incluyendo Formación de lagos de datos, Plantilla de procedencia y linaje de datos, etc.)
- Limpieza y validación de datos (incluyendo Definición del modelo de datos, Notificación de inconsistencias en los datos, etc.)
- Etiquetado de datos (incluyendo Taxonomía de clases de datos, Automatización de clasificación de datos, etc.)
- Saneamiento de datos (incluyendo Plantilla de desidentificación de datos, Centralización de la lógica de desidentificación de datos, etc.)
- Transformación de datos (incluyendo Modelos de datos de entrada y salida, Análisis del costo de la transformación de datos, etc.)
- Almacenamiento de datos procesados (incluyendo Formación de almacenes de datos, Medición del acceso a datos, etc.)
- Análisis de datos (incluyendo Habilitación de servicios de análisis, Control del acceso de visualización, etc.)
- Utilización de datos (incluyendo Clasificación de sensibilidad de insights, Gestión de cambios de visualizaciones, etc.)
- También se mapean los roles relevantes a las etapas de gobernanza individuales.
0 - Módulo 4: Gobernanza de Ciencia de Datos Avanzada
En este módulo, se describen más de 80 preceptos y procesos adicionales de gobernanza de ciencia de datos en relación con las etapas de gobernanza de plataformas de analítica y gobernanza de pipeline de Machine Learning e inteligencia artificial.
A continuación se proporcionan algunos ejemplos de los numerosos preceptos y procesos cubiertos en este módulo en relación con sus correspondientes etapas de gobernanza de analítica:
- Entrada (incluyendo Evaluación de restricciones de acceso a datos de origen, Análisis de uso de datos descendentes, etc.)
- Lago de datos (incluyendo Plantilla de compresión de datos, Definición del ciclo de vida del almacenamiento de datos, etc.)
- Procesamiento (incluyendo Estandarización del motor de procesamiento, Automatización de escalamiento de clústeres, etc.)
- Almacén de datos (incluyendo Cumplimiento bajo demanda de la solicitud de acceso a sujetos, Control de versiones de modelos de Machine Learning basados en SQL)
A continuación se presentan ejemplos adicionales de los numerosos preceptos y procesos cubiertos en relación con las correspondientes etapas de gobernanza de pipeline de Machine Learning e inteligencia artificial:
- Definición del problema (incluyendo Evaluación del riesgo de adopción, Asignación del presupuesto del proyecto)
- Identificación de datos (incluyendo Cumplimiento de la regulación de datos organizacionales, Análisis de la sensibilidad de los datos, etc.)
- Extracción de datos (incluyendo Política de extracción de datos, Acceso automatizado a datos, etc.)
- Análisis de datos exploratorio (EDA) (incluyendo Notificación de discrepancia de datos, Registro de estadísticas de resumen, etc.)
- Validación de datos (incluyendo Umbral estadístico de desviación de huellas dactilares, Automatización de la lógica de validación de datos, etc.)
- Preparación de datos (incluyendo Guías de ingeniería de características, Automatización de pruebas unitarias de la lógica de preparación de datos, etc.)
- Entrenamiento de modelos (incluyendo Criterios de selección de algoritmos, Registro de métricas de entrenamiento, etc.)
- Pruebas de modelos (incluyendo Umbral de aprobación de modelos, Automatización de pruebas de modelos, etc.)
- Despliegue de modelos (incluyendo Reglas de cambio de versiones de modelos, Evaluación de dependencias de ejecución de modelos, etc.)
- Monitoreo de modelos (incluyendo Notificación de degradación del rendimiento del modelo, Revisión del rendimiento del modelo, etc.)
- Reentrenamiento de modelos (Detonantes de reentrenamiento de modelos y Registro de metadatos de reentrenamiento de modelos)
También se mapean los roles relevantes a las etapas de gobernanza individuales. Para quienes también estén interesados en completar los cursos de Especialista en Machine Learning e Inteligencia Artificial, se proporciona un mapeo de los patrones de esos cursos a las etapas de gobernanza con fines de referencia.
0 - Módulo 5: Laboratorio de Gobernanza de Ciencia de Datos
Este módulo presenta a los participantes una serie de ejercicios y problemas diseñados para poner a prueba su capacidad para aplicar sus conocimientos de los temas cubiertos en los módulos anteriores. Completar este laboratorio ayudará a resaltar las áreas que requieren mayor atención y además ayudará a demostrar el dominio de las prácticas de gobernanza de ciencia de datos tal como se aplican y combinan para resolver problemas del mundo real.
0
El servicio de formación especializada incluye acceso por doce (12) meses al entorno virtual del curso donde encontrarás:
- Lecciones en video (para todos los temas)
- Libro de trabajo
- Guía de preparación de examen con ejemplos de preguntas
- Mapas mentales
- Afiches sobre el contenido del curso (según necesidad)
Algunos beneficios son los siguientes:
- Video lecciones desarrolladas en español por instructores internacionales acreditados por Arcitura®.
- Metodología de estudio para rendir el examen con un nivel alto de éxito.
Caracteristicas
- Este servicio de formación especializada se entrega en línea y está disponible 24 X 7.
- El curso Gobernanza de Ciencia de Datos de Arcitura Education Inc. ha sido elaborado por expertos en la materia en colaboración con un equipo especializado en el desarrollo de material didáctico, y sometido a un proceso de desarrollo probado.
Audiencia objetivo
- El curso Gobernanza de Ciencia de Datos de Arcitura Education Inc. está dirigido, pero no limitado, a personas interesadas en desarrollarse como Especialista en Gobernanza de Ciencia de Datos.