34 91 383 06 41

DP-203 – Ingeniería de datos de Microsoft Azure

Nuestros cursos de DP-203 – Ingeniería de datos de Microsoft Azure para empresas en Madrid se adaptan a los horarios y necesidades de formación de nuestros clientes. Tenemos una gran diversidad de cursos in company cuyos programas formativos se adaptan al mercado actual. Adicionalmente, nuestros cursos de Azure Fundamentals para empresas pueden ser subvencionados o bonificados a través de la Fundación Tripartita.

Tecnolearning ofrece gestionar todos los trámites necesarios para conseguir las subvenciones ofrecidas por la Fundación Tripartita de forma gratuita, bien sea por la contratación de un plan de formación completo o una acción formativa puntual.

  • Objetivos del curso:
  • Exploración de las opciones de proceso y almacenamiento de las cargas de trabajo de ingeniería de datos en Azure
  • Ejecución de consultas interactivas con grupos de SQL sin servidor
  • Realización de exploraciones y transformaciones de datos en Azure Databricks
  • Exploración, transformación y carga de datos en almacenamientos de datos con Apache Spark
  • Ingesta y carga de datos en almacenamientos de datos
  • Transformación de datos con canalizaciones de Azure Data Factory o Azure Synapse
  • Integrar datos de Notebooks con canalizaciones de Azure Data Factory o Azure Synapse
  • Soporte de procesamientos analíticos transaccionales híbridos con Azure Synapse Link
  • Poner en marcha una seguridad integral con Azure Synapse Analytics
  • Realizar procesamientos de secuencias en tiempo real con Stream Analytics
  • Crear una solución de procesamiento de secuencias con Event Hubs y Azure Databricks

Temario DP-203 – Ingeniería de datos de Microsoft Azure – 20 HORAS
_____________________________________________________________________________________________________

  • MÓDULO 1: EXPLORACIÓN DE LAS OPCIONES DE PROCESO Y ALMACENAMIENTO DE LAS CARGAS DE TRABAJO DE INGENIERÍA DE DATOS
    • Introducción a Azure Synapse Analytics
    • Descripción de Azure Databricks
    • Introducción a Azure Data Lake Storage
    • Descripción de la arquitectura de Delta Lake
    • Trabajo con secuencias de datos mediante Azure Stream Analytics
    • Laboratorio: Exploración de las opciones de proceso y almacenamiento de las cargas de trabajo de ingeniería de datos
    • Combinar procesamiento por lotes y de secuencias en una misma canalización
    • Organizar el lago de datos en niveles de transformación de archivos
    • Indexar el almacenamiento del lago de datos para la aceleración de consultas y cargas de trabajo
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Describir Azure Synapse Analytics
    • Descripción de Azure Databricks
    • Describir Azure Data Lake Storage
    • Describir la arquitectura de Delta Lake
    • Describir Azure Stream Analytics
  • MÓDULO 2: EJECUCIÓN DE CONSULTAS INTERACTIVAS CON GRUPOS DE SQL SIN SERVIDOR DE AZURE SYNAPSE ANALYTICS
    • Exploración de las capacidades de los grupos de SQL sin servidor de Azure Synapse
    • Consulta de datos en el lago mediante grupos de SQL sin servidor de Azure Synapse
    • Creación de objetos de metadatos en grupos de SQL sin servidor de Azure Synapse
    • Protección de datos y administración de usuarios en grupos de SQL sin servidor de Azure Synapse
    • Laboratorio: Ejecución de consultas interactivas con grupos de SQL sin servidor
    • Consultar datos de Parquet con grupos de SQL sin servidor
    • Crear tablas externas para archivos Parquet y CSV
    • Crear vistas con grupos de SQL sin servidor
    • Proteger el acceso a los datos en un lago de datos cuando se usan grupos de SQL sin servidor
    • Configurar la seguridad del lago de datos a través del control de acceso basado en roles (RBAC) y listas de control de acceso (ACL)
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Describir las capacidades de los grupos de SQL sin servidor de Azure Synapse
    • Consulta de datos en el lago mediante grupos de SQL sin servidor de Azure Synapse
    • Creación de objetos de metadatos en grupos de SQL sin servidor de Azure Synapse
    • Protección de datos y administración de usuarios en grupos de SQL sin servidor de Azure Synapse
  • MÓDULO 3: EXPLORACIÓN Y TRANSFORMACIÓN DE DATOS EN AZURE DATABRICKS
    • Descripción de Azure Databricks
    • Lectura y escritura de datos en Azure Databricks
    • Trabajo con elementos DataFrame en Azure Databricks
    • Trabajo con métodos avanzados de DataFrame en Azure Databricks
    • Laboratorio: Realización de exploraciones y transformaciones de datos en Azure Databricks
    • Usar DataFrames en Azure Databricks para explorar y filtrar datos
    • Almacenar DataFrames en caché para realizar consultas más rápidas posteriormente
    • Eliminación de datos duplicados
    • Manipular valores de fecha y hora
    • Quitar columnas de DataFrame y cambiarlas de nombre
    • Agregar datos almacenados en un DataFrame
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Descripción de Azure Databricks
    • Lectura y escritura de datos en Azure Databricks
    • Trabajo con elementos DataFrame en Azure Databricks
    • Trabajo con métodos avanzados de DataFrame en Azure Databricks
  • MÓDULO 4: EXPLORACIÓN, TRANSFORMACIÓN Y CARGA DE DATOS EN ALMACENAMIENTOS DE DATOS CON APACHE SPARK
    • Definición de la ingeniería de macrodatos con Apache Spark en Azure Synapse Analytics
    • Ingesta de datos con cuadernos de Apache Spark en Azure Synapse Analytics
    • Transformación de datos con objetos DataFrame de grupos de Apache Spark de Azure Synapse Analytics
    • Integración de grupos de SQL y Apache Spark en Azure Synapse Analytics
    • Laboratorio: Exploración, transformación y carga de datos en almacenamientos de datos con Apache Spark
    • Realizar exploraciones de datos en Synapse Studio
    • Ingerir datos con cuadernos de Spark en Azure Synapse Analytics
    • Transformar datos con DataFrame de grupos de Spark de Azure Synapse Analytics
    • Integrar grupos de SQL y Spark en Azure Synapse Analytics
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Describir la ingeniería de macrodatos con Apache Spark en Azure Synapse Analytics
    • Ingesta de datos con cuadernos de Apache Spark en Azure Synapse Analytics
    • Transformación de datos con objetos DataFrame de grupos de Apache Spark de Azure Synapse Analytics
    • Integración de grupos de SQL y Apache Spark en Azure Synapse Analytics
  • MÓDULO 5: INGESTA Y CARGA DE DATOS EN ALMACENAMIENTOS DE DATOS
    • Uso de procedimientos recomendados para la carga de datos en Azure Synapse Analytics
    • Ingesta a escala de petabytes con Azure Data Factory
    • Laboratorio: Ingesta y carga de datos en almacenamientos de datos
    • Realizar ingestas a escala de petabytes con canalizaciones de Azure Synapse
    • Importar datos con PolyBase y COPY mediante T-SQL
    • Uso de procedimientos recomendados para la carga de datos en Azure Synapse Analytics
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Uso de procedimientos recomendados para la carga de datos en Azure Synapse Analytics
    • Ingesta a escala de petabytes con Azure Data Factory
  • MÓDULO 6: TRANSFORMACIÓN DE DATOS CON CANALIZACIONES DE AZURE DATA FACTORY O AZURE SYNAPSE
    • Integración de datos con Azure Data Factory o canalización de Azure Synapse
    • Realización de transformaciones sin código y a escala con canalizaciones de Azure Data Factory o Azure Synapse
    • Laboratorio: Transformación de datos con canalizaciones de Azure Data Factory o Azure Synapse
    • Ejecutar transformaciones sin código y a escala con canalizaciones de Azure Synapse
    • Crear una canalización de datos para importar archivos CSV con formato deficiente
    • Crear flujos de datos de asignación
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Realizar integraciones de datos con Azure Data Factory
    • Realización de transformaciones sin código y a escala con Azure Data Factory
  • MÓDULO 7: ORGANIZACIÓN DE MOVIMIENTOS Y TRANSFORMACIONES DE DATOS EN CANALIZACIONES DE AZURE SYNAPSE
    • Orquestación de movimientos y transformaciones de datos en Azure Data Factory
    • Laboratorio: Organización de movimientos y transformaciones de datos en canalizaciones de Azure Synapse
    • Integrar datos de Notebooks con canalizaciones de Azure Data Factory o Azure Synapse
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Organizar movimientos y transformaciones de datos en canalizaciones de Azure Synapse
  • MÓDULO 8: SEGURIDAD INTEGRAL CON AZURE SYNAPSE ANALYTICS
    • Creación de un almacenamiento de datos en Azure Synapse Analytics
    • Configuración y administración de secretos en Azure Key Vault
    • Implementación de controles de cumplimiento para datos confidenciales
    • Laboratorio: Seguridad integral con Azure Synapse Analytics
    • Proteger la infraestructura tras Azure Synapse Analytics
    • Proteger el área de trabajo y los servicios administrados de Azure Synapse Analytics
    • Proteger los datos del área de trabajo de Azure Synapse Analytics
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Creación de un almacenamiento de datos en Azure Synapse Analytics
    • Configuración y administración de secretos en Azure Key Vault
    • Implementación de controles de cumplimiento para datos confidenciales
  • MÓDULO 9: SOPORTE DE PROCESAMIENTOS ANALÍTICOS TRANSACCIONALES HÍBRIDOS CON AZURE SYNAPSE LINK
    • Diseño del procesamiento analítico y transaccional híbrido mediante Azure Synapse Analytics
    • Configuración de Azure Synapse Link con Azure Cosmos DB
    • Consulta de Azure Cosmos DB con grupos de Apache Spark
    • Consulta de Azure Cosmos DB con grupos de SQL sin servidor
    • Laboratorio: Soporte de procesamientos analíticos transaccionales híbridos con Azure Synapse Link
    • Configuración de Azure Synapse Link con Azure Cosmos DB
    • Consultar Azure Cosmos DB con Apache Spark para Synapse Analytics
    • Consultar Azure Cosmos DB con grupos de SQL sin servidor para Azure Synapse Analytics
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Diseño del procesamiento analítico y transaccional híbrido mediante Azure Synapse Analytics
    • Configuración de Azure Synapse Link con Azure Cosmos DB
    • Consulta de Azure Cosmos DB con Apache Spark para Azure Synapse Analytics
    • Consultar Azure Cosmos DB con SQL sin servidor para Azure Synapse Analytics
  • MÓDULO 10: PROCESAMIENTO DE SECUENCIAS EN TIEMPO REAL CON STREAM ANALYTICS
    • Habilitación de mensajería confiable para aplicaciones de macrodatos con Azure Event Hubs
    • Trabajo con secuencias de datos mediante Azure Stream Analytics
    • Ingesta de flujos de datos con Azure Stream Analytics
    • Laboratorio: Procesamiento de secuencias en tiempo real con Stream Analytics
    • Usar Stream Analytics para procesar datos en tiempo real desde Event Hubs
    • Usar funciones basadas en ventana de Stream Analytics para crear agregados y enviarlos a Synapse Analytics
    • Escalar trabajos de Azure Stream Analytics para aumentar el rendimiento a través de la creación de particiones
    • Volver a particionar la entrada de secuencias para optimizar la paralelización
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Habilitación de mensajería confiable para aplicaciones de macrodatos con Azure Event Hubs
    • Trabajo con secuencias de datos mediante Azure Stream Analytics
    • Ingesta de flujos de datos con Azure Stream Analytics
  • MÓDULO 11: CREACIÓN DE UNA SOLUCIÓN DE PROCESAMIENTO DE SECUENCIAS CON EVENT HUBS Y AZURE DATABRICKS
    • Procesamiento de datos de streaming con Structured Streaming de Azure Databricks
    • Laboratorio: Creación de una solución de procesamiento de secuencias con Event Hubs y Azure Databricks
    • Analizar los usos y características clave del streaming estructurado.
    • Transmitir datos de un archivo y escribirlos en un sistema de archivos distribuido
    • Usar ventanas deslizantes para agregar fragmentos de datos en lugar de todos los datos
    • Aplicar marcas de agua para quitar datos obsoletos
    • Conectarse a flujos de lectura y escritura de Event Hubs
    • Después de completar este módulo, los alumnos podrán hacer lo siguiente:
    • Procesamiento de datos de streaming con Structured Streaming de Azure Databricks