Apache Spark

Apprendre à développer, optimiser et déployer des pipelines big data avec Apache Spark. Devenir Data engineer grâce aux retours d’expérience des professionnels.

Architecture de Apache Spark

Sommaires Introduction Architecture globale de Spark Les principaux composants de l’architecture distribuée de Spark. Comment une application Spark est divisée en jobs, stages et tasks. Spark UI Introduction Dans cette article nous allons voir le fonctionnement interne d’une application Spark à savoir: Fonctionnement d’un cluster Spark La relation entre le driver et les workers nodes …

Architecture de Apache Spark Lire la suite »

Databricks Certifications for Apache Spark

Guide pour la certification Apache Spark 3.0

Guide complet pour passer l’examen de certification spark officiel de Databricks. Des exemples d’examens officiels et des astuces à utiliser.