Accéder au contenu principal
AccueilPython

Cursus

Big Data avec PySpark

Maîtrisez la manière de traiter les big data et de les exploiter efficacement avec Apache Spark en utilisant l'API PySpark.
Démarrez le parcours gratuitement

Inclus avecPremium or Teams

PythonImportation et nettoyage des données25 heures

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.
Group

Formation de 2 personnes ou plus ?

Essayer DataCamp for Business

Apprécié par les apprenants de milliers d’entreprises

Description du cursus

Big Data avec PySpark

Faites progresser vos compétences en matière de données en maîtrisant Apache Spark. En utilisant l'API Python de Spark, PySpark, vous tirerez parti du calcul parallèle avec de grands ensembles de données, et vous vous préparerez à l'apprentissage automatique à haute performance. Du nettoyage des données à la création de fonctionnalités et à la mise en œuvre de modèles d'apprentissage automatique, vous exécuterez des flux de travail de bout en bout avec Spark. Le cursus se termine par la construction d'un moteur de recommandation utilisant le populaire ensemble de données MovieLens et l'ensemble de données Million Songs.

Conditions préalables

Il n’y a pas de prérequis pour ce parcours
  • Course

    1

    Introduction to PySpark

    Master PySpark to handle big data with ease—learn to process, query, and optimize massive datasets for powerful analytics!

  • Course

    Learn the gritty details that data scientists are spending 70-80% of their time on; data wrangling and feature engineering.

  • Course

    Learn how to make predictions from data with Apache Spark, using decision trees, logistic regression, linear regression, ensembles, and pipelines.

  • Project

    Bonus

    Building a Demand Forecasting Model

    Use PySpark to build an e-commerce forecasting model!

Big Data avec PySpark
6 Cours
Piste
terminée

Obtenez un certificat de réussite

Ajoutez ces informations d’identification à votre profil LinkedIn, à votre CV ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Inclus avecPremium or Teams

S'inscrire maintenant

Rejoignez plus de 16 millions d’apprenants et commencer Big Data avec PySpark dès aujourd'hui !

Créez votre compte gratuit

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.