Pular para o conteúdo principal
InícioSpark

Curso

Fundamentos de Big Data com PySpark

Avançado
Actualizado 05/2025
"Aprenda os fundamentos de trabalhar com big data usando PySpark."
Iniciar curso gratuitamente

Incluído comPremium or Teams

SparkData Engineering4 horas16 vídeos55 Exercícios4,600 XP56,300Certificado de conclusão

Crie sua conta gratuita

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas

Descrição do curso

Nos últimos anos, tem havido muito burburinho sobre Big Data, e ele finalmente se tornou popular para muitas empresas. Mas o que é esse Big Data? Este curso aborda os fundamentos do Big Data por meio do PySpark. O Spark é uma estrutura de "computação em cluster extremamente rápida" para Big Data. Ele fornece um mecanismo de plataforma de processamento de dados geral e permite que você execute programas até 100 vezes mais rápido na memória ou 10 vezes mais rápido no disco do que o Hadoop. Você usará o PySpark, um pacote Python para programação do Spark e suas poderosas bibliotecas de nível superior, como SparkSQL, MLlib (para aprendizado de máquina), etc. Você explorará as obras de William Shakespeare, analisará dados da Fifa 2018 e realizará clustering em conjuntos de dados genômicos. Ao final deste curso, você terá adquirido um conhecimento profundo do PySpark e de sua aplicação à análise geral de Big Data.

Pré-requisitos

Introduction to Python
1

Introdução à análise de Big Data com o Spark

Iniciar capítulo
2

Programação nos RDDs do PySpark

Iniciar capítulo
3

PySpark SQL e DataFrames

Iniciar capítulo
4

Aprendizado de máquina com PySpark MLlib

Iniciar capítulo
Fundamentos de Big Data com PySpark
Curso
Completo

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil, currículo ou currículo do LinkedIn
Compartilhe nas redes sociais e em sua avaliação de desempenho

Incluído comPremium or Teams

Inscreva-se agora

Junte-se a mais 16 milhões de alunos e comece Fundamentos de Big Data com PySpark hoje!

Crie sua conta gratuita

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.