Formation Hadoop pour administrateur

Ref :

Big data & NoSQL Durée :
2 jours
Lieu :
Paris - Lyon - Lille - Nantes

Tarif

Intra :
Inter :
Nous consulter
Inscrivez-vous

Demande d'informations

Pré-requis

  • Bonnes connaissances système
  • Bonnes connaissances JVM

Public concerné

  • Architecte/DBA
  • Administrateur Hadoop

Objectifs

Comprendre les concepts Big Data et Hadoop

Connaitre l’écosystème Hadoop dont HDFS, YARN et les moteurs de traitement (MR, Spark, Tez)

Dimensionner et préparer un cluster

Installer un cluster

Configurer et sécuriser un cluster

Exploiter un cluster

Programme détaillé

Comprendre les concepts Big Data

  • Illustration de cas d’usages du Big Data

  • Concepts de clustering et de NoSQL

  • Concepts MapReduce

  • Connaitre l’écosystème Hadoop

  • Présentation générale d’HADOOP

  • Présentation de l’architecture générale d’HADOOP

  • Stockage HDFS

  • YARN et moteurs de traitement

Dimensionner et préparer un cluster

  • Métriques à collecter et topologies de clusters Hadoop

  • Dimensionner le cluster Hadoop

  • Pré-requis de l’environnement

Installer, configurer et sécuriser un cluster

  • Installer les composants

  • Les principaux points de paramétrage

  • Déployer les composants sur les noeuds

  • Facettes de la sécurité d’un cluster Hadoop

  • Sécurisation des données

Exploiter un cluster

    • Planifier l’exécution des traitements

    • Monitorer l’état du cluster et l’exécution des traitements

    • Sauveragrder les données du cluster (snapshot HDFS)

    Nos Actualités