We may earn an affiliate commission when you visit our partners.
Course image
Pascal Lochert and Catherine Kong

Le Big Data : des zettaoctets de données à analyser pour en extraire de la valeur .

Mais pour y arriver, il faut des experts et des technologies : VOUS

Hadoop est la technologie phare depuis plusieurs années, ou plutôt un éco-système qui regroupe non seulement MapReduce, Yarn et HDFS mais aussi de manière plus vaste Spark, des bases NoSQL et des outils de traitements temps réel des données

Comment démarrer, comment progresser avec Hadoop ?

Avec cette formation, vos compétences s'améliorent chapitre après chapitre, les objectifs sont clairement définis

Read more

Le Big Data : des zettaoctets de données à analyser pour en extraire de la valeur .

Mais pour y arriver, il faut des experts et des technologies : VOUS

Hadoop est la technologie phare depuis plusieurs années, ou plutôt un éco-système qui regroupe non seulement MapReduce, Yarn et HDFS mais aussi de manière plus vaste Spark, des bases NoSQL et des outils de traitements temps réel des données

Comment démarrer, comment progresser avec Hadoop ?

Avec cette formation, vos compétences s'améliorent chapitre après chapitre, les objectifs sont clairement définis

Je vous accompagne dès l'installation d'Hadoop sur votre PC ou Mac

Le concepts de base vous sont expliqués progressivement puis vous vous exercez immédiatement en suivant les vidéos de démonstration

Des quiz à chaque fin de chapitre vous permettent de valider vos connaissances, et les très nombreuses ressources fournies vous permettent d'aller plus loin sur l'outil de votre choix

La formation va vous permettre d'acquérir des compétences claires et très recherchées

Si vous souhaitez faire les 3h d'exercices, n'oubliez pas qu'Hadoop réclame une configuration PC/Mac avec 16Gb de RAM pour que cela soit confortable

N'hésitez pas à pratiquer régulièrement pour devenir un expert dans ces technologies

La formation met aussi l'accent sur le support des technologies Hadoop dans le cloud computing avec AWS et Azure

Le support de formation PDF complet est disponible GRATUITEMENT en ressource

Enroll now

What's inside

Learning objectives

  • Découvrir les formidables possibilités du big data avec hadoop
  • Toute la formation en pdf gratuitement (316 slides)
  • Comprendre parfaitement le périmètre de chaque outil de l'écosystème hadoop
  • Etre au fait de pouvoir utiliser azure, aws, et google pour faire de l'hadoop dans le cloud
  • Utiliser directement hadoop sur de très nombreux exemples
  • Découvrir le périmètre des bases nosql
  • Comprendre comment faire du traitement temps réel avec spark

Syllabus

Bienvenue à la formation Hadoop

En ressources vous trouverez:

- Le rapport 2011 de McKinsey - Big Data : la nouvelle frontière pour l’innovation, la compétition et la productivité

- Le rapport 2015 de l'Institut Montaigne - Big Data et objets connectés

Read more

En ressources vous trouverez 2 documents sur la Virtual Box d'Oracle VM

En ressources vous trouverez des documents explicatifs sur Ambari

En ressources vous trouverez le document d'origine sur les règles de Codd

En ressources vous trouverez une documentation sur le design de HDFS

En ressources vous trouverez la liste des commandes HDFS

En ressources vous trouverez 2 documents complémentaires sur MapReduce

En ressources vous trouverez un document pour aller plus loin sur YARN

En ressources vous trouverez des documents complémentaires sur Hive

En ressources vous trouverez le guide complet de MySQL v5

En ressources vous trouverez des documents complémentaires sur HBase

En ressources vous trouverez un guide détaillé de Cassandra

En ressources vous trouverez un document complémentaire sur MongoDB

En ressources vous trouverez un document de recherche sur Pig

En ressources vous trouverez 2 documents complémentaires sur Spark

En ressources vous trouverez une documentation de référence sur Kafka

En ressources vous trouverez le guide utilisateur de Flume

En ressources vous trouverez un document de recherche sur SparkStreaming

En ressources vous trouverez un document récapitulatif de Storm

En ressources vous trouverez 2 documents complémentaires pour Flink

En ressources vous trouverez un document de recherche sur YARN

En ressources vous trouverez un document de recherche sur Mesos et le 1er chapitre d'un livre dédié à Mesos

En ressources vous trouverez un document de recherche sur Tez

En ressources vous trouverez 3 documents complémentaires sur ZooKeeper

En ressources vous trouverez un guide résumé de Zeppelin

En ressources vous trouverez la documentation complète de HDInsight

En ressources vous trouverez une documentation de référence sur EMR

Traffic lights

Read about what's good
what should give you pause
and possible dealbreakers
Provides hands-on experience with Hadoop and its ecosystem, allowing learners to immediately apply concepts through practical exercises and demonstrations
Explores the integration of Hadoop with cloud computing platforms like AWS and Azure, which is essential for modern data engineering and architecture
Covers a wide range of tools within the Hadoop ecosystem, including MapReduce, Yarn, HDFS, Spark, NoSQL databases, and real-time data processing tools
Includes exercises that require a PC/Mac with 16GB of RAM, which may pose a barrier for some learners with limited hardware resources
Offers a comprehensive PDF support document, providing learners with a valuable resource for reference and further study, which is available for free
Includes materials from 2011 and 2015, which may not reflect the current state of big data technologies and industry best practices, so learners should seek more current resources

Save this course

Create your own learning path. Save this course to your list so you can find it easily later.
Save

Reviews summary

Guide complet d'hadoop et big data

Selon les étudiants, ce cours offre une introduction très complète à l'écosystème Hadoop et au Big Data. Les apprenants apprécient la clarté des explications du formateur, jugé pédagogue. La partie pratique est très utile pour assimiler les concepts. Le support PDF est une ressource précieuse. Cependant, l'installation et la configuration peuvent être difficiles, nécessitant 16 Go de RAM minimum. Certains souhaitent plus de profondeur ou des projets plus complexes. L'avis général reste largement positif.
Ressource précieuse pour l'apprentissage.
"Le support PDF est un plus énorme."
"L'accès aux ressources PDF est un avantage considérable."
"Le PDF est très utile pour réviser."
"Support PDF complet."
Explications claires et passionnées.
"Le formateur est passionné et ça se ressent."
"Le formateur prend le temps d'expliquer les concepts complexes."
"Formateur très pédagogue et passionné."
Exemples et démos aident à la compréhension.
"Les explications sont claires et les exemples pratiques sont très utiles."
"La partie pratique est essentielle et bien guidée."
"Les démonstrations sont claires."
"Les exercices pratiques sont indispensables."
"Les exercices sont pertinents."
Couvre l'écosystème Hadoop et le Big Data.
"Excellent cours, très complet et bien structuré."
"Bonne introduction à Hadoop et ses outils. Couvre une large gamme de sujets."
"Vue d'ensemble très large de l'écosystème Hadoop. Bien pour les débutants qui veulent comprendre les différentes briques."
"Excellent guide pour débuter dans le Big Data avec Hadoop. J'ai apprécié la couverture des bases NoSQL et du Cloud."
"Parfait pour comprendre l'écosystème Hadoop."
Certaines technologies peuvent être anciennes.
"Le cours est un peu daté sur certaines technologies, notamment l'installation et certaines versions logicielles."
Besoin de plus de pratique complexe.
"j'aurais aimé plus de profondeur sur Spark et les traitements temps réel."
"Manque peut-être de projets plus conséquents pour vraiment solidifier les compétences."
Un défi technique majeur pour certains.
"Installation un peu compliquée, mais faisable en suivant les étapes."
"la partie pratique a été frustrante à cause des problèmes de compatibilité et de configuration."
"J'ai trouvé l'installation extrêmement difficile, même en suivant les étapes. Beaucoup d'erreurs de configuration qui n'étaient pas couvertes."
"Attention à la configuration matérielle nécessaire."
"Nécessite des machines puissantes comme mentionné, 16Go de RAM minimum."

Activities

Be better prepared before your course. Deepen your understanding during and after it. Supplement your coursework and achieve mastery of the topics covered in Le guide complet d'Hadoop : maîtriser votre Big Data with these activities:
Réviser les principes des bases de données relationnelles
Renforcer les connaissances de base sur les bases de données relationnelles avant de commencer le cours pour mieux comprendre l'intégration de Hadoop avec les bases de données traditionnelles.
Browse courses on SQL
Show steps
  • Revoir les concepts clés tels que les tables, les schémas et les requêtes SQL.
  • Effectuer des exercices pratiques de création et de manipulation de bases de données.
Lire 'Hadoop: The Definitive Guide'
Approfondir la compréhension de Hadoop avec un guide de référence complet.
Show steps
  • Lire les chapitres pertinents du livre en parallèle avec les modules du cours.
  • Effectuer les exercices et les exemples de code présentés dans le livre.
Pratiquer les commandes HDFS
Renforcer la maîtrise des commandes HDFS pour manipuler les données dans le système de fichiers distribué de Hadoop.
Show steps
  • Créer des répertoires, télécharger des fichiers et vérifier leur intégrité.
  • Effectuer des opérations de copie, de déplacement et de suppression de fichiers.
  • Explorer les options de configuration et de gestion de l'espace de stockage.
Four other activities
Expand to see all activities and additional details
Show all seven activities
Rédiger un article de blog sur un cas d'utilisation de Hadoop
Consolider la compréhension de Hadoop en expliquant un cas d'utilisation spécifique à un public plus large.
Show steps
  • Choisir un cas d'utilisation intéressant et pertinent.
  • Rechercher des informations et des exemples concrets.
  • Rédiger un article clair et concis expliquant le cas d'utilisation et les avantages de Hadoop.
  • Publier l'article sur un blog personnel ou professionnel.
Créer un pipeline de traitement de données avec Hadoop
Mettre en pratique les connaissances acquises en développant un projet concret de traitement de données avec Hadoop.
Show steps
  • Choisir un jeu de données pertinent et définir un objectif de traitement.
  • Concevoir un pipeline de traitement avec MapReduce ou Spark.
  • Implémenter le pipeline et tester son fonctionnement.
  • Analyser les résultats et optimiser les performances.
Lire 'Spark: The Definitive Guide'
Développer une compréhension approfondie de Spark, un outil clé dans l'écosystème Hadoop.
Show steps
  • Lire les chapitres pertinents du livre en se concentrant sur l'intégration avec Hadoop.
  • Expérimenter avec les exemples de code et les exercices proposés dans le livre.
Contribuer à un projet open source Hadoop
Approfondir l'expertise Hadoop en contribuant à un projet open source et en collaborant avec d'autres développeurs.
Show steps
  • Identifier un projet open source Hadoop qui correspond à vos intérêts et compétences.
  • Etudier le code source et la documentation du projet.
  • Identifier un bug ou une fonctionnalité à améliorer.
  • Soumettre un patch ou une pull request avec votre contribution.

Career center

Learners who complete Le guide complet d'Hadoop : maîtriser votre Big Data will develop knowledge and skills that may be useful to these careers:
Développeur Big Data
Le développeur Big Data crée et maintient les applications qui traitent de grands volumes de données. La formation sur Hadoop peut considérablement améliorer les compétences de ces développeurs. Elle offre une base solide dans l'écosystème Hadoop, comprenant MapReduce, Yarn, HDFS et Spark. Les développeurs Big Data peuvent utiliser les connaissances acquises pour créer des applications plus efficaces et évolutives. La formation peut aider à comprendre comment Hadoop peut être utilisé dans le cloud computing avec AWS et Azure. En maîtrisant ces technologies, les développeurs Big Data peuvent relever les défis complexes liés au traitement du Big Data et contribuer à la création d'applications innovantes.
Administrateur Hadoop
L'administrateur Hadoop est responsable de la configuration, de la maintenance et de la surveillance des clusters Hadoop. Cette formation peut fournir une compréhension approfondie de l'architecture Hadoop et des outils nécessaires pour gérer efficacement les clusters. La formation axée sur Hadoop, Spark, les bases NoSQL et le traitement des données en temps réel peut être particulièrement utile pour les administrateurs Hadoop. En maîtrisant ces aspects, les administrateurs peuvent optimiser les performances des clusters, résoudre les problèmes et assurer la disponibilité des données. De plus, la formation peut aider à comprendre comment Hadoop peut être utilisé dans le cloud computing avec AWS et Azure, ce qui est essentiel pour les administrateurs qui gèrent des clusters Hadoop dans le cloud.
Ingénieur de données
Un ingénieur de données conçoit, construit et gère l'infrastructure de données d'une organisation. Ce rôle implique de travailler avec de grandes quantités de données provenant de diverses sources, un défi que cette formation sur Hadoop aborde directement. La formation peut aider les ingénieurs de données à maîtriser les outils et les technologies nécessaires pour gérer et traiter efficacement le Big Data. En se familiarisant avec Hadoop, Spark, les bases NoSQL et le traitement des données en temps réel, les ingénieurs de données peuvent améliorer leurs compétences en matière d'intégration, de transformation et de stockage des données, compétences essentielles pour réussir dans ce domaine. De plus, elle peut aider à comprendre l'utilisation d'Hadoop dans le cloud computing avec AWS et Azure.
Analyste de données
L'analyste de données examine les données pour en extraire des informations utiles et aider à la prise de décision. La formation sur Hadoop peut aider les analystes de données à accéder et à traiter de grands ensembles de données, ce qui peut leur permettre d'extraire des informations plus approfondies. Avec une compréhension approfondie de l'écosystème Hadoop, comprenant des outils comme MapReduce, Yarn, Spark et les bases NoSQL, les analystes peuvent améliorer leur capacité à analyser des données complexes. Les quiz et les exercices pratiques de la formation peuvent renforcer ces compétences, tandis que la couverture du cloud computing avec AWS et Azure peut être particulièrement pertinente pour ceux qui travaillent avec des données hébergées dans le cloud. Un analyste de données peut tirer parti des connaissances acquises lors de la formation pour faciliter la prise de décisions éclairées au sein de son organisation.
Consultant Big Data
Le consultant Big Data aide les organisations à tirer parti du Big Data pour améliorer leurs activités. Cette formation sur Hadoop peut aider les consultants à acquérir une expertise approfondie dans les technologies de Big Data et à comprendre comment elles peuvent être appliquées à divers secteurs. La formation peut fournir une base solide dans l'écosystème Hadoop, comprenant MapReduce, Yarn, HDFS et Spark. Les consultants peuvent utiliser ces connaissances pour conseiller les clients sur les meilleures stratégies et solutions de Big Data. De plus, la formation peut aider à comprendre comment Hadoop peut être utilisé dans le cloud computing avec AWS et Azure, ce qui est essentiel pour les consultants qui travaillent avec des clients utilisant des solutions cloud.
Architecte de données
L'architecte de données est responsable de la conception de l'architecture des systèmes de données d'une organisation. Cette formation sur Hadoop peut être un atout précieux, car elle offre une vue d'ensemble des technologies de Big Data et de leur intégration. En acquérant une compréhension approfondie de l'écosystème Hadoop, comprenant MapReduce, Yarn, HDFS et Spark, les architectes de données peuvent concevoir des systèmes plus efficaces et évolutifs. La formation peut aider à comprendre comment Hadoop peut être utilisé dans le cloud computing avec AWS et Azure. Cela peut permettre aux architectes de données de prendre des décisions éclairées sur les technologies à utiliser et la manière de les intégrer dans l'infrastructure existante.
Ingénieur Cloud
Un ingénieur cloud conçoit, met en œuvre et gère des solutions basées sur le cloud. Cette formation, en particulier sa couverture d'Hadoop dans le cloud computing avec AWS et Azure, peut être un atout précieux. Les ingénieurs cloud peuvent utiliser les connaissances acquises pour déployer et gérer des clusters Hadoop dans le cloud, optimiser les performances et assurer la sécurité des données. De plus, la formation axée sur Hadoop, Spark, les bases NoSQL et le traitement des données en temps réel peut aider les ingénieurs cloud à intégrer Hadoop à d'autres services cloud et à créer des solutions complètes de Big Data dans le cloud. Cette formation améliore leur capacité à concevoir des architectures cloud robustes et évolutives.
Scientifique des données
Le scientifique des données utilise des techniques statistiques et d'apprentissage automatique pour analyser les données et résoudre des problèmes complexes. Cette formation sur Hadoop peut aider les scientifiques des données à gérer et à traiter de grands ensembles de données, ce qui est essentiel pour développer des modèles précis. La formation est axée sur Hadoop, Spark, les bases NoSQL et le traitement des données en temps réel. Les scientifiques des données peuvent tirer parti de cette expertise pour améliorer leurs compétences en matière d'exploration, d'analyse et de modélisation des données. De plus, la formation peut aider à acquérir une expertise dans l'utilisation d'Hadoop dans le cloud computing avec AWS et Azure, ce qui peut être particulièrement utile pour ceux qui travaillent avec des données hébergées dans le cloud. Un scientifique des données peut utiliser ces compétences pour créer des solutions innovantes basées sur les données.
Architecte de Solutions
Un architecte de solutions conçoit et met en œuvre des solutions informatiques complexes pour répondre aux besoins de l'entreprise. Cette formation sur Hadoop peut aider les architectes de solutions à comprendre comment intégrer les technologies de Big Data dans leurs solutions. En acquérant une compréhension approfondie de l'écosystème Hadoop, comprenant MapReduce, Yarn, HDFS et Spark, les architectes de solutions peuvent concevoir des solutions plus efficaces et évolutives. La formation peut aider à comprendre comment Hadoop peut être utilisé dans le Cloud Computing avec AWS et Azure. Cela peut permettre aux architectes de solutions de prendre des décisions éclairées sur les technologies à utiliser et la manière de les intégrer dans l'infrastructure existante.
Développeur de logiciels
Le développeur de logiciels conçoit, code et teste des applications. La formation sur Hadoop peut être utile pour les développeurs qui souhaitent acquérir des compétences en Big Data et créer des applications qui traitent de grands volumes de données. La formation peut fournir une base solide dans l'écosystème Hadoop, comprenant MapReduce, Yarn, HDFS et Spark. Les développeurs peuvent utiliser ces connaissances pour intégrer Hadoop à leurs applications et créer des solutions innovantes. La formation peut aider à comprendre l'utilisation d'Hadoop dans le cloud computing avec AWS et Azure.
Gestionnaire de Base de Données
Un gestionnaire de base de données supervise l'organisation et l'accès aux données. Cette formation sur Hadoop peut aider les gestionnaires de bases de données à comprendre comment Hadoop peut être utilisé en complément des bases de données traditionnelles pour gérer de grands volumes de données. La formation peut fournir une base solide dans l'écosystème Hadoop, comprenant MapReduce, Yarn, HDFS et Spark. Les gestionnaires de bases de données peuvent utiliser ces connaissances pour concevoir des stratégies d'intégration des données et optimiser les performances des systèmes. La formation peut aider à comprendre l'utilisation d'Hadoop dans le cloud computing avec AWS et Azure.
Testeur Logiciel
Les testeurs logiciels sont responsables d'identifier les problèmes d'une application avant son lancement. Avec l'avènement du Big Data, les testeurs logiciels peuvent profiter des connaissances concernant les outils et l'écosystème Hadoop. La formation axée sur Hadoop, Spark, les bases NoSQL et le traitement des données en temps réel donne aux testeurs les informations dont ils ont besoin pour tester efficacement les applications Big Data. L'expertise en Hadoop aide les testeurs à trouver des bogues dans les applications, et le développement de programmes qui nécessitent le traitement de Big Data. La formation peut aider à comprendre l'utilisation d'Hadoop dans le cloud computing avec AWS et Azure.
Analyste Métier
L'analyste métier identifie les besoins de l'entreprise et propose des solutions basées sur les données. Bien qu'un analyste métier puisse ne pas travailler directement avec Hadoop, la formation peut être utile pour comprendre les capacités du Big Data et comment il peut être appliqué pour résoudre les problèmes de l'entreprise. La formation axée sur Hadoop, Spark, les bases NoSQL et le traitement des données en temps réel peut aider les analystes métier à identifier les opportunités d'amélioration des processus et de prise de décision grâce à l'analyse des données. La présentation de l'utilisation d'Hadoop dans le cloud computing avec AWS et Azure may être utile aux analystes métier.
Chef de projet
En tant que chef de projet, vous pourriez superviser des initiatives impliquant des technologies de Big Data. Cette formation sur Hadoop may vous fournir une base solide pour comprendre les aspects techniques et les défis associés à ces projets. La formation, axée sur Hadoop, Spark, les bases NoSQL et le traitement des données en temps réel, peut vous aider à mieux communiquer avec les équipes techniques, à planifier les ressources et à gérer les risques. Bien que vous ne soyez pas directement impliqué dans le développement, la compréhension des concepts clés peut améliorer votre capacité à mener à bien des projets Big Data. La formation peut aider à comprendre l'utilisation d'Hadoop dans le cloud computing avec AWS et Azure.
Spécialiste de la Sécurité des Données
Le spécialiste de la sécurité des données protège les informations sensibles stockées dans les systèmes. Cette formation sur Hadoop may être utile pour comprendre les défis spécifiques de la sécurité des données dans les environnements Big Data. La formation axée sur Hadoop, Spark, les bases NoSQL et le traitement des données en temps réel, peut aider à identifier les vulnérabilités potentielles et à mettre en œuvre des mesures de protection appropriées. La connaissance de l'architecture Hadoop et des outils de gestion peut également être précieuse pour assurer la conformité aux réglementations en matière de confidentialité des données. La formation peut aider à comprendre l'utilisation d'Hadoop dans le cloud computing avec AWS et Azure.

Reading list

We've selected one books that we think will supplement your learning. Use these to develop background knowledge, enrich your coursework, and gain a deeper understanding of the topics covered in Le guide complet d'Hadoop : maîtriser votre Big Data.
Ce livre est une référence complète sur Hadoop, couvrant tous les aspects de l'écosystème, de HDFS et MapReduce à YARN et les outils associés. Il fournit des explications détaillées, des exemples pratiques et des conseils pour la mise en œuvre. Il est particulièrement utile pour approfondir les concepts présentés dans le cours et pour servir de référence lors de la mise en œuvre de projets Hadoop. Ce livre est considéré comme un manuel standard pour les professionnels et les étudiants.

Share

Help others find this course page by sharing it with your friends and followers:

Similar courses

Similar courses are unavailable at this time. Please try again later.
Our mission

OpenCourser helps millions of learners each year. People visit us to learn workspace skills, ace their exams, and nurture their curiosity.

Our extensive catalog contains over 50,000 courses and twice as many books. Browse by search, by topic, or even by career interests. We'll match you to the right resources quickly.

Find this site helpful? Tell a friend about us.

Affiliate disclosure

We're supported by our community of learners. When you purchase or subscribe to courses and programs or purchase books, we may earn a commission from our partners.

Your purchases help us maintain our catalog and keep our servers humming without ads.

Thank you for supporting OpenCourser.

© 2016 - 2025 OpenCourser