Écosystème Hadoop

Auteur: Roger Morrison
Date De Création: 18 Septembre 2021
Date De Mise À Jour: 5 Peut 2024
Anonim
Écosystème Hadoop - La Technologie
Écosystème Hadoop - La Technologie

Contenu

Définition - Que signifie l'écosystème Hadoop?

L’écosystème Hadoop fait référence aux divers composants de la bibliothèque de logiciels Apache Hadoop, ainsi qu’aux accessoires et outils fournis par Apache Software Foundation pour ces types de projets logiciels et à la manière dont ils fonctionnent ensemble.


Hadoop est un framework Java extrêmement populaire pour la gestion et l'analyse de grands ensembles de données.

Introduction à Microsoft Azure et au nuage Microsoft | Tout au long de ce guide, vous apprendrez ce qu'est le cloud computing et comment Microsoft Azure peut vous aider à migrer et à exploiter votre entreprise à partir du cloud.

Techopedia explique l'écosystème Hadoop

Le paquet principal Hadoop et ses accessoires sont pour la plupart des projets open-source sous licence Apache. L’idée d’un écosystème Hadoop implique l’utilisation de différentes parties de l’ensemble de base Hadoop, telles que MapReduce, une structure permettant de traiter de grandes quantités de données, et le système de fichiers distribués Hadoop (HDFS), un système sophistiqué de gestion des fichiers. Il y a aussi YARN, un gestionnaire de ressources Hadoop.


Outre ces éléments de base de Hadoop, Apache a également fourni d’autres types d’accessoires ou d’outils complémentaires aux développeurs. Ceux-ci incluent Apache Hive, un outil d'analyse de données; Apache Spark, un moteur général de traitement de données volumineuses; Apache Pig, un langage de flux de données; HBase, un outil de base de données; et Ambarl, qui peut être considéré comme un gestionnaire d'écosystème Hadoop, car il permet de gérer l'utilisation de ces différentes ressources Apache ensemble. Alors que Hadoop devient le standard de facto pour la collecte de données et devient omniprésent dans de nombreuses organisations, les gestionnaires et les responsables du développement en apprennent tout sur l'écosystème Hadoop et sur le type de choses impliquées dans une configuration générale de Hadoop.