Analyse de Big Data Open Source

Auteur: Laura McKinney
Date De Création: 1 Avril 2021
Date De Mise À Jour: 14 Peut 2024
Anonim
Big Data In 5 Minutes | What Is Big Data?| Introduction To Big Data |Big Data Explained |Simplilearn
Vidéo: Big Data In 5 Minutes | What Is Big Data?| Introduction To Big Data |Big Data Explained |Simplilearn

Contenu

Définition - Que signifie l'analyse de Big Data Open Source?

L'analyse de Big Data Open Source fait référence à l'utilisation de logiciels et d'outils Open Source permettant d'analyser d'énormes quantités de données afin de collecter des informations pertinentes et exploitables qu'une organisation peut utiliser pour atteindre ses objectifs commerciaux. Apaches Hadoop est le logiciel le plus utilisé pour le traitement d’énormes ensembles de données sur une grappe d’ordinateurs en utilisant un processus distribué pour le parallélisme.


Introduction à Microsoft Azure et au nuage Microsoft | Tout au long de ce guide, vous apprendrez ce qu'est le cloud computing et comment Microsoft Azure peut vous aider à migrer et à exploiter votre entreprise à partir du cloud.

Techopedia explique le Big Data Analytics Open-Source

L'analyse de Big Data Open Source utilise un logiciel et des outils Open Source afin d'exécuter l'analyse Big Data en utilisant une plate-forme logicielle complète ou divers outils Open Source pour différentes tâches du processus d'analyse de données. Apache Hadoop est le système le plus connu pour l'analyse de données volumineuses, mais d'autres composants sont nécessaires avant qu'un système d'analyse réel puisse être mis en place.

Hadoop est l'implémentation à source ouverte de l'algorithme MapReduce, mis au point par Google et Yahoo, et constitue donc la base de la plupart des systèmes d'analyse actuels. De nombreux outils d'analyse de données volumineuses utilisent le code source ouvert, y compris des systèmes de base de données robustes tels que MongoDB, une base de données NoSQL sophistiquée et évolutive, très bien adaptée aux applications de données volumineuses, entre autres.


Les services d'analyse de Big Data Open Source englobent:

  • Système de collecte de données
  • Centre de contrôle pour l'administration et la surveillance des clusters
  • Bibliothèque d'apprentissage automatique et d'exploration de données
  • Service de coordination d'applications
  • Moteur de calcul
  • Cadre d'exécution