Clustering

Auteur: Eugene Taylor
Date De Création: 10 Août 2021
Date De Mise À Jour: 1 Juillet 2024
Anonim
StatQuest: K-means clustering
Vidéo: StatQuest: K-means clustering

Contenu

Définition - Que signifie clustering?

Le clustering, dans le contexte des bases de données, fait référence à la capacité de plusieurs serveurs ou instances à se connecter à une seule base de données. Une instance est la collection de mémoire et les processus qui interagissent avec une base de données, c'est-à-dire l'ensemble de fichiers physiques qui stockent réellement des données.


Le clustering offre deux avantages majeurs, en particulier dans les environnements de base de données volumineux:

  • Tolérance aux pannes: étant donné qu'il existe plusieurs serveurs ou instances auxquels les utilisateurs peuvent se connecter, la mise en cluster offre une alternative en cas de défaillance d'un serveur individuel.
  • Équilibrage de la charge: la fonctionnalité de mise en cluster est généralement configurée pour permettre aux utilisateurs d'être automatiquement affectés au serveur avec la charge la plus faible.

Introduction à Microsoft Azure et au nuage Microsoft | Tout au long de ce guide, vous apprendrez ce qu'est le cloud computing et comment Microsoft Azure peut vous aider à migrer et à exploiter votre entreprise à partir du cloud.

Techopedia explique le clustering

La mise en cluster prend différentes formes, en fonction de la manière dont les données sont stockées et des ressources allouées. Le premier type est connu sous le nom d'architecture partagée-rien. Dans ce mode de clustering, chaque nœud / serveur est totalement indépendant, il n'y a donc pas de point de conflit. Un exemple de cela serait quand une entreprise a plusieurs centres de données pour un seul site Web. Avec de nombreux serveurs à travers le monde, aucun serveur n'est un «maître». Le rien partagé est également appelé «partage de base de données».


Comparez cette architecture à une architecture à disques partagés, dans laquelle toutes les données sont stockées de manière centralisée, puis accessibles via des instances stockées sur différents serveurs ou nœuds.

La distinction entre les deux types s'est estompée récemment avec l'introduction du calcul en grille ou de la mise en cache distribuée. Dans cette configuration, les données sont toujours gérées de manière centralisée mais contrôlées par un puissant «serveur virtuel» composé de nombreux serveurs fonctionnant ensemble.

Cette définition a été écrite dans le con de bases de données