Système de fichiers Google (GFS)

Auteur: Robert Simon
Date De Création: 15 Juin 2021
Date De Mise À Jour: 1 Juillet 2024
Anonim
Système de fichiers Google (GFS) - La Technologie
Système de fichiers Google (GFS) - La Technologie

Contenu

Définition - Que signifie GFS (Google File System)?

Le système de fichiers Google (GFS) est un système de fichiers distribués (DFS) évolutif créé par Google Inc. et développé pour répondre aux besoins croissants de Google en matière de traitement des données. GFS fournit la tolérance aux pannes, la fiabilité, l'évolutivité, la disponibilité et les performances aux grands réseaux et aux nœuds connectés. GFS est composé de plusieurs systèmes de stockage construits à partir de composants matériels de base peu coûteux. Il est optimisé pour répondre aux différents besoins d’utilisation et de stockage des données de Google, tels que son moteur de recherche, qui génère d’énormes quantités de données à stocker.


Le système de fichiers Google a tiré parti de la puissance des serveurs standard tout en minimisant les faiblesses matérielles.

GFS est également appelé GoogleFS.

Introduction à Microsoft Azure et au nuage Microsoft | Tout au long de ce guide, vous apprendrez ce qu'est le cloud computing et comment Microsoft Azure peut vous aider à migrer et à exploiter votre entreprise à partir du cloud.

Techopedia explique le système de fichiers Google (GFS)

Le cluster de nœuds GFS est un maître unique avec plusieurs serveurs de blocs auxquels différents systèmes clients ont accès en permanence. Les serveurs de blocs stockent les données sous forme de fichiers Linux sur des disques locaux. Les données stockées sont divisées en gros morceaux (64 Mo), qui sont répliqués sur le réseau au moins trois fois. La taille importante du bloc réduit la surcharge du réseau.


GFS est conçu pour répondre aux besoins importants de Google en matière de grappes sans alourdir les applications. Les fichiers sont stockés dans des répertoires hiérarchiques identifiés par des noms de chemins. Les métadonnées - telles que l'espace de noms, les données de contrôle d'accès et les informations de mappage - sont contrôlées par le maître, qui interagit avec et surveille les mises à jour de statut de chaque serveur de bloc par le biais de battements de cœur temporisés.

Les fonctionnalités de GFS incluent:

  • Tolérance aux fautes
  • Réplication de données critiques
  • Récupération automatique et efficace des données
  • Débit global élevé
  • Interaction client / maître réduite en raison de la taille importante du serveur de blocs
  • Gestion des espaces de noms et verrouillage
  • La haute disponibilité

Les plus grands clusters GFS ont plus de 1 000 nœuds et une capacité de stockage sur disque de 300 To. Des centaines de clients peuvent y accéder de manière continue.