Apache Kafka

Auteur: Louise Ward
Date De Création: 5 Février 2021
Date De Mise À Jour: 28 Juin 2024
Anonim
Введение в Apache Kafka, первая тема открытого базового курса
Vidéo: Введение в Apache Kafka, первая тема открытого базового курса

Contenu

Définition - Que signifie Apache Kafka?

Apache Kafka est un système de publication / abonnement à source ouverte conçu pour fournir un traitement rapide, évolutif et tolérant aux pannes des flux de données en temps réel. Contrairement aux logiciels de messagerie d'entreprise classiques, Kafka est en mesure de gérer toutes les données qui transitent dans une entreprise et de le faire en temps quasi réel.


Kafka est écrit en scala et a été développé à l'origine par LinkedIn. Depuis lors, de nombreuses entreprises l’ont utilisé pour créer des plates-formes temps réel.

Introduction à Microsoft Azure et au nuage Microsoft | Tout au long de ce guide, vous apprendrez ce qu'est le cloud computing et comment Microsoft Azure peut vous aider à migrer et à exploiter votre entreprise à partir du cloud.

Techopedia explique Apache Kafka

Kafka présente de nombreuses similitudes avec les journaux de transactions et conserve des flux de s dans les rubriques. Les producteurs écrivent des données dans des sujets et les consommateurs lisent à partir de ces sujets, qui sont partitionnés et répliqués sur plusieurs nœuds dans un format de système distribué. Kafka est unique en ce sens qu'il traite chaque partition de sujet comme un journal et qu'un décalage unique est attribué à chaque partition. Il conserve tous les s pendant un certain temps, et les consommateurs sont responsables du suivi de leur emplacement dans chaque journal. Cela diffère des systèmes précédents, où les courtiers étaient responsables de ce suivi, ce qui limitait considérablement la capacité des systèmes à évoluer à mesure que le nombre de consommateurs augmentait. Cette structure permet à Kafka de prendre en charge de nombreux consommateurs et de conserver de grandes quantités de données avec un temps système très faible.


Kafka peut être utilisé:

  • En tant que courtier traditionnel
  • Pour le suivi de l'activité du site
  • Pour l'agrégation de journaux
  • Pour le traitement de gros flux de données

Kafka peut être utilisé avec Apache Storm, Apache HBase et Apache Spark pour l'analyse et le rendu en temps réel des données en streaming.