Apache Nutch

Auteur: Eugene Taylor
Date De Création: 8 Août 2021
Date De Mise À Jour: 20 Juin 2024
Anonim
Apache Nutch 2.0 Tutorial (with Elasticsearch)
Vidéo: Apache Nutch 2.0 Tutorial (with Elasticsearch)

Contenu

Définition - Que signifie Apache Nutch?

Apache Nutch est un logiciel de robot Web qui peut être utilisé pour agréger des données à partir du Web. Il est utilisé avec d'autres outils Apache, tels que Hadoop, pour l'analyse des données.


Introduction à Microsoft Azure et au nuage Microsoft | Tout au long de ce guide, vous apprendrez ce qu'est le cloud computing et comment Microsoft Azure peut vous aider à migrer et à exploiter votre entreprise à partir du cloud.

Techopedia explique Apache Nutch

Apache Nutch est un produit à code source ouvert sous licence Apache Software Foundation. Cette communauté de développeurs détient des licences pour une gamme d'outils logiciels Apache permettant de trier et d'analyser des données. L'une des technologies centrales est Apache Hadoop, un outil d'analyse des données volumineuses qui est très populaire dans le monde des affaires.

Outre des outils comme Apache Hadoop et des fonctionnalités pour le stockage de fichiers, l'analyse, etc., le rôle de Nutch est de collecter et de stocker des données à partir du Web à l'aide d'algorithmes d'analyse Web.


Les utilisateurs peuvent tirer parti de commandes simples dans Apache Nutch pour collecter des informations sous des URL. Les utilisateurs utilisent généralement Apache Nutch avec un autre outil libre, un framework appelé Apache Solr, qui peut servir de référentiel pour les données collectées avec Apache Nutch.