6 grands mythes sur la gestion du Big Data

Auteur: Eugene Taylor
Date De Création: 15 Août 2021
Date De Mise À Jour: 22 Juin 2024
Anonim
[Lyon] - Développer votre self BI dans un contexte Big Data avec Power BI
Vidéo: [Lyon] - Développer votre self BI dans un contexte Big Data avec Power BI

Contenu


Source: Dwnld777 / Dreamstime.com

À emporter:

Le Big Data est une grosse affaire, mais seulement s'il est utilisé correctement.

En mai 2014, Forrester Research a publié deux rapports tirant certaines conclusions sur le battage médiatique entourant le Big Data. La société de recherche a interrogé plus de 250 responsables du marketing et du développement commercial. Selon les auteurs des rapports, le discours sur les mégadonnées est à son plus haut niveau et les fournisseurs de technologies vantent les produits avec ce qui semble être des affirmations incroyables.

Gartner est d'accord avec Forrester Research; Un battage médiatique important entoure le Big Data. Dans le rapport de septembre 2014, Gartner démystifie cinq des plus grands mythes sur les données, et les analystes de Gartner donnent leur avis sur ce qui est mal compris par le big data et sa manipulation. Alors, quels sont les plus grands mythes de grandes données? Regardons.

Mythe: Tout le monde est en avance sur nous en adoptant le Big Data.

Gartner a déclaré que l'intérêt pour le Big Data était à son plus haut niveau. Malgré cela, 13% des sondés disposent de systèmes fonctionnels. La raison: la plupart des entreprises n’ont pas encore trouvé le moyen d’exploiter toute valeur à partir de grands référentiels de données. L’enquête de Gartner est plus optimiste que le rapport Forrester, qui a révélé que seulement 9% des participants à l’enquête déclaraient avoir l’intention de mettre en œuvre la technologie Big Data au cours de la prochaine année. (Le Big Data a beaucoup à offrir. Pour en savoir plus, consultez 5 problèmes du monde réel que le Big Data peut résoudre.)

Mythe: Nous avons tellement de données. nous n'avons pas à nous soucier de chaque faille dans les données.

Gartner s’inquiète de la souplesse que nous avons chez nous: "Nous avons tellement de choses, le peu de chose qui n’est pas grave importe peu." Ted Friedman, vice-président et éminent analyste chez Gartner, estime que ce n’est pas la bonne façon de regarder la situation.

"En réalité, bien que chaque défaut ait un impact beaucoup moins important sur l'ensemble des données que lorsqu'il y avait moins de données, il y a plus de défauts qu'auparavant, car il y a plus de données", a déclaré Friedman. "Par conséquent, l'impact global des données de mauvaise qualité sur l'ensemble des données reste le même."

Friedman ajoute un autre motif d'inquiétude. La capture de données volumineuses inclut souvent des données extérieures à l'entreprise, dont la structure et l'origine sont donc inconnues. Cela augmente le potentiel d'erreurs.

Mythe: La technologie Big Data éliminera le besoin d'intégration de données.

Il existe deux stratégies d'analyse de données clés qui peuvent être appliquées aux mégadonnées: "schéma en écriture" ou "schéma en lecture". Jusqu'à récemment, le schéma en écriture était la seule méthode utilisée. Schéma en lecture est l'engouement actuel dans la gestion de base de données. Contrairement au schéma en écriture, qui requiert un format structuré, les données sont chargées dans des bases de données schémas à la lecture dans leur format brut. Ensuite, les développeurs, utilisant des plates-formes de base de données non structurées telles que Hadoop, convertissent les données disparates en un format utilisable. Le schéma en lecture présente des avantages évidents, mais, comme le mentionne Gartner, l'intégration des données doit avoir lieu à un moment donné.

Mythe: L'utilisation d'un entrepôt de données pour des analyses avancées est inutile.

Consacrer le temps nécessaire à la création d'un entrepôt de données semble sans intérêt pour de nombreux gestionnaires d'informations, en particulier lorsque les données récemment capturées sont différentes de celles de l'entrepôt de données. Cependant, Gartner avertit encore une fois que même l'analyse de données avancée utilisera des entrepôts de données et de nouvelles données, ce qui signifie que les intégrateurs de données doivent:
  • Affiner les nouveaux types de données pour les rendre aptes à l'analyse
  • Décidez quelles données sont pertinentes et quel niveau de qualité de données est nécessaire
  • Déterminer comment agréger les données
  • Comprendre que le raffinement des données peut se produire ailleurs que dans l'entrepôt de données

Mythe: les lacs de données vont remplacer l'entrepôt de données.

Les Data Lakes sont des référentiels de données disparates, par opposition aux entrepôts de données où les données sont dans un format structuré. La création d'un lac de données nécessite peu d'efforts initiaux (pas besoin de formater les données) par rapport aux entrepôts de données, ce qui explique l'intérêt des lacs de données.

Gartner souligne que le fait d’avoir les données n’est pas l’essentiel, c’est le fait de pouvoir manipuler les données saisies pour prendre des décisions en connaissance de cause. De plus, utiliser des données lacustres (quelque peu non éprouvées) pour faciliter la prise de décision est problématique.

"Les entrepôts de données ont déjà la capacité de prendre en charge une grande variété d'utilisateurs au sein d'une organisation", a déclaré Nick Heudecker, directeur de la recherche chez Gartner. "Les responsables de la gestion de l'information n'ont pas besoin d'attendre que les lacs de données se rattrapent." (En savoir plus sur l'adoption du Big Data dans 7 choses à savoir sur le Big Data avant son adoption.)

Big Data Works - Les nouvelles méthodes de manipulation des données peuvent ne pas l'être

La raison pour laquelle Gartner a déclaré que "les plus grands mythes de données" au lieu de "mythes de données volumineuses" devient claire après avoir lu le rapport. Gartner n’est pas méfiant du Big Data. Gartner craint ceux qui pensent que les nouvelles méthodes de manipulation du Big Data sont prêtes pour le "prime time".