Publications

Qu’est-ce que le Big Data ?

Afin de bien comprendre ce qu’est le Big Data, il est utile d’en connaître le contexte historique. En voici la définition de Gartner, qui date de 2001 (mais qui reste la définition de référence) : le Big Data regroupe des données présentant une grande variété, arrivant en volumes croissants, à grande vitesse. C’est ce que l’on appelle les trois « V ».

En d’autres termes, le Big Data est composé de jeux de données complexes, provenant essentiellement de nouvelles sources. Ces jeux de données sont si volumineux que les logiciels de traitement des données classiques sont incapables de les traiter. Ces volumes massifs de données permettent néanmoins de résoudre des problèmes commerciaux qui auraient été impossibles à aborder auparavant.

Les trois « V » du Big Data

      1.Volume

La quantité de données a son importance. Le Big Data vous oblige à traiter d’énormes volumes de données non structurées de faible densité. Il peut s’agir de données de valeur inconnue, comme des flux de données Twitter, des flux de clics sur une page Internet ou une application mobile ou d’un appareil équipé d’un capteur. Pour certaines organisations, cela peut correspondre à des dizaines de téraoctets de données. Pour d’autres, il peut s’agir de centaines de pétaoctets.

       2. Vitesse

La vitesse à laquelle les données sont reçues et éventuellement traitées. Normalement, les données haute vitesse sont transmises directement à la mémoire, plutôt que d’être écrites sur le disque. Certains produits intelligents accessibles via Internet opèrent en temps réel ou quasi réel et nécessitent une évaluation et une action en temps réel.

      3. Variété

La variété fait allusion aux nombreux types de données disponibles. Les types de données traditionnels ont été structurés et trouvent naturellement leur place dans une base de données relationnelle. Avec l’augmentation du Big Data, les données ne sont pas nécessairement structurées. Les types de données non structurées et semi-structurées, telles que les données texte, audio et vidéo requièrent un prétraitement supplémentaire pour dégager du sens et prendre en charge les métadonnées.

La valeur et la vérité du Big Data

Deux autres « V » ont vu le jour ces dernières années : la valeur et la véracité.

Les données possèdent une valeur intrinsèque. Elles ne présentent cependant aucune utilité tant que leur valeur n’est pas découverte. Tout aussi important : Quelle est la véracité de vos données et leur fiabilité ?

À l’heure actuelle, le Big Data revêt une importance capitale. Prenons l’exemple des entreprises technologiques de premier plan au niveau mondial. Une grande partie de la valeur qu’elles offrent provient de leurs données, qu’elles analysent en permanence afin de produire plus efficacement et mettre au point de nouveaux produits.

Les avancées technologiques récentes ont réduit de manière exponentielle le coût de stockage et de calcul des données, ce qui facilite plus que jamais leur stockage. Un plus grand volume de Big Data étant maintenant plus économique et accessible, vous êtes en mesure de prendre des décisions commerciales plus précises.

Trouver de la valeur au Big Data ne se résume pas à l’analyser (ce qui constitue un autre avantage). C’est un processus de découverte à part entière qui implique des analystes, utilisateurs d’entreprise et dirigeants perspicaces, qui posent les bonnes questions, détectent des tendances, émettent des hypothèses informées et anticipent des comportements.