Le Big Data! Qu’est-ce que c’est?

Le Big Data! Qu’est-ce que c’est?

Le Big Data a le vent dans les voiles, et c’est une nouvelle frontière qui se dessine dans le monde des technologies d’affaires. La technologie annonce une redéfinition de notre rapport aux données et aux informations, et son avènement ouvre des possibilités nouvelles. Son impact promet d’être grand sur les entreprises comme sur les clients. Comme l’intérêt pour le Big Data est sans cesse grandissant, cet article essaye de démystifier le phénomène et d’en présenter les fondements et le potentiel.

Alors, le Big Data, qu’est-ce que cela peut bien signifier? Le Big Data est un ensemble de dispositifs technologiques qui permet aux entreprises de recueillir, de stocker et d’analyser des quantités de données volumineuses permettant ainsi de générer de précieux renseignements ou de faire des nouvelles découvertes. Les sources de données dites Big Data possèdent les caractéristiques suivantes, à savoir, le volume, la variété, la vélocité, et la véracité (appelées les 4V)  [Gartner, IBM] :

        • Le volume des données dites Big Data est grand. L’on assiste en effet à une explosion des données au point qu’il devient difficile de les traiter avec les systèmes de gestion de données conventionnels. En 2012, par exemple, 2.5 Exabytes de données sont créés chaque jour – c’est l’équivalent de 2.5 Milliards de Gigabytes -. Ce chiffre double environ tous les 40 mois [IBM]. Alors que les organisations deviennent submergées de volumes de données croissants, il devient essentiel de penser aux moyens pour les gérer et les interpréter.
        • En termes de variété, les données Big Data proviennent de sources différentes. – certaines sont internes à l’entreprise (par exemple, l’historique d’achat des clients provenant des systèmes de traitement des transactions ou encore les données transmises par les senseurs intégrés aux machines de fabrication)  d’autres sont externes à l’entreprise (par exemple les tweets, les données de géolocalisation sur Foursquare, les données publiques etc.) Ces données sont aussi de formats différents. Alors que certaines données sont structurées et peuvent être gérées par les traditionnels systèmes de gestion des données relationnelles (par exemple, les fiches clients), d’autres sont essentiellement non structurées (par exemple, les graphiques, les images satellites, les cartes géographiques, les fichiers audio, les streaming vidéo, etc.)
        • La  vélocité  renvoie à la vitesse à  laquelle les données sont à même d’être créées, capturées et analysées. Certaines données, en effet, ne présentent une opportunité réelle  que lorsqu’elles sont analysées aussitôt qu’elles sont générées. L’on peut penser par exemple à des pratiques frauduleuses pouvant être détectées aussi tôt produites ou encore aux flux d’images transmises par les caméras de contrôle routier permettant d’identifier des patterns de circulation en temps réel.
        • La véracité  renvoie au degré de fiabilité et de confiance que l’on peut accorder aux données utilisées au moment d’une prise de décision. Bien que la véracité des données ait toujours été un facteur important en gestion des données, elle prend toutefois une importance plus grande dans le contexte du Big Data. Il devient essentiel, par exemple, de s’assurer que les données provenant notamment de l’extérieur de l’organisation – comme celles provenant des réseaux sociaux – sont véritables et ne sont pas faussement mises hors contexte.
Les 4 du Big Data, Volume, Variété, Vélocité, Véracité

Les 4 du Big Data, Volume, Variété, Vélocité, Véracité

On peut se demander, et à raison, pourquoi parle-t-on du Big Data alors que nous avons toujours eu des données! Ceci est vrai, nous avions toujours des données, sauf que la différence, aujourd’hui, nous en avons beaucoup, même à l’excès. Par exemple, avant, lorsqu’un client achetait un livre auprès d’une librairie, les données traitées étaient principalement relatives au livre (exemple, sa référence, son prix) et à la transaction d’achat (exemple, le montant total, la date d’achat). Aujourd’hui, il est possible d’acheter ce même livre au format électronique auprès d’un magasin en ligne. Il existe, maintenant, de vastes données qui gravitent autour de cette transaction d’achat, en apparence très simple; en voici quelques exemples :

      • Les données associées au profil du client auprès du site marchand.
      • L’historique d’achat du client.
      • Tous les détails du parcours de navigation amenant à l’achat sur le site web.
      • Les commentaires et les évaluations émis au sujet du livre sur le site du détaillant, sur Facebook, Google+, Twitter, les blogues, les forums, etc.
      • Les données du sondage de satisfaction.
      • Les caractéristiques de l’appareil mobile (tablette ou téléphone intelligent) sur lequel le livre est visionné.
      • Les statistiques d’usage du livre (fréquence et vitesse de la lecture, les parties du livre les plus engageantes, les moins lues, etc.)
      • Les données de géolocalisation où le livre est téléchargé, ouvert, etc.

Avant, plusieurs entreprises n’étaient pas en mesure de capturer, stocker ou analyser toutes les données auxquelles elles seraient intéressées. Probablement à cause que les technologies qui permettaient de le faire à un coût et dans des délais raisonnables n’étaient pas disponibles. Mais, maintenant que les outils technologiques qui ont fait le succès des firmes comme Google, Yahoo, et Amazon deviennent maintenant accessibles, ces entreprises ne verront plus les données du même œil.  Parmi ces outils on peut citer, par exemple,  Hadoop qui permet de traiter des données volumineuses distribuées sur des dizaines, voire des milliers d’ordinateurs; ou encore la nouvelle génération des bases de données comme celles dites NoSQL, permettant de gérer des données non relationnelles.

Généralement, le Big Data est rendu possible, aujourd’hui, à grâce aux progrès réalisés en trois domaines. D’abord, l’augmentation de la capacité de stockage qui n’est maintenant freinée par aucune limite. Ensuite, l’augmentation de la capacité de traitement, grâce notamment l’infonuagique et la virtualisation qui permettent de faire des traitements avancés qui étaient, il y à peine quelques années, impossibles à réaliser. Enfin, la maturité d’internet qui permet, d’ores et déjà de connecter, outre les traditionnels ordinateurs, des objets divers tels que les appareils GPS, les téléphones intelligents, les tablettes, les machines de fabrication, les appareils de surveillance, et même les appareils électroménagers.

tendances_Big_Data

Tendances favorisant le Big Data

Bien que le Big Data soit une réalité fluctuante d’un secteur d’activité à un autre, la technologie peut créer des opportunités réelles pour les entreprises, comme en témoignent les cas suivants.

 

        • Orbitz a été en mesure d’analyser des  milliers de Gigabytes de données générées à même les recherches effectuées sur son site web. Cette analyse a permis d’identifier, par exemple, les hôtels les plus performants qui sont par la suite proposés aux utilisateurs en vue d’augmenter le taux de conversion.
        • L’université d’Ontario: les professionnels de la santé à l’Université d’Ontario: ont pu prédire des infections néonatales 24 heures avant qu’elles se produisent. 120 enfants étaient sous surveillance par des senseurs générant ainsi 120 000 messages par seconde (soit plus d’un milliard de messages par jour).
        • Constant Contact : Ce centre de contact client est en mesure d’analyser les  35 milliards de courriels reçus annuellement pour offrir un meilleur service à la clientèle en identifiant par exemple la meilleure période pour lancer une campagne marketing par courriel.
        • FoodGenius : Une start-up qui bouleverse l’industrie de la restauration avec une solution Big Data capable d’analyser des données massives au sujet des menus servis dans 330 000 restaurants aux États-Unis. En utilisant les services d’infonuagique d’Amazon, FoodGenius permet d’identifier les tendances de consommation et  suggérer le menu qui serait le plus profitable dans une région particulière.
        • Netflix : Le distributeur  de contenu visuel a décidé d’investir 100 millions de dollars dans un remake d’une série de BBC des années 90 (House of cards). La décision s’est appuyée sur une découverte basée sur l’analyse des préférences des millions de clients. L’analyse a révélé en effet que les abonnés qui ont préféré ladite série avaient tendance à « s’arracher » les films réalisés par David Fincher et mettant en vedette l’acteur Kevin Spacey. D’où l’idée de faire une reproduction de la série avec les signatures de David Fincher et Kevin Spacey: Un hit.
        • Next-Big-Sound est une compagnie spécialisée dans l’analyse du marché de la musique. Elle suit les parcours des centaines de milliers  d’artistes à travers le monde sur toutes les plateformes en ligne. En analysant des milliards de données et de mentions provenant de YouTube, Facebook, LastFm, Wikipédia, Twitter,  etc., la compagnie est en mesure de fournir des précieuses informations sur les  tendances du marché de la musique pouvant servir aux artistes, aux managers, et aux compagnies de disque.

Conclusion

Le Big data est un domaine en pleine effervescence. Cette avancée technologique pourrait influer, à bien des égards, les stratégies des entreprises et les actions qu’elles posent. Au fur et à mesure que les coûts associés au traitement des données décroissent et que l’expertise pour mettre en place une solution Big Data se développe, des nouvelles opportunités verront le jour. De nouveaux métiers se développent déjà dans ce domaine, comme, par exemple, les Data Scientists, les architectes Hadoop et les spécialistes de visualisation des données. Tout un écosystème est en train de se mettre en place dans ce domaine et les projections de croissance pour les années à venir s’envolent.  Et vous, quelles opportunités voyez-vous dans le Big Data, particulièrement dans votre domaine? Cette technologie amènerait elle, selon vous,  des menaces quelconques pour les individus ou les entreprises?


http://hbr.org/2012/10/big-data-the-management-revolution

About The Author

No Comments

Leave a Reply

Me contacter

Utiliser le formulaire dessous pour me contacter, je vous reviendrai dans les meilleurs délais.

Adresse:

UQAR, Campus de Lévis
1595, boulevard Alphonse-Desjardins
Lévis (Québec) Canada
G6V 0A6

Bureau 2076

Tél:

(1) 418 833-8800 #3387