Le big data, vous connaissez ? Pour faire simple, c’est la masse des données qui transitent chaque jour sur le web : photos, vidéos, musiques, messages, likes, etc. C’est comme un gros cerveau qui se souviendrait de tout ce qui se passe sur internet. Le big data constitue une mine d’or, pour que les pays puissent en profiter, il existe des préalables. Lisez ce texte d’Azize Sérémé, consultant en big data et intelligence artificielle !

Le Concept du big data

Le terme “big data” est une expression dans le domaine de l’informatique qui, en fait, est un ensemble de concepts réunis en un. Des concepts comme la collecte, le stockage, le traitement et l’analyse des données sont tous des éléments clés du big data. Mais il faut savoir que l’expression n’a vraiment commencé à prendre d’ampleur que lorsque l’analyste technologique Doug Laney l’avait défini avec plus de détails et avait rendu le terme bien plus populaire. C’est dans son article du magazine Gartner Inc. en 2001, qu’il avait évoquées pour la première fois les caractéristiques du big data qui sont les 3Vs (Volume, Variété et Vélocité)

C’est quoi le big data ?

Le terme “big data” en anglais veut dire “grandes données”. Ce sont des données dont la taille ou le type rend les technologies de base de données traditionnelles inadéquates pour les stocker et les analyser.

Mais il faut savoir que ce même processus de collecte et d’analyse de données existe depuis longtemps, car les premières bases de données existent depuis les années 1970. C’est grâce aux avancées technologiques des années 2010/2011 que le domaine du big data a fait un grand bond.

Par exemple, on a vu la création de nouvelles bases de données où l’on pouvait y stocker toutes sortes de données. Cela n’était pas possible auparavant avec les bases de données traditionnelles, mais aujourd’hui on peut pratiquement tout stocker. Aussi, des nouvelles techniques de traitement des données comme – les traitement de données en parallèle – permettent non seulement de réduire considérablement le temps nécessaire pour les traiter, mais aussi le coût.

C’est quoi les 3Vs ? Les 3Vs du big data Volume-Vélocité-Variété

À l’époque le big data était caractérisé par les 3V : volume, vélocité et variété. Aujourd’hui, certaines définitions vont jusqu’à énumérer 5Vs ou 6Vs. Nous allons nous focaliser sur les 3Vs.

Le volume (c’est-à-dire la taille) : c’est la quantité énorme de données générées à tout moment dans le monde. Les sms, les images des caméras de surveillance, les commentaires sur les réseaux sociaux, les vidéos, les photos sont toutes des données qui ont besoin d’être stockées quelque part. Facebook, à elle seule, génère 4000 Térabytes (ou 4 Millions de Go) de données par jour.

La vélocité (c’est-à-dire la vitesse) : C’est la vitesse avec laquelle ces données sont produites. Par exemple, il est dit que sur Google, Il y a environ 3.5 milliards de recherches par jour. Sur WhatsApp, il y a plus de 65 milliards de messages échangés par jour. Et même si on prend un site comme lefaso.net, des articles, des vidéos, des photos et des commentaires sont créés tous les jours.

La variété (c’est-à-dire le type) : Ici on parle plus du type ou genre de données créées. Dans le monde du big data, il y a des données qui suivent un format précis et peuvent être stockées dans des bases de données traditionnelles. Mais il y en a aussi qui n’ont pas de format précis et donc ont besoin de base de données spécialisées et adéquates.

Par exemple, des informations telles que le nom et prénom, âge et salaire du personnel d’une entreprise suivent un format précis et de ce fait structuré. Par contre, les messages, photos, tweets et commentaires des réseaux sociaux ne suivent pas forcément un format précis de ce fait non structuré.

Le big data appliqué : Où et comment est-ce que le big data est utilisé ?

Le cas Facebook

Facebook (FB) est une plateforme populaire utilisée par plus de la moitié de la population mondiale. Chaque jour, FB collecte et stocke les “like”, les commentaires, les “post”, les photos et vidéos. Et grâce à ses ordinateurs et algorithmes ultra puissants, FB fait une analyse approfondie de ces données. La suite est que, grâce aux résultats de ces analyses, FB a une connaissance approfondie sur nous : nos besoins, nos envies, nos aspirations et nos habitudes. Alors, FB peut décider d’utiliser ces informations pour ses propres fins afin d’améliorer ses services. Mais le plus souvent, ces données sont vendues aux publicitaires qui s’en serviront pour effectuer des publicités beaucoup plus ciblées sur nous.

Le big data a son application dans plusieurs autres domaines. Prenons le cas de la santé par exemple. Il y a des recherches qui sont faites sur le cancer du sein, ou grâce aux analyses des images du scanner, on peut prédire si un cancer est grave ou moins grave. Dans la finance, les banques, grâce aux données, ont une meilleure connaissance de leur clientèle et donc peuvent proposer des solutions plus adaptées.

Le big data en Afrique

Avec la digitalisation rapide du continent et la croissance importante de l’utilisation du mobile, l’Afrique génère de plus en plus d’énormes quantités de données. Selon un article de Finbarr Toesland (sur le site African.business), le domaine a des retombées économiques importantes et on estime une croissance de 28% tous les ans jusqu’en 2025 avec 68 milliards de dollars générés. Malheureusement, cette croissance ne sera pas la même partout en Afrique. Des pays comme le Nigeria, le Kenya ou l’Afrique du Sud profiteront mieux de ces retombées économiques par rapport à d’autres pays Africains.

Quelques obstacles

L’un des principaux obstacles que beaucoup rencontrent dans ce domaine est le manque de formation. Des études en informatique, les statistiques et la probabilité sont nécessaires pour pouvoir réussir dans ce domaine. En Amérique du Nord par exemple, des filières comme la Science de Données (Data Science) et l’Apprentissage Automatique (Machine Learning) ont vu une croissance considérable depuis les dix dernières années. En Afrique, ce manque de formation est d’autant plus important que c’est l’un des facteurs premiers pour une vulgarisation du big data.

Quand on parle de données, il y a aussi le volet confidentialité. Souvent en tant que consommateur, nous n’avons pas une vue d’ensemble sur comment nos données sont collectées, traitées et utilisées. Souvent, même les entreprises collectent nos données personnelles sans notre consentement. De nos jours, plusieurs pays dans le monde ont instauré des lois sur la confidentialité des données. L’Union européenne a le RGPD, le Règlement général sur la Protection des Données. C’est une loi qui encadre le traitement des données personnelles sur le territoire de l’Union européenne.

Finalement, il y a le côté qualité des données. Même si aujourd’hui il est dit que les données constituent le “nouveau pétrole”, toutes les données n’ont pas la même qualité. Pour pouvoir profiter des fruits des applications du big data, il faut avoir des données de qualité. En plus de la qualité, il faut que les données soient vraies, c’est-à-dire des données dignes de confiance. La qualité des données et leur véracité sont d’ailleurs des nouvelles caractéristiques ajoutées aux récentes définitions du big data. Sans des données de qualité basées sur la vérité, on ne peut que créer des solutions erronées basées sur des fausses informations.

Pour terminer, l’avenir du big data est plein d’opportunités et nos pays doivent faire des investissements dans les infrastructures de base et la formation des talents locaux. En tant qu’Africain et particulièrement Burkinabè, on a un avantage considérable sur les firmes internationales du fait que nous comprenons mieux notre contexte et pouvons alors créer des solutions adaptées à nos réalités locales.

Azize Sérémé

Consultant en Big data et intelligence artificielle

Source

Finbarr Toesland

https://african.business/2020/12/technology-information/how-can-africa-monetise-big-data/

Source: LeFaso.net