Syntalsoft
  • Accueil
  • Nos Solutions
  • Blog
  • Clients
  • Contact
11 octobre 2022

Le Big Data

Le Big Data
11 octobre 2022

Le Big Data (BD) considéré pour certain comme le pétrole « brute », pour d’autre juste un tas des données qui occupe paresseusement les systèmes de stockage. La tendance ces derniers temps donne raison aux premiers. L’utilité des BD dans la facilitation des prises de décision dans presque tous les domaines d’activité n’est plus à démontrer. Pour les entreprises, les Etats, les universitaires, etc. Les BD sont des denrées précieuses. A l’instar du pétrole brut, le BD ne sert pas à grand-chose sans être « raffinée ». Pour ce faire, il a besoin d’un certain nombre de discipline comme les dataminings, data-science ou le Machine Learning (Apprentissage automatique) pour faire valoir son utilité.

C’est quoi le Big Data ?

Le Big Data littéralement « Données Massives» en français, est un ensemble des données colossales et hétérogènes qui sont acquises en flux continue. Les propriétés intrinsèques et reconnues pour les BD sont le Volume (au moins 100To – Téraoctet ou plus pour certain), la Vélocité (La vitesse élevé de leur génération/acquisition) et la Variété (Données structurées et non-structurées). Ces propriétés sont connues sous le nom de 3V même si ces derniers temps trois autres « V » ont rejoint le club à savoir la Valeur, la Véracité et la Visibilité.

Les sources des données qui constitue les BD sont diverses et variées. Elles peuvent provenir des :

  • Saisies des utilisateurs/applications stockées dans les bases des données traditionnelles alors on parle des données structurées ;
  • Les données semi-structurées sont par exemple les codes des sites web (HTML) obtenu généralement par le procédé de web-mining, les données utilisées sous forme de XML ou JSON ;
  • Les données non-structurées qui peuvent provenir des médias sociaux (textes et multimédia), des assistants digitaux (i.e Cortana, Alexa, Siri, Google Assistant, … ), des données spatiales (GPS, Sonde, Hubble, …), les e-mails, des fichiers logs, les open-data et j’en passe ;
  • Les flux des données (généralement en RT ou NRT – Near Real Time : Presqu’en Temps Réel) qui proviennent des capteurs des objets connectés, objets intelligents et autres #IoT.

Les principales tâches opérées sur les BD sont l’acquisition, le stockage, la gestion et l’analyse des données afin d’extraire les informations pertinentes. Les données (volumineuses) structurées sont stockées dans les Data Warehouse (entrepôts de données) et analysées via les outils de Business Intelligence (#BI). Avec la variété des données, celles-ci sont plutôt stockées dans les Data Lake (Lac des données) qui sont des données brutes pour un traitement ultérieur.

Les BD sont des données large et complexe sur lesquelles on ne peut pas utiliser les méthodes classiques de traitement. A titre d’exemple Facebook (et non Meta) a lui seul gênerait environ 4 Po (Pétaoctet soit 4 millions de Gigaoctet) de données par jour en 2020 – source Statistique Facebook ! IDC (International Data Corporate) a prédit que le volume global des données générées sur Internet atteindra les 175 Zo (Zettaoctets – soit 175 milliards de Téraoctet !) en 2025 dont presque la moitié proviendrait des #IoT (Internet of Thing).

Pour venir à bout de ces mastodontes, il faut utiliser les puissances de traitement sophistiqués en mettant les ressources (traitement et stockage) en cluster voire en grille (Grid Computing) sur lesquelles on peut utiliser les #Frameworks comme #Hadoop, les modèles comme #MapReduce et évidemment de système de fichier adéquat.

Adoption par les entreprises

Du marketing aux Finance, en passant par les HR et chaîne d ‘approvisionnement, au sein d’une entreprise peu importe sa taille, les données doivent guider la prise de décision pas seulement des C-level (Cadres supérieurs) mais aussi les managers et les petits chefs parce que de nos jours « Data Are King » (Les données sont roi).

Nous sommes dans une ère du Data-driven ou les décisions au sein des entreprises se prennent en se basant sur les données factuelles et non sur les suppositions, les émotions ou les intuitions (Bon, de temps à autre). Les entreprises devraient déjà mettre en place les stratégies pour la collecte, le stockage, l’analyse et la présentation des données que cela soit on-premises ou sur le cloud.

Il ne faut pas qu’elles se laissent intimidées par le « Big » du BD. N’importe quelle structure indépendamment de sa taille peut collecter les données et les analyser afin de déterminer les tendances, prédire les volumes de ventes, connaître d’avantage le comportement de sa clientèle afin d’anticiper ses besoins ou pivoter bref avoir un avantage compétitif.

Les #PME/I qui ont des ressources limitées peuvent se contenter des #BI, les #TPE qui ont peu ou prou des données peuvent utiliser les fonctionnalités des tableurs tel que les #TCD (Tableau croisé dynamique). Que vous rampiez, que vous marchiez ou que vous couriez, il est impératif d’être une entreprise Data-driven c’est à dire prendre des décisions orientées données parce que la pérennité de l’entreprise en dépend!

Quid de l’Afrique?

La plupart de nos matières premières ont été exportées brutes pour être transformées ailleurs. C’est ce qui est en train de se passer avec les données vu que l’Afrique ne détient que 1,3% (Xalam analytic) en terme de capacité de stockage des données dont une grande partie sont détenue par les MNO (Mobile Network Operator – Operateurs de téléphonie mobile).

Bien qu’il y ait les #BaaS , les #WHaas ou les #DLaas (respectivement Bigdata, Warehouse et Data Lake as a Service) en terme de service des données sur le cloud, l’Afrique devrait faire valoir sa souveraineté en hébergeant sur le continent ses données. Outre cela, comme nous l’avons vu supra, on parle de Pétaoctet des données et non suivre un film en streaming sur Netflix. Cela veut dire qu’il peut aussi y avoir un problème de performance.

En plus de gagner en performance, on peut faire des économies sur le coût de la communication si nos données sont hébergées « localement ». L’une des solutions c’est de mettre en place des Data-centers adéquats en usant des #PPP (Partenariat Public-privé) dans ce sens que les privés investissent largement dans les infrastructures afin d’héberger et traiter les données, ensuite le public devient le plus grand client de ses services.

L’Afrique doit évidemment s’inspirer des autres en matière de BD mais Elle doit avoir son propre modèle de développement en prenant en compte l’aspiration de son peuple et ses réalités. Il n’est pas pour nous de « rattraper » nos retards par rapport à qui que ça soit mais plutôt apporter notre contribution pour l’édification de l’humanité.

En ce qui concerne le BD, il n’est à présent pas indispensable de perdre des ressources et le temps à mettre en place les politique des protections des données à l’instar de RGPD (Règlement Général sur la Protection des données). L’Afrique et l’Europe n’ont pas les mêmes problèmes. Évitons d’utiliser les méthodes rigides comme le Waterfall ou on met beaucoup d’accent sur la documentation. On doit plutôt adopter la philosophie #Agile : Se concentrer sur le résultat concret et après s’occuper de la documentation.

Les BD ont générées en 2021 un revenu de USD215 milliards (Statista) soit env. 144 000 milliards de XAF! (Deux fois le #PIB de la zone #CEMAC). Ceci est le revenu de toutes la chaine à savoir le matériel, le logiciel et les ressources humaines. L’Afrique peut aussi avoir sa part dans cette chaine par exemple en investissant dans le matériel et les ressources humaines. Actuellement il y a une pénurie des data scientistes dans le monde, il est urgent d’investir dans les disciplines tels que les #STEM (Science, Technology, Engineering and Maths) afin de former une armée de capital humain autour des Data. Aussi, du cote du matériel, l’Afrique pourra-t-elle bénéficier des implantations des unités des fabrications des supports de stockage (HDD/SSD) ou ne serait-ce que de leur composant.

Il y a tout de même des initiatives louables et encourageantes qui s’opèrent déjà sur le terrain dans le domaine de BD:

  • AIMS/NEF (African Institute for Mathematical Science/Next Einstein Forum) www.nexteinstein.org qui est un réseau panafricain de centre d’excellence en STEM qui a une représentation en #Afrique du Sud, #Rwanda, #Cameroun, #Sénégal et au #Ghana
  • DARA Big Data www.arabigdata.com a pour vocation de former les étudiants en #Data analyste pour les données spatiales notamment celles provenant ou qui proviendront des télescopes du Projet #SKA en Afrique du sud. Cela concernera aussi les pays suivants : #Botswana, #Ghana, #Kenya, #Madagascar, #Ile Maurice, #Mozambique, #Namibie et la #Zambie
  • Zindi www.zindi.africa qui est la plus large communauté (plus de 40.000 personnes) des data-scientistes africain qui offre la possibilité a ces derniers de se former et d’apprendre dans le domaine des manipulations et analyse des données
  • Africa Data Science Intensive www.dsi-program.com est un programme de formation intensive qui a opté pour une approche empirique de résolution de problème en utilisant les techniques de pointe du domaine de data science et de l’#IA.
  • Des initiatives sur les données telles que les #D4D (Data for Decision/Development) endossées par les #SDG (Sustainable Development Goals)
  • Beaucoup des Instituts et universités Africains ont inclus les formations ou filières relatives aux BD dans leur programme

Finissons avec cette note idéaliste que nous souhaitons ardemment voir se réaliser. Etant donné que la fédération politique tarde à se mettre en place, nous pouvons essayer avec la fédération technologique. On peut tirer parti de la position géographique de chaque pays, des matières premières qu’il regorge, de #capital #humain, des infrastructures de base, … pour déployer les infrastructures des BD. Par exemple on peut :

  • Choisir #Lesotho pour installer les datacenters à cause de son climat afin de faire des économies sur l’utilisation de l’énergie utilisée pour refroidir les équipements ;
  • Implémenter les usines de fabrication des supports de stockage et autres éléments nécessaires pour les datacenters en #RDC ;
  • Ouvrir des centres de compétence à #Nairobi, #Kigali et #Dakar pour former les capitaux humains ;
  • Utiliser les capitaux financiers des #VC (Venture Capitalist) et #PE (Private Equity) du #Nigeria et Afrique du sud et autres institution financière du #Maroc pour le financement ;
  • Créer un centre de gouvernance et autres aspects administratifs à #Caire pour le #Copil (comité de pilotage).

#bigdata #data #donnees #digitaltransformation #transformationnumerique #transformationdigitale #smb #africa #afrique #digital #numerique

Veuillez partager dans vos RS préférés
error
fb-share-icon
Tweet
fb-share-icon

Le Bloggy

Cet espace permet de partager avec vous nos avis, expériences et orientations sur divers sujets, techniques, organisationnels, managériaux, etc.

Articles récents

Le Big Data11 octobre 2022

Catégories

  • Information
  • Technologie
  • Transformation Digitale

le digital au service de l’Afrique

Logo syntalsoft

Notre mission

Syntalsoft s’est donné comme mission de faciliter et d’accélérer la transformation digitale des G.E., PME, PMI et TPE en Afrique

Notre vision

Syntalsoft entend être le leader dans l’industrie des logiciels adaptés aux contextes locaux.

Nos valeurs

Le client est au centre de toutes nos activités et il est notre raison d’être.
Nous privilégions l’humain avant toutes autres préoccupations

Nyzaam - Randjé - Sfynx