Aujourd’hui, il existe une demande importante et croissante des professionnels de la donnée dans les entreprises, les établissements publics et les organismes sans but lucratif. L’offre des professionnels qui peuvent travailler efficacement avec des données à grande échelle est limitée, et se traduit par l’augmentation rapide des salaires pour les ingénieurs de données, les scientifiques de données, les statisticiens et les analystes de données.

Une étude récente de McKinsey Global Institute conclut, «une pénurie de talent en analytique et management nécessaires pour tirer le meilleur profit du Big Data est un défi important et urgent (pour les États-Unis). » Le rapport estime qu’en 2018, il y aura quatre à cinq millions d’emplois aux États-Unis exigeant des compétences en analyse des données, et qu’un grand nombre de postes ne seront remplis que par la formation ou par le recyclage professionnel. Les auteurs prévoient également un besoin de 1,5 million de gérants et analystes ayant des compétences analytiques et techniques profondes, en d’autres termes « qui peuvent poser les bonnes questions et consommer les résultats de l’analyse des grands volumes de données de manière efficace ».

Une Explosion de la Data

Les données sont de plus en plus pas chères et omniprésentes. Actuellement, nous sommes en train de numériser du contenu analogique qui a été créé au cours des derniers siècles et de collecter une myriade de nouveaux types de données depuis les journaux Web (logs), les appareils mobiles, capteurs, les instruments et les transactions. IBM estime que 90% des données dans le monde aujourd’hui ont été créées au cours des deux dernières années. Parallèlement, de nouvelles technologies émergent pour organiser et donner un sens à cette avalanche de données. Désormais, nous pouvons identifier des modèles et des régularités dans toutes sortes de données qui nous permettent d’améliorer la condition humaine, et de créer de la valeur commerciale et sociale. La montée du « big data » a le potentiel pour approfondir notre compréhension des phénomènes allant des systèmes physiques et biologiques au comportement humain social et économique.

Un challenge identifié

Pratiquement tous les secteurs de l’économie ont désormais accès à des données plus que ce qui aurait été imaginable il y a dix ans. Aujourd’hui, les entreprises accumulent de nouvelles données à un rythme qui dépasse leur capacité à extraire de la valeur de celle-ci. La question que se pose chaque organisation qui veut séduire une communauté est : comment utiliser les données efficacement? Pas seulement leurs propres données, mais toutes les données qui sont à la fois disponibles et pertinentes.

The New York Times écrit : 

« Ce nouveau champ brûlant promet de révolutionner les industries du monde des affaires au gouvernement, de la santé à la recherche scientifique. »

Notre capacité à tirer une valeur économique et sociale à partir des données fraîchement disponibles est limitée par le manque d’expertise. Travailler avec ces données nécessite de nouvelles compétences et des outils distinctifs. Les corpus sont souvent trop volumineux pour tenir sur un seul ordinateur, pour être manipulés avec des bases de données traditionnelles ou des outils statistiques, ou bien pour être représentés à l’aide de logiciels graphiques standards. Les données sont aussi plus hétérogènes comparativement à celles du passé qui étaient hautement organisées. Texte numérisé, audio, et contenu visuel, tout comme les données des capteurs et des blogs, sont généralement désordonnées, incomplètes, et non structurées; elles sont souvent de provenance et de qualité incertaine; et souvent doivent être combinées avec d’autres données utiles. Travailler avec des ensembles de données générées par l’utilisateur soulève également des questions difficiles de la vie privée, de la sécurité et de l’éthique.

Le domaine de la science des données est en train d’émerger à l’intersection des domaines des sciences sociales et des statistiques, de l’information et de l’informatique, et le design. La start-up ELCS Research avec son projet ELCS board est positionnée pour amener ces disciplines ensemble et fournir aux managers et décideurs les algorithmes et les outils nécessaires adaptés aux besoins locaux et internationaux pour réussir leurs missions complexes avec efficience. L’artisan de l’or binaire, le data scientist

Un scientifique de données est un titre d’emploi attribué à un employé ou à un consultant en business intelligence (BI) qui excelle dans l’analyse des données, en particulier les grandes masses de données, pour aider une entreprise à gagner un avantage concurrentiel. Le titre de scientifique de données est parfois décrié car il manque de spécificité et peut être perçu comme un synonyme large d’analyste de données. Mais peu importe, du moment que cette position gagne du terrain avec les grandes entreprises qui sont intéressées à tirer du sens du big data, de la quantité volumineuse de données structurées, non structurées et semi-structurées qu’une grande entreprise produit.

Un scientifique de données possède une combinaison d’analyse, du machine learning (l’apprentissage automatique*), du data mining (l’exploration des données**) et de compétences statistiques ainsi que l’expérience avec les algorithmes et la programmation (exemple : Language de programmation Python). Bien que la compétence la plus importante qu’un scientifique de données possède soit la capacité à expliquer la signification des données d’une manière intuitive et facile à comprendre.

Analyse des données : une valeur réelle

Aujourd’hui, l’analyse des masses de données n’est plus qu’un outil expérimental. De nombreuses entreprises ont commencé à réaliser des résultats concrets avec cette approche, et étendent leurs efforts pour rassembler davantage des données et des modèles. Voici comment elles arrivent à obtenir de la valeur :

  • - réduction des coûts,

  • - rapidité et meilleure prise de décision,

  • - nouveaux produits et services.

Cette étude montre clairement que l’analyse des données livre de la valeur. En Algérie, il y a encore quelques questions qui doivent être élaborées concernant la mise en place d’un écosystème qui favorise l’exploitation en masse de ces nouvelles technologies, le déploiement des datacenters, l’intégration des systèmes d’information au sein des établissements publics, télécom, santé, éducation, recherche scientifique et la révision des programmes universitaires qui doivent converger vers le cap high-tech. Il est clair que l’ère du big data sera l’une des opportunités d’affaires les plus spectaculaires, alors ne pas attendre trop longtemps pour exploiter son potentiel.