Les romans et émissions de télévision de science-fiction prédisaient l’invention de voitures à conduite autonome, de robots majordomes et de chaussures à laçage automatique, mais sans la science des données, ces produits resteraient de la fiction.
Mais la science des données est capable de bien plus que cela. En fait, elle touche tous les aspects de la vie moderne.
Un bref aperçu de la science des données
La science des données a débuté dans les années 1960 en tant que branche de l’informatique, mais le terme « data scientist » n’a été inventé qu’à la fin des années 2000.
Depuis les années 1990, les scientifiques des données collectent des données sur les utilisateurs, mais ce n’est qu’au début des années 2010 qu’elles ont été utilisées pour faire des ventes et des nouvelles technologies. Les applications qui collectent et analysent les données s’appuient sur des statistiques et des modèles statistiques pour créer des résultats.
Cette technologie a évolué pour inclure des concepts et des pratiques modernes, tels que l’Internet des objets, l’apprentissage automatique et l’intelligence artificielle, afin de suivre les comportements en ligne. Désormais, les données sont utilisées dans toutes les industries, généralement dans un but lucratif. Les entreprises utilisent la science des données pour prendre de meilleures décisions, mais elle apparaît également en médecine, en ingénierie et en sciences sociales.
Un scientifique des données, contrairement à un statisticien, comprend l’architecture des logiciels et les langages de programmation. Si vous souhaitez explorer le parcours de carrière de la science des données, sachez que ces professionnels ont besoin d’au moins un baccalauréat, d’une expérience de Python et de R, et d’un état d’esprit de croissance/d’apprentissage.
La chronologie de la science des données : Comment elle a changé le monde
Bien que la science des données ait eu un cycle de vie court, son impact sur notre monde moderne est évident. Les données sont si largement utilisées qu’il est difficile d’imaginer la vie avant elles, même si vous avez grandi avant son essor.
Les débuts de la science des données : 1962-1999
La chronologie de la science des données commence en 1962, lorsque John Tukey écrit un article qui traite de la fusion entre les statistiques et les ordinateurs. Mais peu de découvertes ont été faites avant 1999 :
- 1974 : P. Naur écrit « Concise Survey of Computer Methods », mentionnant la science des données.
- 1977 : Création de l’International Association for Statistical Computing, qui cherche à lier les méthodes statistiques aux ordinateurs. Tukey a écrit un deuxième article sur les données.
- 1989 : Le groupe Knowledge Discovery in Databases crée son premier atelier.
- 1994 : Business Week publie un article sur les entreprises qui recueillent des données personnelles.
- 1999 : Jacob Zahavi déclare que les entreprises ont besoin d’un outil pour traiter de grandes quantités de données.
La science des données dans le nouveau millénaire : 2000-2015
Au tournant du millénaire, les ordinateurs commencent à faire leur apparition dans les foyers et les bureaux. La science des données commence à devenir la norme et à être plus accessible au public via des logiciels :
- 2001 : Création de Software-as-a-service (SaaS), précurseur de la technologie basée sur le cloud. William S. Cleveland propose un manuel de formation pour les nouveaux scientifiques des données.
- 2002 : Le Conseil international pour la science publie une revue sur la science des données.
- 2006 : Hadoop est créé pour aider les entreprises à stocker et à traiter d’énormes quantités de données.
- 2009 : NoSQL a été réintroduit par Johan Oskarsson (et est toujours utilisé aujourd’hui).
- 2011 : Les offres d’emploi pour les scientifiques des données ont augmenté de 15K%, les données étant considérées comme rentables.
- 2015 : La reconnaissance vocale de Google, Google Voice, et les techniques d’apprentissage profond sont plus populaires que jamais. Jack Clark a déclaré que l’intelligence artificielle est désormais largement utilisée.
La science des données du futur : 2015-2035
Les scientifiques des données et la science des données dans son ensemble sont devenus essentiels dans les entreprises et la recherche universitaire. Cette technologie peut tout faire, de la prédiction des résultats de santé aux récessions, avec plus ou moins de précision.
Les algorithmes plus simples ont tendance à être plus efficaces que les algorithmes complexes. Cela dit, la révolution de la science des données a conduit à une programmation plus conservatrice. Les scientifiques des données sont moins susceptibles de prendre des risques, ce qui signifie que les grandes idées viendront progressivement, et non d’un seul coup.
Malgré tout, la science des données continue de changer le monde grâce à l’amélioration de la correspondance des rendez-vous sur les applications de rencontres, la technologie intelligente et la 5G.
Sans la science des données, les scientifiques n’auraient pas pu fabriquer le vaccin COVID aussi rapidement qu’ils l’ont fait ou prédire les futures épidémies contre lesquelles les gouvernements peuvent lutter.