Qu’est-ce que le Human-in-the-loop (HITL) ?

L’un des termes que vous pouvez rencontrer lorsque vous traitez de l’intelligence artificielle (IA) et de l’apprentissage machine (ML) est « human-in-the-loop » (HITL). C’est exactement ce que cela signifie. L’HITL est une branche de l’IA qui s’appuie à la fois sur l’intelligence humaine et l’intelligence de la machine dans la création de modèles d’apprentissage automatique.

L’approche « human-in-the-loop » signifie que des personnes sont impliquées dans le cycle de formation, de réglage et de test de l’algorithme.

Les humains étiquettent d’abord les données, ce qui aide le modèle à obtenir des données de formation de haute qualité et en grande quantité. Un algorithme d’apprentissage automatique apprend ensuite à prendre des décisions sur la base des données avant que les humains ne commencent à affiner le modèle.

Le modèle peut ensuite être testé et validé par les humains en notant ses résultats. Ce processus est particulièrement utile dans les cas où l’algorithme n’est pas confiant dans un jugement, ou au contraire, où l’algorithme est trop confiant dans une décision incorrecte.

Le processus HITL est une boucle de rétroaction continue, ce qui signifie que chacune des tâches de formation, de réglage et de test est réinjectée dans l’algorithme. Ce processus permet à l’algorithme de devenir plus efficace et plus précis au fil du temps, ce qui est particulièrement utile pour créer des données d’entraînement très précises et en grande quantité pour des cas d’utilisation spécifiques. Le point de vue humain permet d’affiner et de tester le modèle afin que l’organisation puisse prendre les décisions les plus précises et les plus exploitables.

L’importance de l’apprentissage automatique HITL

Le HITL est une branche extrêmement importante de l’IA, car les modèles d’apprentissage automatique classiques nécessitent un grand nombre de points de données étiquetées pour obtenir des prédictions précises. Lorsqu’il y a un manque de données, les modèles d’apprentissage automatique ne sont pas aussi utiles.

Prenez l’apprentissage des langues comme exemple. Si vous avez une langue qui n’est parlée que par quelques milliers de personnes et que vous souhaitez obtenir des informations sur cette langue grâce à l’apprentissage automatique, il peut être difficile de trouver suffisamment d’exemples pour que le modèle puisse apprendre. Avec une approche HITL, vous pouvez garantir la précision de ces ensembles de données.

L’industrie des soins de santé est également l’une des plus importantes pour les systèmes HITL. Une étude réalisée en 2018 par Stanford a révélé qu’un modèle HITL fonctionne mieux que l’IA ou les humains seuls.

Les systèmes HITL améliorent la précision tout en maintenant des normes de niveau humain, ce qui est important pour de nombreuses industries à travers le monde.

Quand utiliser les systèmes HITL

Il y a quelques moments spécifiques dans le cycle de vie de l’IA où l’apprentissage automatique « human-in-the-loop » devrait être utilisé :

La formation : L’endroit le plus courant où les scientifiques des données utilisent le HITL est pendant les phases de formation, où les humains fournissent des données étiquetées pour la formation du modèle.
Réglage et test : L’autre utilisation principale de l’HITL est celle des phases de réglage et de test. Les humains accordent les modèles pour une plus grande précision, ce qui est particulièrement crucial lorsque le modèle n’est pas sûr.

Il est important de noter que l’approche HITL ne convient pas à tous les projets d’apprentissage automatique. Elle est surtout utilisée lorsqu’il n’y a pas beaucoup de données disponibles.

L’apprentissage profond humain dans la boucle est utilisé lorsque les humains et les processus d’apprentissage automatique interagissent dans certains scénarios, tels que : les algorithmes ne comprennent pas l’entrée ; l’entrée des données est interprétée de manière incorrecte ; les algorithmes ne savent pas comment effectuer une tâche spécifique ; le modèle d’apprentissage automatique doit être plus précis ; la composante humaine doit être plus efficace et précise ; le coût des erreurs est trop élevé dans le développement ML ; et les données souhaitées ne sont pas disponibles.

Types d’étiquetage des données pour le HITL

L’approche HITL peut être utilisée pour différents types d’étiquetage de données en fonction du type d’ensembles de données requis. Par exemple, si la machine doit apprendre à reconnaître des formes spécifiques, des boîtes de délimitation sont utilisées. Mais si le modèle doit classer chaque partie d’une image, la segmentation est préférée. Lorsqu’il s’agit d’ensembles de données de reconnaissance faciale, les marques de visage sont souvent utilisées.

Une autre application majeure est l’analyse de texte, qui permet à la machine de comprendre ce qui est dit ou écrit par les humains. Comme les gens utilisent différents mots pour exprimer les mêmes significations, les systèmes d’IA doivent connaître les différentes variations. Allant encore plus loin, l’analyse des sentiments peut reconnaître le ton d’un mot ou d’une phrase spécifique. Ces exemples prouvent pourquoi il est si important d’utiliser l’approche « human-in-the-loop ».

Pourquoi votre entreprise devrait mettre en œuvre l’approche HITL

Si votre entreprise cherche à installer un système HITL, l’une des façons les plus courantes de le faire est d’utiliser un logiciel d’automatisation. De nombreux logiciels d’automatisation sont déjà conçus autour de l’approche HITL, c’est-à-dire qu’ils intègrent déjà le processus.

De tels systèmes permettent à l’entreprise d’atteindre immédiatement des performances de haut niveau et d’obtenir des informations. Les systèmes d’apprentissage automatique sont déjà mis en œuvre dans presque tous les secteurs, ce qui signifie que les développeurs doivent s’assurer que les systèmes fonctionnent bien avec des données changeantes.

Il y a de nombreux avantages à mettre en œuvre un système d’apprentissage automatique dans votre entreprise :

Améliore le processus de prise de décision : Un système HITL améliore le processus de prise de décision d’une entreprise en apportant transparence et cohérence. Il protège également contre les préjugés en incluant la rétroaction humaine dans le processus de formation.
Plus efficace : Les systèmes HITL sont généralement considérés comme plus efficaces que les systèmes traditionnels d’apprentissage automatique. Ils nécessitent moins de temps pour la formation et le réglage, ce qui signifie qu’ils produisent des informations plus rapidement.
Transparence : Les systèmes human-in-the-loop offrent une plus grande transparence du modèle d’apprentissage automatique, de son fonctionnement et de la raison pour laquelle il est arrivé à une certaine décision. L’explicabilité et la responsabilité sont fondamentales pour les systèmes d’IA d’aujourd’hui, et l’approche HITL y contribue grandement.

Défis des systèmes HITL

Les systèmes « human-in-the-loop » présentent également certains défis spécifiques qu’il convient de relever. D’abord, les humains font des erreurs, donc tout système avec des humains risque de se tromper. Cela peut avoir un impact important sur l’efficacité du système. Par exemple, si un humain fait une erreur lors de l’étiquetage des données, cette même erreur se répercutera sur l’ensemble du système et pourra causer des problèmes futurs.

Les systèmes HITL peuvent également être lents puisque les humains sont impliqués dans le processus de prise de décision. L’une des principales raisons de la croissance de l’IA et du ML est que les machines sont incroyablement plus rapides que les humains, mais cette vitesse souvent observée dans les systèmes ML traditionnels ne se traduira pas toujours dans les systèmes HITL.

Un autre défi des systèmes HITL est qu’ils peuvent être coûteux à construire et à entretenir. Outre les coûts associés à la machine, l’entreprise doit également budgétiser la main-d’œuvre humaine.