6 conseils pour diriger un projet d'apprentissage automatique

L'apprentissage automatique et l'apprentissage profond ne sont plus des mots à la mode. Cette technologie, autrefois pionnière, est devenue un composant essentiel de la pile technologique des entreprises et des startups, ce qui a transformé le développement logiciel. Étant donné que l'apprentissage automatique est étroitement lié aux processus décisionnels des entreprises, nous tenons à préciser que la pile technologique d'apprentissage automatique est un processus et non un simple logiciel statique.

Les solutions d'apprentissage automatique dépendent de la disponibilité et de la quantité de données adéquates, ce qui modifie notre façon d'envisager la construction, la maintenance et l'amélioration de l'infrastructure. Construire des solutions d'apprentissage automatique n'est pas simple en raison de ces facteurs. Les data scientists, les développeurs de logiciels et les ingénieurs DevOps doivent collaborer dans plusieurs domaines pour produire une solution utile. Cet article présente 6 bonnes pratiques que toute organisation menant un projet de Machine-Learning devrait suivre.

1. Définir les objectifs et préciser les exigences du projet

Définir un but ou un objectif concret n'est pas aussi simple qu'il y paraît. Il existe plusieurs approches pour résoudre un problème, et il n'est pas toujours évident de savoir laquelle est la meilleure. Il peut être tentant de passer moins de temps à définir clairement les objectifs, mais ce sont les objectifs mal définis qui font dérailler les projets, car l'équipe qui élabore la solution ne sait pas à quoi donner la priorité et risque de se perdre dans des tests pour voir ce que les différents modèles permettent de réaliser, ce qui détruit l'élan du projet, la probabilité de son lancement et le retour sur investissement (RSI) en raison d'un développement sans fin.

Il est essentiel d'avoir des objectifs et des priorités clairement définis pour gérer les objectifs de Machine Learning de votre entreprise. Vous finirez souvent par dépasser les délais en raison d'un champ d'application toujours plus large et d'un manque de critères d'évaluation, deux facteurs qui peuvent vous faire perdre de vue l'identification des solutions qui ont un retour sur investissement et qui répondent aux objectifs de votre entreprise. Dès le début du projet, tout le monde doit travailler dans le même sens.

2. Créer une liste de contrôle avant de commencer votre projet de ML

Vous devez avoir une idée précise de la façon dont votre progression apparaîtra avant même d'écrire votre première ligne de code. Réfléchissez aux questions suivantes avant de commencer votre projet de ML :

Quel est l'objectif de votre projet de ML ?
Disposez-vous des bonnes données ?
Comment les performances du modèle seront-elles évaluées ?
Le modèle doit-il être léger et fonctionner sur la machine d'un utilisateur ou sur le serveur de l'entreprise ?
Le modèle peut-il traiter les données à l'avance ou avez-vous besoin d'un modèle léger qui puisse fonctionner en temps réel ?
L'infrastructure nécessaire est-elle en place ?
Les performances supplémentaires offertes par des modèles plus grands et davantage de GPU sont-elles réellement importantes pour le cas d'utilisation ou valent-elles le retour sur investissement ?
Quelles sont les exigences en matière de déploiement ?
L'explicabilité est-elle nécessaire ?

3. Planifier et définir le processus itératif

Même si le modèle initial est utilisé en production, votre travail n'est pas encore terminé. La clé d'une mise en œuvre réussie de l'apprentissage automatique est de commencer petit, de mettre en place un MVP avec les données dont vous disposez et d'évaluer la solution pour voir si la précision du modèle est ou peut être comparée à la performance humaine. Une fois que vous avez fait cela, vous pouvez évaluer s'il y a un retour sur investissement dans les itérations ultérieures, en investissant dans l'obtention de données plus nombreuses et de meilleure qualité, et en résolvant éventuellement les cas limites pour lesquels il n'y a pas assez de données avec des techniques autres que l'apprentissage automatique.

Répétez toujours la procédure pour chaque nouvelle solution et apportez des modifications avant l'itération suivante. Les objectifs de l'entreprise varient presque toujours. La technologie, la recherche, les méthodes et le matériel sous-jacents qui alimentent les solutions à forte intensité de calcul évoluent. Tous ces éléments peuvent entraîner la nécessité d'affiner ou d'optimiser votre modèle pour l'adapter aux conditions changeantes du monde ou du secteur dans lequel vous opérez, aux données avec lesquelles vous travaillez, à de nouvelles capacités ou à des systèmes entièrement nouveaux.

4. Recueillir les données historiques des systèmes existants

Parfois, les exigences ne sont pas très évidentes, ce qui rend difficile l'identification immédiate du bon objectif. C'est souvent le cas lors de l'intégration de l'apprentissage automatique dans des systèmes existants. Recueillez autant d'informations que possible sur le système actuel avant d'entrer dans les détails de ce que votre application exécutera et de la fonction que l'apprentissage automatique jouera.

Vous pouvez ainsi accomplir la tâche qui vous est confiée en utilisant des données historiques. En outre, ces données peuvent immédiatement mettre en évidence les domaines qui nécessitent une optimisation et le plan d'action optimal.

5. Garantir l'accès aux données nécessaires

Une fois que vous avez saisi la question, vous avez besoin d'informations pertinentes. Cela vaut la peine de les consulter car la plupart des sources de données sont accessibles gratuitement sur des sites web tels que Kaggle et Ensembles de données de l'UCI. Si votre problème est distinct, vous devrez peut-être collecter, organiser et stocker vos propres données. Le scraping sur Internet et la catégorisation manuelle des données recueillies sont deux options fréquentes. Obtenir la bonne qualité et une quantité suffisante des données dont vous avez besoin est souvent ce qui vous permettra de créer des solutions de ML utiles qui auront plus de chances d'être mises en production après les tests initiaux.

6. Évaluer et obtenir la bonne pile technologique

Les modèles ML choisis doivent être exécutés manuellement pour vérifier leur exactitude après la sélection. Par exemple, dans le cas du marketing personnalisé par courriel, vous devez adapter votre stratégie et tester davantage de variables si les courriels promotionnels envoyés ne génèrent pas un taux de conversion supérieur à votre taux de base.

Il est nécessaire de sélectionner la meilleure technologie après des tests manuels réussis. Les équipes de science des données devraient être libres de choisir parmi différentes piles technologiques pour permettre l'expérimentation et la sélection de la pile technologique qui simplifie le ML. L'analyse comparative doit porter sur la vitesse, la stabilité, le retour sur investissement, la capacité à résoudre les problèmes des salariés et des clients, les cas d'utilisation futurs et les performances sur l'appareil ou dans le nuage.

Quelle est l'utilité de Skim AI ?

Les modèles d'apprentissage automatique et d'apprentissage profond nécessitent une connaissance approfondie du domaine, un accès à des données étiquetées de haute qualité et des ressources informatiques pour l'entraînement et l'amélioration continus des modèles. L'amélioration des modèles d'apprentissage automatique est une compétence qui évolue en abordant méthodiquement les lacunes des modèles existants avec les contraintes données. Skim AI fournit des solutions utiles pour les personnes à tous les niveaux, des étudiants aux PDG, qui vous aident à couper à travers le bruit, à discerner de meilleures perspectives et à prendre de meilleures décisions basées sur des données qui comptent.

fr_FRFrançais