Par Félix Chrétien

L’exploitation des données massives par des techniques comme l’apprentissage-machine est en progression rapide dans toutes les sphères de l’économie. Un ensemble de techniques bien rôdées permettent désormais de révéler des informations clés sur les entreprises et leur environnement. Quelle sera la demande pour vos produits dans les prochains mois, qui sont vos clients payants, quelles activités sont les plus rentables, etc. Toutes ces informations sont à la portée de nombreuses entreprises qui, trop souvent, ne s’en doutent même pas. Aujourd’hui est résolument le meilleur moment pour adopter cette technologie. Après les GAFAS de ce monde (Google, Amazon Facebook, …), les PMEs ont tout à gagner à s’y mettre dès maintenant! Voici pourquoi.

Des données, toujours plus de données

Les données sont le carburant de l’intelligence artificielle. Il s’en accumule présentement des quantités pharamineuses dans toutes les industries. Qu’elles soient bien structurées dans des bases SQL, ou éparses dans d’innombrables tableurs, des milliards de milliards de bits ne demandent qu’à révéler leurs précieuses informations. Dès qu’une boutique en ligne est ouverte, on peut recueillir des données excessivement détaillées de son utilisation. Les systèmes de gestion d’inventaires enregistrent les comportements de la demande sur de vastes périodes. Parfois la donnée se cache même où on ne l’attend pas : fichiers texte, images, enregistrements audios, etc. Ou alors un processus répétitif ne demande qu’un petit ajustement pour commencer à remplir une base de données. Il ne faut pas non plus négliger les efforts publics (et privés) pour rendre l’utilisation de jeux de données libres de droits. Autant de matière dont raffolent les modèles voraces, véritables Pantagruels numériques.

Pas de monopole sur les mathématiques

On se fait souvent de l’intelligence artificielle l’idée d’une technologie futuriste et inaccessible. La réalité est que les algorithmes utilisés par la vaste majorité des modèles en production reposent sur l’agencement de milliers de modèles bien connus des statisticiens, comme la régression linéaire. Mieux encore, le paradigme actuelle de l’« open source » fait en sorte que les algorithmes les plus performants sont libres de droits et le code source est facilement accessible. La communauté de programmeurs des données et statisticiens est large, très bien développée et soucieuse de diffuser la connaissance. Pour couronner le tout, certains gros joueurs ont déjà défriché le terrain dans les années 2000 et 2010, de sorte que la technologie est maintenant mature pour l’adoption massive. En cas de doute, non, il n’y a pas de monopole sur les mathématiques statistiques.

La puissance du nuage

L’infonuagique est une traduction bien morne de « cloud computing ». Ce mot trahit l’ampleur de la petite révolution qui est en train de se dérouler. Avec la disponibilité de services de location d’ordinateurs à distance, il est désormais possible de réaliser des calculs imposants à faible coût. L’ordinateur personnel que j’utilise a un processeur à 4 cœurs et 16 gigs de mémoire. Cela est amplement suffisant pour la plupart de mon travail. Toutefois, lorsque vient le temps d’entraîner un modèle complexe sur des millions de points de données, ma configuration se révèle rapidement limitée. Sur Google Cloud, l’un des principaux fournisseurs en infonuagique, je peux présentement louer et contrôler une machine à distance pour réaliser un calcul. Disons que je fais face à un calcul incroyablement long à réaliser, alors je pourrai louer une machine avec 96 processeurs et pas moins de 360 gig de mémoire. Le coût? À peine plus de 3 dollars l’heure d’utilisation. Amplement suffisant pour entrainer une IA performante.

Serez-vous le premier des petits?

L’intelligence artificielle n’est pas une technologie tout à fait nouvelle. Les systèmes de recommandations personnalisées, la détection de visage sur une photo, l’estimation automatique de solvabilité financière sont des services que nous croisons déjà régulièrement. Dans les vingt dernières années, quelques gros joueurs ont, avec des grands talents scientifiques, développé et amené cette technologie à maturité. Ils se sont buté à d’innombrables obstacles et ont été grâssement récompensés par le marché. La balle est maintenant dans le camp des PMEs. Tout est en place pour une adoption rapide de ces technologies. Il est encore temps d’être le premier chez les petits, mais cela requiert des investissements immédiats en acquisition et en valorisation des données. Non seulement cela permettra de développer des nouveaux produits, mais aussi d’automatiser des tâches pénibles ou redondantes, d’accéder à de nouvelles informations et d’améliorer grandement la valeur de l’entreprise par l’accumulation d’un capital données. Saisirez-vous cette opportunité ?

English EN French FR