Bref Résumé
Arthur Mensch, cofondateur et PDG de Mistral AI, discute de l'impact de l'IA sur nos vies, du fonctionnement de l'IA, des particularités de Mistral par rapport à ses concurrents, et de l'importance de la souveraineté européenne ou française dans ce domaine. Il aborde également les questions de l'utilisation de l'IA, des métiers potentiellement remplacés, des biais humains, de la régulation, du modèle open source, de la concurrence, de la consommation énergétique et de l'avenir de l'IA.
- L'IA est un outil puissant qui peut être utilisé pour améliorer la productivité, la créativité et la prise de décision.
- Il est important de comprendre les risques potentiels de l'IA, tels que la centralisation du contrôle, l'influence culturelle et le deskilling.
- L'Europe a un rôle important à jouer dans le développement de l'IA, en particulier en matière de souveraineté et de régulation.
Intro
Arthur Mensch, 32 ans, cofondateur et PDG de Mistral AI, est interviewé sur l'impact de l'IA, le fonctionnement de Mistral AI et l'enjeu de la souveraineté européenne dans ce domaine. Il a levé plus d'un milliard d'euros pour sa société et a été reconnu comme l'un des 100 innovateurs les plus prometteurs par le magazine Time en 2024. L'interview aborde des questions sur l'impact de l'IA sur nos vies, les particularités de Mistral AI par rapport à ses concurrents, et l'importance d'une indépendance européenne sur ce sujet.
Son utilisation de l’IA
Arthur Mensch utilise le chat de Mistral AI quotidiennement pour diverses tâches professionnelles, notamment le traitement des informations sur les comptes clients, la préparation de stratégies produits et le brainstorming. Il l'utilise également pour des tâches personnelles, comme la recherche d'activités pour le week-end ou de restaurants. Il souligne que les versions futures du chat seront encore plus performantes dans la recherche d'informations sur le web et la proposition de plans d'action. Il a été particulièrement impressionné par la capacité de l'IA à se connecter au web, à visiter plusieurs sites, à traiter les informations et à préparer des rapports complexes, ce qui permet de gagner énormément de temps. Les deux principaux verrous qui ont sauté sont la rapidité et la capacité à réfléchir plus longtemps.
Rendre l’IA de plus en plus efficace
Les modèles de langage sont des générateurs de texte qui s'entraînent sur la connaissance humaine pour prédire la suite d'une phrase. Pour transformer un générateur de texte en un orchestrateur de navigation web, le modèle génère une série d'appels à un navigateur web. Il effectue une recherche web, récupère le contenu des pages et le remet dans son contexte. Ainsi, le modèle peut utiliser les informations du web pour répondre à des questions complexes et proposer des recommandations personnalisées. Les modèles de langage sont devenus de véritables orchestrateurs qui interagissent avec la connaissance et les outils informatiques, comprenant l'intention de l'utilisateur et associant cette intention à des actions à prendre.
Des métiers remplacés par l'IA ?
L'IA impacte les métiers, nécessitant une adoption généralisée de cette technologie. Cette révolution est comparable à l'arrivée des smartphones, d'internet et des ordinateurs personnels. L'adoption est plus facile pour les jeunes, mais nécessite un réentraînement pour les générations ayant étudié il y a 20 ans. L'IA exige une coadaptation, où l'utilisateur comprend comment la machine fonctionne et comment elle comprend les intentions. Les métiers d'analyse sont particulièrement impactés, car l'IA accélère la prise de décisions financières et la préparation de rendez-vous clients. Il faut se concentrer sur les tâches à plus forte valeur ajoutée, comme le contact humain et la créativité, que la machine ne peut pas remplacer. La créativité du modèle dépend de ce qu'on lui donne en entrée, et une interaction humaine est nécessaire pour pousser le modèle dans ses retranchements et obtenir des résultats intéressants.
L’utilisation personnelle et professionnelle
Les IA ont tendance à se perdre lorsqu'elles ont accès à trop de contexte d'entreprise ou à trop d'outils. Elles ne sont pas capables de créativité, d'inventer de nouveaux outils ou d'idéaliser de nouveaux objets. Elles ne réfléchissent pas comme nous et ne comprennent pas tout, notamment dans leur perception des images et leur raisonnement spatial. Elles ne comprennent pas forcément la physique et échouent face à des problèmes d'engrenages. L'enjeu est de nourrir l'IA avec de nouveaux types de données, au-delà du texte, de l'image et de la vidéo, et de la spécialiser sur des domaines spécifiques. Le chat est utilisé à des fins personnelles et professionnelles, mais l'essentiel du modèle économique de Mistral AI est de travailler avec des entreprises pour déployer le chat et construire des applications spécifiques. L'avenir de l'entreprise est un mélange de B2B et de grand public, avec une technologie utilisée à la maison et au travail.
L’erreur humaine
Il y a deux phases dans l'entraînement d'un modèle : la compression de la connaissance, qui crée des biais statistiques, et une phase éditoriale où l'on pousse le modèle dans certaines directions. Il n'y a pas de modèle non biaisé, et chaque entreprise fait ses choix éditoriaux. Mistral AI aide ses clients à personnaliser ces aspects lors des déploiements. La question des biais de l'IA est très présente dans l'actualité, avec des exemples comme Elon Musk critiquant Open AI et la Chine avec son IA qui évite les sujets politiques sensibles. Mistral AI essaie d'être le plus neutre possible et de renvoyer à plusieurs points de vue sur les questions ambiguës.
L’enjeu politique et médiatique
L'IA est la nouvelle génération des médias et un outil d'influence majeur. Il y a un enjeu de souveraineté culturelle, économique et politique. Si toutes les entreprises européennes dépendent de technologies américaines, cela crée un problème de balance commerciale et un risque d'influence culturelle. Chaque État doit avoir une stratégie pour contrôler les idées qui circulent sur son territoire. La régulation de l'IA est encore peu abordée au niveau européen, mais elle se posera certainement. L'approche de Mistral AI est d'être le plus neutre possible et de mettre à disposition ses modèles en open source, afin que chacun puisse les modifier et les adapter à ses besoins.
Le modèle « Open source »
Mistral AI a une partie de sa propriété intellectuelle en open source, ce qui signifie que les modèles sont disponibles pour tous et peuvent être modifiés. L'entreprise vend des services de déploiement, de connexion à la donnée et d'intégration, ainsi que des logiciels propriétaires. L'intérêt de l'open source est multiple : distribution, accélération de la recherche et mutualisation des coûts. Cela permet à d'autres entités d'améliorer les modèles et de créer un commun de connaissance. Mistral AI a contribué à inverser la dynamique d'Open AI, qui avait fermé ses modèles pour des raisons économiques. Aujourd'hui, les modèles open source sont aussi bons que les modèles propriétaires, ce qui rend moins intéressant de passer par des modèles contrôlés de manière centralisée.
Mistral AI face aux concurrents
La plateforme portable de Mistral AI, qui peut être déployée sur les serveurs des clients, dans le cloud ou en interne, est un différenciateur majeur. Cela permet de gérer une demande différente, notamment dans les administrations et les secteurs régulés. Les modèles de Mistral AI se comportent différemment et ont des choix éditoriaux différents de ceux d'Open AI. L'entreprise met l'accent sur l'efficacité, en créant des modèles plus petits et plus rapides, et sur la personnalisation. L'Europe bénéficie d'une force de talent, avec d'excellents centres de formation et des ingénieurs efficaces. Le défi est de rester attractif pour les talents et de les empêcher de partir aux États-Unis.
L’Europe en retard ?
La principale difficulté pour l'Europe est un retard d'adoption des nouvelles technologies par les entreprises. Cependant, on observe une forte volonté d'accélérer sur l'IA et de travailler avec des entreprises européennes. Les marchés fragmentés et les différences culturelles rendent la croissance plus lente. La régulation du travail, notamment les préavis de démission, est également un frein. Il faut donner plus de flexibilité aux employés pour qu'ils puissent saisir les opportunités plus rapidement. La Chine est un acteur important dans le domaine de l'IA, avec des entreprises comme Dipsy qui mettent à disposition des modèles ouverts et efficaces.
Les milliards levés pour l’IA
Dipsy est proche de Mistral AI en termes de structure, d'âge et d'ambition. Les dernières versions de Dipsy se basent sur une extension de ce que Mistral AI a mis à disposition l'année dernière. Les deux entreprises partagent un ADN d'ouverture et d'efficacité. Elles ont démontré qu'il ne coûte pas des milliards pour entraîner des modèles compétents. Open AI a levé beaucoup plus de fonds que Mistral AI, mais cela ne garantit pas un meilleur produit. Les lois d'échelle montrent qu'il y a un moment donné où l'augmentation des dépenses n'a plus de sens, car on a fini de compresser la connaissance humaine.
Exploiter le savoir humain et l’enrichir
En 2024, on a atteint un stade où l'on a globalement tout ce qui existe en ligne et on est capable de l'exploiter. L'enjeu est d'exploiter au mieux ces données et d'entraîner les modèles pour bien les utiliser. Il y a un enjeu algorithmique, un enjeu de données de qualité et un enjeu de raisonnement. L'IA n'enrichit rien en soi, mais il faut lui ramener de nouvelles sources de signal, soit par annotation humaine, soit par des démonstrations que des machines peuvent faire. L'objectif est de trouver des nouvelles sources de signaux générées par la machine, comme la simulation ou l'exécution de code, et d'aller chercher de l'expertise que le modèle n'a pas encore.
Les risques de l’IA
L'IA peut créer de nouveaux savoirs, comme l'a montré Alpha Go en battant le champion du jeu de go. L'objectif est de trouver l'équivalent du jeu de go pour le texte, en posant des questions mathématiques complexes et en laissant le modèle déployer son raisonnement. L'espoir est que le modèle invente de nouvelles techniques en mathématiques. La question scientifique est de savoir si un signal simple de "c'est vrai, c'est faux" suffit pour qu'un modèle développe une intelligence de preuve novatrice. Il faut une récompense pour que le modèle puisse s'améliorer. Dès qu'on passe sur des sujets plus ouverts, comme la philosophie, il est plus difficile de dire si c'est un ou zéro.
La consommation énergétique de l’IA
Le risque majeur est un contrôle centralisé de la technologie, où un ou deux acteurs américains ont un contrôle culturel et sur le contenu. Il y a un risque d'influence culturelle et de manipulation des humains de manière subtile. Il faut un sens critique et détecter les campagnes d'influence nuisibles. Il y a un vrai sujet de démocratie, car l'IA peut avoir une forte influence sur les humains. La peur d'un système qui s'échappe est infondée, car ce sont des logiciels sous contrôle humain. Il y a un risque de deskilling, où les humains font trop confiance à l'IA et oublient comment faire de l'analyse. Il faut un design qui maintienne le cerveau humain actif.
L’avenir de l’IA
L'IA crée une demande de data centers, mais cela reste négligeable par rapport à l'industrie. Mistral AI relocalise ses capacités de calcul en Europe, où le mix énergétique est plus décarboné. Les data centers consomment beaucoup d'électricité de manière constante, ce qui incite à trouver des solutions vers le nucléaire et les énergies renouvelables. Cela peut accélérer la transition énergétique. Il y a un enjeu d'utiliser l'énergie de manière efficace et de choisir des sources d'énergie décarbonées.
Comment vit-il la situation
L'avenir de l'IA est une accélération sur plusieurs plans : scientifique, produit et commercial. De nouveaux modèles arrivent, capables de raisonner et d'être plus contrôlables. Le chat va être amélioré avec de nouvelles connexions et une version entreprise. Il y a une forte accélération commerciale en Europe et en Asie. Il faut gérer la croissance commerciale, améliorer le produit et pousser les capacités de raisonnement dans plein de domaines. Il y a des capacités de multimodalité à explorer. L'enjeu est de transformer la personnalisation en produit et de donner toutes les clés éditoriales aux clients.
Outro
Arthur Mensch vit une situation variée, avec beaucoup de choses à faire. Il n'est pas seul, car il a cofondé l'entreprise avec Guillaume et Timothé. Il passe beaucoup de temps sur le développement commercial et l'organisation de l'équipe. Il y a un aspect représentation, car c'est un sujet politique lié à la souveraineté. Il faut bien recruter et avoir des gens plus forts que soi dans tous les domaines où l'on a une compétence limitée. Son rôle est de faire le moins de choses possible et de faire en sorte que les choses tournent toutes seules.