Avec la popularisation récente de GPT-4, nous voilà à l’aube d'une nouvelle vague d'innovations dans le domaine de la technologie. En tant qu'investisseurs de long terme dans ce vaste secteur, la révolution de l’intelligence artificielle (IA) est naturellement source de nouvelles idées d’investissement. Retour sur une conversation tenue dernièrement avec GPT-4, qui présente notamment l'un de nos nouveaux investissements dans Sycomore Sustainable Tech, MongoDB, une base de données nouvelle génération.
Depuis le début de l’année, l'équipe de gestion du fonds Sycomore Sustainable Tech recherche et analyse les potentiels impacts tangibles que la récente popularisation du ChatGPT d'OpenAI pourrait avoir sur les sociétés cotées de notre univers d’investissement. Nous continuons d’affiner notre recherche sur le sujet, mais partageons ici une entrevue intéressante que nous avons tenue avec GPT-4, lors de laquelle nous lui avons demandé quelles étaient les sociétés de Software et Hardware qui constituaient, selon GPT, le ‘tech stack’ le plus performant pour développer un compétiteur de GPT.
Qu'est-ce qu'un "tech stack"?
Le "tech stack", c'est en fait l'empilage des technologies nécessaires au développement et à l'utilisation d'un programme informatique. Cela comprend le ou les langages de programmation utilisés, mais aussi les différents frameworks et outils auxquels les développeurs ont recours pour créer, déployer, maintenir et utiliser l'application.
Entrevue avec GPT-4
Si nous souhaitions créer une entreprise d'IA générative (ou GIA) à partir de zéro, quelles seraient les technologies que nous devrions utiliser,du hardware au software? Selon vous, quelles sont les entreprises qui ont le plus de chances d'être sélectionnées dans le cadre d'une application d'IA générative ?
GPT-4 : La création d'une entreprise d'IA générative nécessite un dispositif technologique bien réfléchi qui assure la recherche, le développement et le déploiement efficaces des modèles d'IA. Voici une suggestion de dispositif technologique « hardware » :
GPU : GPU NVIDIA (les séries A100, V100 ou RTX par exemple) pour un entrainement et une déduction statistique efficaces des modèles d'apprentissage.
CPU : CPU haute performance (par exemple, Intel Xeon ou AMD EPYC) pour les applications informatiques standard et le traitement des données.
Stockage : SSD ou HDD haute capacité pour le stockage des données, le contrôle du modèle et du contenu généré.
Réseau : connexions réseau à haut débit et à faible latence pour un transfert des données et une utilisation des modèles efficaces.
Quel type d'infrastructure « cloud » conseillez-vous ?
GPT-4 :
Fournisseurs de Cloud : AWS, Google Cloud Platform ou Microsoft Azure pour des ressources informations, de stockage et de réseau extensibles.
Conteneurs : Docker permettant de créer, déployer et gérer des applications mobiles conteneurisées.
Orchestration de conteneurs : Kubernetes pour automatiser le déploiement, la mise à l'échelle et la gestion des applications conteneurisées.
Tout logiciel a besoin d'un système d'exploitation - lequel semble le plus pertinent pour cette utilisation ?
GPT-4 : les versions de Linux (Ubuntu ou CentOS par exemple), compatibles avec la plupart des infrastructures et des outils d'intelligence artificielle.
Quels sont les meilleurs langages de programmation pour développer la technologie GAI ?
GPT-4 : Python, pour son vaste écosystème de bibliothèques d'IA et de science des données. D'autres langages (JavaScript, Java ou C++ par exemple), pour des utilisations spécifiques, telles que le développement web, les applications mobiles ou le calcul à haute performance.
Certains frameworks d'IA sont déjà bien utilisés - sur lesquels devrions-nous nous concentrer ?
GPT-4 : TensorFlow et Keras pour la construction, l'entraînement et le déploiement de modèles de « deep learning ». PyTorch pour sa flexibilité et son graphique de calcul dynamique, particulièrement utile pour la recherche et l'expérimentation. La bibliothèque Transformers de Hugging Face pour les modèles de langage pré-entraînés et l'intégration facile aux modèles d'IA générative.
Les données sont un élément clé de ce type de technologie. Quels sont les outils de traitement et de base de données qu'une technologie d'IA à grande échelle devrait utiliser ?
GPT-4 :
Data processing : Pandas et NumPy pour la manipulation des données et les calculs numériques.
Bases de données : Base de données vectorielle pour l’entrainement et l'inférence comme Pinecone mais aussi Microsoft CosmosDB, MongoDB (NoSQL) ou/et PostgreSQL (SQL) pour le stockage et la gestion des données d’entrainement et des métadonnées.
Quels sont les outils à privilégier pour le codage, le contrôle de version et la collaboration entre développeurs ?
GPT-4 : Git pour le contrôle de version du codage et des données. GitHub ou GitLab pour l’hébergement du code à distance, la collaboration et la gestion de projet.
Actuellement, les logiciels sont généralement construits en petits lots de code. Qu’utiliser pour s’assurer que notre déploiement de logiciels est efficace, rapide et fréquent ?
GPT-4 : Jenkins, GitLab CI/CD, ou GitHub Actions pour automatiser les tests, la construction et le déploiement de modèles d'applications d'IA.
Une fois le modèle construit et prêt à être déployé, quels outils devrions-nous utiliser ?
GPT-4 : TensorFlow Serving ou PyTorch Serve pour le fonctionnement des modèles d'IA dans un environnement de production. FastAPI ou Flask pour construire des API RESTful afin d'exposer les modèles d'IA à des applications externes.
GPT-4 nous a ensuite rappelé qu’il ne s’agissait que de suggestions de dispositifs technologiques pour soutenir la création une entreprise d'IA générative et que, bien sûr, elles n’étaient pas le reflet de son propre dispositif. Nous avons trouvé ses réponses très instructives dans la recherche des entreprises bien positionnées pour bénéficier de cette vague d’innovation, MongoDB notamment. Nous avons donc décidé de poursuivre la conversation :
Si j'étais l'entreprise d'IA générative la plus importante et la plus populaire à ce jour, pourquoi choisirais-je MongoDB, et dans ce cas, choisirais-je son offre Enterprise Advanced ou la version cloud, appelée Atlas ?
GPT-4 : Pour la plus grande entreprise d'IA générative au monde, MongoDB Atlas est probablement l'option la plus appropriée, pour les raisons suivantes :
Extensibilité : en tant qu'entreprise leader dans le domaine de l'IA, il est essentiel de disposer de capacités de stockage et de traitement à grande échelle. MongoDB Atlas offre une extensibilité automatisée, qui facilite la gestion de vastes ensembles de données et des exigences de débit élevées associées aux modèles d'IA générative puissants.
Maintenance et gestion : MongoDB Atlas décharge l'entreprise de la gestion, des correctifs et de la mise à jour de la base de données, ce qui peut réduire considérablement les coûts d'exploitation. L'entreprise peut ainsi se concentrer sur la recherche, le développement et le déploiement de l'IA plutôt que sur la gestion de la base de données. Une entreprise d'IA de premier plan utilisera probablement divers services d'IA et d'apprentissage automatique basés sur le cloud. MongoDB Atlas offre une meilleure intégration et un échange de données transparent avec ces services, ce qui en fait un choix pertinent.
Disponibilité et latence à l'échelle mondiale : MongoDB Atlas offre des options d'optimisation de la latence du réseau, telles que la sélection de régions proches des charges de travail d'IA et l'utilisation de Global Clusters pour distribuer les données entre les régions. Cela permet à l'entreprise d'IA de fournir des services à faible latence à une base d'utilisateurs mondiale.
Flexibilité et coût : MongoDB Atlas offre des options de tarification flexibles basées sur l'utilisation, ce qui permet à l'entreprise de s'adapter plus facilement à l'évolution des besoins et aux contraintes budgétaires. Cette flexibilité est avantageuse pour une entreprise d'IA à croissance rapide dont les besoins évoluent.
Le choix entre MongoDB Atlas (basé sur le cloud) et MongoDB Enterprise Advanced (sur site) pour le déploiement de modèles de langage à grande échelle dépend de vos besoins spécifiques, de votre budget et de vos préférences en matière d'infrastructure.
L’équipe de gestion spécialisée dans la Tech de Sycomore AM poursuit ses recherches quant aux différents impacts que l'IA pourrait avoir sur ses investissements et sur notre société en général, et partagera bientôt ses conclusions concernant les effets que cette révolution devrait avoir sur l’économie mondiale. Stay tuned !
Les références à des valeurs mobilières spécifiques et à leurs émetteurs sont dans un but unique d'illustration, et ne doivent pas être interprétées comme des recommandations d'achat ou de vente de ces valeurs. Nous pensons que l'information fournie dans cet article est fiable, mais elle ne doit pas être considérée comme exhaustive. Votre attention est appelée sur le fait que toute prévision a ses propres limites et que par conséquent aucun engagement n'est pris par Sycomore AM quant à la réalisation de ces prévisions. Nous vous recommandons de vous informer soigneusement avant de prendre une décision d'investissement. Tout investissement dans l'OPCVM mentionné dans cet article doit se faire sur la base de la notice d'information ou du prospectus actuellement en vigueur. Ces documents sont disponibles sur simple demande auprès de Sycomore Asset Management. Le fonds n’offre aucune garantie de rendement ou de performance et présente un risque de perte en capital.