À moins que vous n’ayez vécu sous une roche, il est indéniable que l’IA a pénétré les organisations – 35 % des entreprises ont déjà développé des flux de travail basés sur l’IA si ce n’est pas complètement automatisé certains aspects de leur activité.
Cependant, les infrastructures informatiques sont une bête différente. Même si cela promet des capacités transformantes, l’IA peut également être considérée comme une boîte de Pandore, en quelque sorte.
Sous la surface de cette innovation se cache un réseau complexe de coûts cachés qui passent souvent inaperçus jusqu’à ce qu’ils commencent à impacter les budgets et les opérations. Les organisations doivent naviguer à travers ces coûts pour parvenir à une approche équilibrée entre innovation et durabilité financière. Voyons combien l’IA est réellement réalisable.
Investissements en infrastructure et matériel
Les charges de travail en IA exigent une puissance de calcul immense, dépassant souvent les capacités des infrastructures informatiques standard. Cela est particulièrement vrai pour les modèles multi-agents de pointe de Microsoft et OpenAI, mais la plupart de ces solutions ne sont pas destinées à l’organisation moyenne.
Avec OpenAI lancant un abonnement à 200 $/mois, il devient de plus en plus clair que compter sur des tiers n’est pas aussi financièrement judicieux qu’on le pensait au départ. Alors, quelle est l’alternative, alors ?
Une option pour les entreprises est de louer des serveurs GPU hébergés dans des centres de données et de décharger leur infrastructure d’IA. C’est le « point idéal » entre les outils tiers et le déploiement entièrement sur site. Cependant, cela signifie qu’un tiers porte au moins une partie de la responsabilité. Que diriez-vous d’un déploiement entièrement local ?
Un Nvidia H100 va vous coûter environ 28 000 $, tandis qu’un serveur contenant 8 GPU H200 coûte plus de 250 000 $.
Sans oublier que vous aurez besoin de systèmes de refroidissement avancés pour gérer la chaleur significative générée, et ces systèmes peuvent à eux seuls représenter une part substantielle des dépenses opérationnelles. Des alimentations électriques améliorées et un espace physique élargi—parfois nécessitant des installations de centre de données entièrement nouvelles—ajoutent à la charge financière.
Au-delà de ces coûts directs, vous devez également prendre en compte les temps d’arrêt ou les retards pendant la phase d’intégration, impactant davantage la productivité et les budgets. Le coût cumulatif de ces améliorations dépasse souvent les prévisions budgétaires initiales, créant des obligations financières à long terme qui doivent être soigneusement gérées. Et ce n’est que la partie matérielle.
Les coûts d’acquisition et de gestion des données
Une fois que vous avez la bonne infrastructure, il est temps de former et d’affiner les modèles que vous utiliserez. La formation de modèles d’IA nécessite d’énormes quantités de données, souvent provenant de systèmes internes et de fournisseurs tiers. Bien que le coût d’acquisition de jeux de données propriétaires soit minime, les dépenses liées à l’annotation des données, suivies de leur structuration et de leur stockage, sont souvent sous-estimées.
Des données non structurées ou de mauvaise qualité peuvent entraîner des inefficacités et des erreurs dans la formation de l’IA, nécessitant des investissements dans des équipes ou des outils d’ingénierie des données pour préparer les ensembles de données. Vous pouvez utiliser des outils de traitement des données tels que Trifacta ou Alteryx pour rationaliser le processus en automatisant les tâches de nettoyage répétitives.
Cependant, ces outils impliquent des frais de licence et nécessitent des opérateurs qualifiés pour maximiser leur utilité. De plus, vous pouvez envisager d’exploiter des plateformes spécifiques à l’IA comme Databricks pour gérer et structurer les données de manière efficace, mais les coûts sont toujours présents.
À mesure que les ensembles de données augmentent, les coûts de stockage s’élèvent, notamment lorsque les réglementations de conformité exigent une conservation à long terme ou des formats spécifiques. Des solutions de stockage haute performance comme Amazon S3 ou Azure Blob Storage peuvent répondre aux besoins d’évolutivité et de conformité, mais elles facturent souvent des primes pour des fonctionnalités de sécurité avancées ou un stockage spécifique à une région.
Les organisations doivent équilibrer ces exigences avec leurs contraintes budgétaires, en revisitant continuellement les stratégies de stockage pour éviter les dépenses incontrôlées. Cela sans même mentionner la formation, les tests Q&A et le temps passé à manipuler les nouveaux modèles sortis.
Développement et intégration de logiciels
Malgré ce que chaque autre startup pourrait vous dire, l’implémentation de l’IA n’est pas plug-and-play. Du moins si vous ne voulez pas une solution standardisée. Ainsi, personnaliser les logiciels d’IA pour s’aligner sur les besoins commerciaux spécifiques demande des efforts de développement significatifs. Ces efforts incluent l’intégration des systèmes d’IA avec les environnements informatiques existants, ce qui implique souvent la modification des systèmes hérités pour assurer la compatibilité.
Le développement personnalisé entraîne non seulement des dépenses initiales mais aussi des coûts récurrents pour les mises à jour et l’optimisation. En même temps, vous devrez former l’équipe et concevoir le cadre pour de nouveaux flux de travail.
De nombreuses organisations sous-estiment le temps et l’expertise nécessaires pour combler l’écart entre les algorithmes d’IA de pointe et des applications fonctionnelles et fiables. En conséquence, cela conduit à des goulots d’étranglement de développement et à une perte de cohésion.
Risques opérationnels et de conformité des modèles d’IA
Avec une seule incitation de ChatGPT coûtant 900 % d’énergie de plus qu’une recherche Google, il n’est pas un secret que l’IA est gourmande en énergie. Sans oublier que les modèles d’IA nécessitent une surveillance continue et des ajustements fins pour rester efficaces. Les conditions du monde réel changent souvent, rendant les LLMs sujets à la dérive du modèle s’ils ne sont pas surveillés.
Surveiller les performances, retrainer les modèles et s’adapter à de nouveaux ensembles de données demandent une surveillance opérationnelle continue, ce qui se traduit par des dépenses opérationnelles plus élevées. Et si une nouvelle et meilleure API était publiée ? Chaque heure compte, ce qui peut entraîner un cycle vicieux de tests constants, de comparaisons et de changements de processus.
L’IA opère dans un paysage légal et éthique complexe. Garantir la conformité aux réglementations de protection des données telles que le RGPD ou la HIPAA, nécessite des audits approfondis et la mise en place de cadres de gouvernance robustes. Le non-respect peut entraîner de lourdes amendes, des dommages à la réputation, voire des défis juridiques.
Les audits, les certifications et le respect des lignes directrices éthiques en matière d’IA sont souvent traités comme des pensées secondaires, ce qui conduit à des mises en œuvre hâtives et coûteuses plus tard. Répondre à ces exigences de manière proactive implique d’embaucher des experts en droit et en conformité, de réaliser des examens réguliers et de mettre en place des outils automatisés de conformité.
Dépendance à l’automatisation en cloud
Alors que l’automatisation cloud simplifie le déploiement de l’IA en fournissant des environnements évolutifs et flexibles, elle introduit des dépendances cachées. Certes, vous n’êtes peut-être pas accablé par les coûts matériels, mais qu’en est-il de la sécurité ?
En même temps, les organisations qui dépendent fortement des services cloud peuvent rencontrer des difficultés à contrôler les coûts, notamment avec des modèles de tarification dynamique basés sur des métriques d’utilisation. Une dépendance excessive à l’automatisation cloud sans une gestion rigoureuse des coûts peut entraîner des dépassements budgétaires, puisque vous n’êtes pas celui qui contrôle.
Cependant, abandonner complètement l’automatisation cloud n’est pas une solution. La flexibilité qu’elle offre pour mettre à l’échelle les ressources et s’intégrer avec d’autres systèmes informatiques reste inestimable pour l’adoption de l’IA. Le défi réside dans l’optimisation de son utilisation tout en atténuant les risques financiers. Pensez à la gestion des données en cloud hybride, à la fois comme un moyen de diversification et un léger effort vers la décentralisation pour des raisons de sécurité.
Implications en matière de sécurité
Les systèmes d’IA sont des cibles attrayantes pour les cyberattaques en raison de leurs données de grande valeur et de leurs capacités de prise de décision. Par conséquent, maintenir la sécurité des applications d’IA nécessite des investissements dans des outils de cybersécurité avancés, des tests de pénétration et une surveillance continue.
Le point est que—les hackers savent que vous avez alimenté l’IA avec une quantité significative de données et ils n’hésitent pas à les utiliser eux-mêmes à des fins d’ingénierie sociale. Dans certains cas, les entreprises axées sur l’IA doivent réaffecter davantage de fonds pour sécuriser l’infrastructure. De même, les attaques adversariales, où des acteurs malveillants manipulent des modèles d’IA, présentent une menace unique. Il est encore difficile de dire comment établir une protection adéquate.
Exploiter le potentiel de l’IA
L’IA est un outil puissant pour moderniser les infrastructures informatiques, stimuler l’innovation et obtenir des avantages concurrentiels. Pourtant, ses coûts cachés nécessitent une planification, un budget et une gestion continus.
En abordant ces défis de manière holistique, vous pouvez exploiter le potentiel de l’IA tout en maintenant la stabilité financière et opérationnelle. Sans oublier que les choses ne feront que s’améliorer à mesure que nous disposerons de modèles plus puissants et plus avancés.