Un nouveau géant du stockage distribué s’impose face aux géants du cloud
L’essor des entreprises d’intelligence artificielle a poussé la demande en puissance de calcul à des niveaux sans précédent, permettant à des acteurs comme CoreWeave, Together AI et Lambda Labs de capitaliser sur cette croissance en offrant des ressources informatiques distribuées. Pourtant, la majorité des entreprises continuent de stocker leurs données auprès des trois géants du cloud — AWS, Google Cloud et Microsoft Azure — dont les systèmes de stockage ont été conçus pour rester proches de leurs propres infrastructures de calcul, et non pour s’adapter à un environnement distribué ou multi-cloud. Ovais Tariq, cofondateur et PDG de Tigris Data, affirme que « les charges informatiques modernes et les infrastructures d’IA privilégient désormais le calcul distribué plutôt que le cloud centralisé ». Tigris, fondée par l’équipe derrière la plateforme de stockage d’Uber, développe un réseau de centres de stockage localisés capables de répondre aux besoins des charges de travail d’IA distribuées. Sa plateforme, conçue spécifiquement pour l’IA, « suit le calcul, permet une réplication automatique des données là où se trouvent les GPU, gère des milliards de petits fichiers et assure un accès à faible latence pour l’entraînement, l’inférence et les tâches agiles », explique Tariq. Pour concrétiser son projet, Tigris a levé 25 millions de dollars en série A, menée par Spark Capital, avec le soutien d’investisseurs existants comme Andreessen Horowitz. L’entreprise s’oppose directement aux « Big Cloud », selon Tariq, qu’elle juge non seulement plus coûteux, mais aussi moins efficace. Ces fournisseurs imposent des frais d’égress (appelés « taxe cloud ») lorsqu’un client souhaite migrer ses données vers un autre cloud ou les télécharger pour les utiliser ailleurs — une contrainte comparée à payer un supplément pour quitter un gymnase. Selon Batuhan Taskaya, ingénieur en chef chez Fal.ai, un client de Tigris, ces frais représentaient autrefois la majeure partie des dépenses cloud de l’entreprise. En plus de ces coûts, Tariq souligne que la latence reste un problème majeur avec les fournisseurs traditionnels. « Les frais d’égress n’étaient qu’un symptôme d’un problème plus profond : un stockage centralisé incapable de suivre l’écosystème décentralisé et à haute vitesse de l’IA », affirme-t-il. La majorité des plus de 4 000 clients de Tigris sont des startups d’IA générative spécialisées dans les modèles d’images, vidéos ou voix, qui manipulent de grandes quantités de données sensibles à la latence. « Imaginons un agent IA qui traite de l’audio en temps réel : vous voulez que le calcul et le stockage soient locaux, proches, pour garantir la réactivité », précise Tariq. Les grands cloud ne sont pas optimisés pour ces charges, notamment lors du streaming massif de données pour l’entraînement ou l’inférence en temps réel. Le stockage localisé permet une récupération plus rapide des données, améliorant ainsi la fiabilité et la rentabilité des charges distribuées. « Tigris nous permet d’échelonner nos charges dans n’importe quel cloud en accédant au même système de fichiers sans frais d’égress », souligne Taskaya. D’autres facteurs poussent les entreprises à privilégier le contrôle local de leurs données, notamment dans des secteurs réglementés comme la santé ou la finance. En outre, la prise de conscience croissante de la valeur stratégique des données — illustrée par le refus de Salesforce d’autoriser ses concurrents à utiliser les données Slack — pousse les entreprises à vouloir mieux les maîtriser. Avec ces fonds frais, Tigris prévoit d’étendre son réseau de centres de données aux États-Unis, puis en Europe (Londres, Francfort) et en Asie (Singapour), après avoir déjà installé des infrastructures à Virginia, Chicago et San Jose. Depuis sa création en novembre 2021, l’entreprise connaît une croissance annuelle de huit fois. Évaluation : Les experts du secteur saluent la stratégie de Tigris, qui répond à un besoin croissant de flexibilité et de contrôle dans l’infrastructure d’IA. Selon une analyste de Gartner, « le modèle distribué de stockage est désormais indispensable pour les applications d’IA à haut débit ». La capacité de Tigris à éliminer les frais d’égress et à réduire la latence la positionne comme une alternative crédible face aux géants du cloud, surtout pour les startups et les entreprises soucieuses de leur souveraineté et de leurs coûts.