Startup mise sur le tokenmaxxing pour créer le prochain géant du calcul
Parasail est une startup spécialisée dans les services cloud d'inférence par IA générative qui s'efforce de devenir un géant du calcul futur en optimisant ses coûts. Son PDG, Mike Henry, ancien employeur chez le fabricant de puces Groq, connaît bien la demande des développeurs pour une puissance de calcul rapide et peu coûteuse. Parasail affirme traiter jusqu'à 50 milliards de jetons IA par jour ; son modèle économique central ne repose pas sur la possession de puces propres mais sur la location de capacités de calcul provenant de 40 centres de données situés dans 15 pays à travers le monde, combinée à l'utilisation de ressources de marché liquide afin d'optimiser intelligemment les flux et réduire les coûts d'inférence en aval. L'entreprise vient juste de lever 32 millions de dollars lors d'un tour de table série A visant à mettre cette offre à l'échelle pour répondre à ce besoin croissant. Avec le développement des applications IA, les architectures hybrides gagnent progressivement du terrain. De nombreuses entreprises comme Elicit commencent à privilégier les modèles open-source pour le filtrage préliminaire, réservant uniquement aux tâches complexes les modèles avancés onéreux, équilibrant ainsi coût et performance. Cette tendance découle principalement des frais élevés et des limites inhérents à l'utilisation des API de leaders tels qu'OpenAI et Anthropic. La montée en puissance de Parasail vise précisément à absorber cette immense demande d'inférence pilotée par les modèles open-source et les agents autonomes. Selon l'investisseur Samir Kumar, au moins 20 % des futurs coûts de construction logicielle seront consacrés à l'inférence. Contrairement aux fournisseurs cloud traditionnels servant majoritairement les grandes entreprises, Parasail refuse explicitement toute activité d'entraînement et se concentre exclusivement sur l'inférence tout en acceptant volontiers les startups sans engagement à long terme. Bien que sa clientèle soit composée en grande partie de jeunes pousses présentant un risque élevé, les investisseurs considèrent que, avec la généralisation des modèles IA dans la génération de contenu et la robotique, la demande d'inférence dépassera largement l'offre. Steve Jang, partenaire chez Kindred Ventures, souligne qu'il n'existe aucune bulle spéculative dans le secteur de l'IA : le modèle actuel de courtage informatique constitue justement la clé pour résoudre cet déséquilibre entre l'offre et la demande.
