初创公司发力分布式存储,誓挑战云巨头霸权
随着AI公司对算力需求激增,以CoreWeave、Together AI和Lambda Labs为代表的分布式计算服务商迅速崛起,吸引了大量资本与关注。然而,绝大多数企业仍依赖AWS、谷歌云和微软Azure这三大云巨头进行数据存储。这些传统云存储系统设计初衷是将数据与自身算力紧密绑定,难以适应如今跨云、跨区域的分布式AI工作负载。 Tigris Data创始人兼CEO奥维斯·塔里克(Ovais Tariq)指出:“现代AI基础设施正转向分布式计算,但存储却仍被锁定在中心化云中。没有高效的存储,算力就毫无意义。” Tigris由曾打造Uber存储平台的团队创立,正构建一个分布式的本地化数据存储网络,旨在与AI算力同步移动。 该公司推出的AI原生存储平台支持数据自动复制到GPU所在位置,可处理数十亿个小文件,提供低延迟访问,适用于训练、推理和智能体(agentic)等高要求场景。其核心优势在于打破传统云的“数据孤岛”——无需支付高昂的出站费用(即业内俗称的“云税”),即可在多云环境间自由访问统一文件系统。 Tigris近期完成2500万美元A轮融资,由Spark Capital领投,Andreessen Horowitz等现有投资者也参与其中。塔里克认为,大云厂商不仅收费昂贵,且架构效率低下。例如,若企业想将数据迁移到其他云平台或在不同地区并行训练模型,往往需支付巨额出站费,如同健身房额外收取“离场费”。 据Tigris客户Fal.ai工程负责人巴图汉·塔萨亚(Batuhan Taskaya)透露,过去出站费用一度占其云支出的绝大部分。此外,集中式存储还带来显著延迟,制约了AI模型的实时性能。 目前,Tigris已有超4000家客户,主要为生成式AI初创企业,专注于图像、视频和语音模型开发,这些应用对数据延迟极为敏感。塔里克比喻道:“当你与本地AI语音助手对话时,算力和存储都必须就近,才能实现毫秒级响应。” 除了成本与延迟,数据主权也成为企业选择Tigris的重要原因。在金融、医疗等监管严格的领域,企业越来越希望掌控自身数据。此外,Salesforce此前禁止AI对手使用Slack数据,也凸显了企业对数据控制权的重视。 凭借每年8倍的增长速度(自2021年11月成立以来),Tigris已在美国弗吉尼亚、芝加哥和圣何塞建立三座数据中心,并计划扩展至伦敦、法兰克福和新加坡,进一步构建全球分布式存储网络,以应对AI时代对数据基础设施的全新挑战。