AI推理基础设施公司硅基流动(SiliconFlow)成立不到三年,于6月30日向港交所递交IPO申请。这家以聚合异构算力、提供标准化Token服务知名的公司,在用户数和收入高速增长的背后,毛利率却连续下滑,2025年已为负值。
## 一家“卖Token”的AI基础设施公司
硅基流动成立于2023年8月,定位为中国领先的开放、独立Token供应平台。本质上,它是一家AI推理基础设施公司,通过自研推理引擎和算力编排系统,将英伟达、AMD、昇腾、沐曦、摩尔线程等异构算力聚合起来,转化为标准化的Token供应。
其商业模式分为两条线:一是面向开发者和中小企业的公有云服务(含无服务器Token服务和专属实例),二是面向大企业的本地部署解决方案。按2025年Token年吞吐量计算,它是中国最大的独立生态Token供应商,在所有Token供应商中位列前五。
## 增长数据背后的冷峻现实
招股书披露的运营数据堪称华丽:注册用户从2024年底的12.7万暴增至2025年末的919.7万,再到2026年4月底的1028.2万,两年多冲破1000万;日均Token吞吐量从2024年12月至2026年4月增长12倍;付费客户从2455个增至71.6万,一年增长了292倍。
然而,这些漂亮的增长数字并未转化为健康的盈利。2025年,硅基流动收入5533万元,但销售成本却高达6863.2万元,占收入的124%。这意味着,它每卖出一块钱的Token,背后要付出1.24元的算力等成本,毛利率为-24%。当年毛亏1330.2万元。
## 一门亏本卖Token的生意
硅基流动的毛利率轨迹呈现出急速下滑的态势:2023年为83.3%,2024年降至39.4%,2025年直接跌入负数区间。这背后是AI推理Token价格战的直接映射。大模型API价格持续走低,大厂纷纷将Token单价打到地板价,作为中间层的硅基流动承受着巨大的成本压力。
成本的绝大部分来自算力租赁。2025年,算力资源成本5962.7万元,占销售成本的86.9%。招股书解释称,销售成本大增正是快速扩大算力资源消耗以支持不断增长的服务需求所致。这意味着,用户增长越快,烧钱速度越快。
除销售成本外,研发和销售费用同样惊人。2025年研发开支2.09亿元,是收入的378.1%;销售及营销开支8374.3万元,是收入的151.4%。两项合计近3亿元,而当年收入仅为5533万元。结果是,2023年至2025年净亏损分别为1222.3万元、8191.5万元和3.45亿元,2025年净亏损率高达-624.4%。
即便按经调整口径计算,加回股份支付和赎回负债利息后,2025年经调整净亏损仍达1.871亿元。经营活动现金流连续三年为净流出,2025年流出1.72亿元。好在公司历经七轮融资,2025年末现金及等价物尚有1.71亿元。
## 风险与隐忧
从收入结构看,2025年公有云服务占比52.9%(含无服务器Token服务1430万元和专属实例1500万元),本地部署解决方案占比47.1%。其中无服务器付费客户增长最快,从2455个增至71.6万,但这类客户多为低价消耗,单价低且需要贴着成本甚至低于成本供给。
硅基流动并非直接购买芯片,而主要通过合作方租赁算力资源。招股书募资用途中,多个大项都写明资金将用于租赁算力资源。其五大供应商(算力及云服务商)采购集中度高,2025年五大供应商占采购额70.8%,最大单一供应商占比20.4%。更值得注意的是,有两名主要业务伙伴同时是客户又是供应商。
此外,硅基流动在风险提示中坦言,在很大程度上依赖高质量开源AI模型的可得性。一旦模型停止开源或授权条件发生变化,其核心供给就会受到冲击。
## 行业镜像:AI基础设施公司的商业化困局
硅基流动的IPO申请,折射出当前AI基础设施公司的普遍困境:在AI大模型引发资本狂欢的背景下,用户和收入增长迅速,但商业化路径依然模糊。Token作为AI推理的核心计量单位,已成为价格战的主战场。大厂凭借规模优势压低价格,独立供应商则陷入“不烧钱就无法增长,烧钱就持续亏损”的囚徒困境。
从技术创新角度看,硅基流动的异构算力聚合和推理引擎优化,确实解决了一部分市场痛点。但资本市场最终要看的是单位经济模型和可持续盈利能力。在当前的行业格局下,独立Token供应商要走出亏损泥潭,要么依赖规模效应摊薄成本,要么找到差异性定价的空间。
对于硅基流动而言,IPO只是第一步。如何从“卖流量”转向“卖价值”,如何控制成本结构从负毛利走向正循环,将是上市后必须面对的硬仗。
