Fluid Compute 是 Vercel 推出的一项面向 AI 工作流的计算基础设施服务。它专为运行 AI 相关任务而设计,旨在解决传统 Serverless 架构在处理长时运行、流式响应及高并发 AI 推理任务时的局限性。Fluid Compute 允许单个函数实例同时处理多个请求,并在请求间隙暂停计费,从而在保持弹性伸缩能力的同时降低运行成本。适合需要在 Vercel 平台上构建和部署 AI 应用、智能体工作流或集成大语言模型 API 的开发者和团队使用。对于已经使用 Next.js 或 Vercel 部署的项目,Fluid Compute 可以作为其 AI 功能的计算层,无需额外搭建独立的后端基础设施。
✓ 优点
✗ 不足
普通 Serverless Functions 通常一个实例只处理一个请求,而 Fluid Compute 允许单个实例并发处理多个请求,并在空闲时暂停计费,更适合 AI 推理这类请求耗时较长、并发量波动大的场景。
如果项目已部署在 Vercel 上,接入 Fluid Compute 通常不需要大幅重写代码。它作为计算层集成在 Vercel 平台中,主要通过配置启用,但具体迁移成本取决于项目的现有架构。
🏷 相关标签