a16z 和 YC 对 AI 时代基础设施的看法
今天整理了下 a16z Big Ideas 2026、Jennifer Li 访谈、YC Requests for Startups 2025–2026 中对基础设施层(数据库、存储、消息、中间件、计算)的讨论和看法。觉得挺有价值的。
核心判断:设计假设变了,不是功能不够
a16z 在 Big Ideas 2026 里说:现有企业后端是按人机 1:1 设计的,一个人触发一个请求,系统响应一次。这个假设在 Agent 时代站不住了。一个 Agent 的单次目标,可能在毫秒内触发 5000 个子任务、数据库查询、内部 API 调用的递归 fan-out。对传统数据库和限流器来说,Agent 的行为模式和 DDoS 没有区别。
他们的结论是:控制平面需要重新设计,"agent-native 基础设施"会出现,下一代系统必须把 thundering herd 当成默认状态,而不是异常。
他们认为这不是现有系统功能不够的问题,是设计假设在 Agent 场景下根本就是错的。并发模型、访问主体、事务边界、流量形态全变了。
Jennifer Li 是 a16z infra 团队的负责人,她的表述是:
"AI infrastructure is being rebuilt from scratch, not just upgraded. Everything running AI workloads today — storage, compute, orchestration, memory — was built for a different era. The entire stack is being rewired in real time."
这里面有四个部分:storage、compute、orchestration、memory。memory 被单独列出来,这是 AI 时代新增的一部分,传统 infra 里没有这个概念。
a16z 的投资层次
有个有意思的数据,a16z 从 150 亿美元的新基金里划了 17 亿给 infra 团队,是所有方向里最大的单笔。Jennifer Li 的投资框架覆盖从芯片设计到开发者软件栈的整条链路。
compute 层:GPU 集群、推理优化、硬件架构。这层 a16z 认为机会仍在,但他们寻找的不是卖算力的公司,而是"控制决策层"的公司,决定算力如何分配、模型如何部署、成本如何优化的软件。这类控制点在 AI 系统规模化后越来越值钱,逻辑和云时代的编排层类似。
storage 层:AI 工作负载需要的存储和传统对象存储的设计假设不同,也就是要更靠近计算、要支持非结构化和多模态数据、要支持向量检索。存储正在从事后考虑变成 AI pipeline 的核心组件。
orchestration 层:Agent 工作流编排,如何把高层目标拆解成可执行步骤,如何处理长时间运行的任务、重试、状态管理。这层目前很混乱,没有标准答案。
memory 层:传统 infra 完全没有的新层。Agent 需要跨会话记住上下文、任务状态、过去的决策,这不是数据库,不是缓存,是一个新的基础设施原语。
data pipeline 和数据系统层:Jennifer Li 明确说传统数据管道需要重新做。大量企业数据被困在 PDF、Zoom 录音、Slack 消息里,AI Agent 没法直接消费。谁能把这些结构化,谁就能解锁大量企业自动化场景。
a16z 对数据库的判断:从记录系统到执行层
a16z 对数据库地位变化的判断:
"In 2026, the strategic layer shifts upward. The system that understands intent and executes workflows becomes the product users care about. The database underneath becomes a commodity. Founders should build for execution, not storage."
数据库不消失,但战略地位在下降。护城河从"谁拥有数据"变成了"谁拥有执行层"。
Oracle 的动作形成了有趣的对照,它在反向操作,试图把消息队列、向量检索、AI 推理全塞进数据库,把数据库本身做成执行层。a16z 的判断是执行层是新战场,但不一定由数据库公司赢。
YC 的信号:RFS 的演变
YC 的 Requests for Startups 是比较可靠的信号来源,因为它来自看了大量真实 pitch 之后的总结,不是凭空预测。以下是 2025–2026 中和基础设施相关的方向。
Spring 2025(Agent 浪潮的起点):这次 RFS 第一次明确提了几个方向:B2A(软件的客户是 Agent,不是人,API 设计、文档格式、权限模型要为机器重新设计);Devtools for Agents(管理、部署、监控 Agent 的工具);Secure AI App Store(Agent 运行环境的安全隔离)。这批奠定了后续几批的基调:Agent 是新的用户类型,现有软件和基础设施都没有按这个假设设计。
Summer 2025:这次聚焦消费者方向,基础设施信号少。但出现了 Inference AI Infrastructure in the World of Test-Time Compute,说明 YC 意识到推理和训练需要两套不同的基础设施,这是一个重要的工程判断。
Fall 2025(最聚焦的一批,只有 6 个方向):6 个里直接有一个是 Multi-Agent Infrastructure,说明 YC 在这个时间点已经把多 Agent 系统的基础设施问题列为最高优先级。另一个方向"The First 10-person $100B Company"的潜台词是:AI 基础设施能让极小的团队运营极大的系统,基础设施的杠杆效应在这个时代被放大到新的量级。
Spring 2026:AI-Native Enterprise Software:不是在现有系统上加 AI 功能,而是从零重建。YC 的表述是"不能被 retrofit 的东西才有机会",这句话是整个基础设施重建逻辑的核心。Multi-Agent Systems 也在这批出现,关注 Agent 之间的协调、通信、权限管理。
Summer 2026(最新,也是最激进的一次)
两个和基础设施直接相关的方向:
Software for Agents:现有软件是给人设计的,有 GUI、有鼠标点击流程、有人能容忍但机器不能容忍的模糊性。Agent 是不同类型的用户,需要机器可读的 API、CLI、MCP,需要 identity systems、permissions layers、payment infrastructure 全部为自主程序重新设计。YC 的原话是:"APIs, machine-readable documentation, command-line interfaces, identity systems, permissions layers, and payment infrastructure designed for autonomous programmes."
Company Brain:每个公司的关键知识散在各处——邮件、Slack、数据库、人的脑子里。AI Agent 没法在这种状态下工作。需要一个新的基础设施原语,把碎片化的知识结构化、保持更新、变成 Agent 可以执行的技能文件。这不是搜索,不是 RAG,是一个新的基础设施层。
YC 中具体公司的信号
YC W26 和 Spring 2026 中,infra 方向的公司分布给出了更具体的信号。几个明确的子方向:
Auth/Identity:Agent 身份管理,谁授权 Agent 做什么。这在微服务时代有 OAuth,但 Agent 的身份模型完全不同,Agent 会代表人行动,权限边界更复杂。
Observability:Agent 做了什么、出了什么问题。Moda(W26)定位是"Datadog for agents" ,微服务时代的 Datadog 是基础设施,Agent 时代的 observability 也会是。
Testing:Agent 行为的测试和验证,传统单元测试的框架解决不了 Agent 的不确定性问题。
Payments for Agents:Agent 自主完成交易的支付基础设施。Maven(W26)在做 voice agent 的支付层。
Communication for Agents:YC Spring 2026 收了 primitive.dev,描述是"communication infrastructure for fully autonomous agents",前 Microsoft/AWS/FB/Google 工程师在做。
这几个子方向加在一起,是 Agent 时代新增的基础设施层:identity、observability、testing、payments、communication。传统微服务时代都有对应物,但针对 Agent 的设计假设完全不同,对应物不能直接复用。
一个讨论不多但影响面可能最大的方向
流量模型变化对现有中间件的冲击。
a16z 说"thundering herd as default state",YC 的分析里也提到"procurement is going machine-to-machine,reliability and determinism matter"。但这个方向目前在公开讨论里远没有 Agent framework 和 RAG 热。
比如现有消息队列按人工触发的业务流量设计,峰值可预测,流量平滑。Agent 的流量不是这样:突发、递归、并发极高,而且 Agent 之间的通信还需要语义层(能力发现、身份验证、权限检查),不只是消息传输。
现有限流器按人的请求速率设计,Agent 的速率直接超出量级。
现有数据库的连接池、事务模型按人机交互的响应时间设计,Agent 的并发访问模式完全不同。
这些是设计假设层面的问题,加参数解决不了,需要重新设计。这是真实的工程问题,不是叙事。
a16z 明确不看好的方向
Jennifer Li 有一个明确的保留态度:很多 AI infra 创业公司是被未来需求假设估值,不是被当前真实需求支撑。a16z 的判断是大量 AI 基础设施公司被过度估值。
他们认为真正有价值的是:控制决策层的软件(决定算力如何分配、模型如何部署),而不是只卖算力的公司;能降低异构硬件环境复杂度的公司;真正能把非结构化企业数据变成 Agent 可消费格式的公司。
不看好的是:没有控制层护城河、只靠 AI 叙事估值、没有真实收入支撑的公司。
总结
a16z 和 YC 的判断有一个共同的底层逻辑:AI 对传统基础设施的冲击不在功能层,在设计假设层。
传统基础设施的四个核心假设在 Agent 时代同时失效:请求来自人、速率可预测;访问主体有 UI;系统边界清晰、各层独立;数据是结构化的。
这四个假设的失效,对应四类重建机会:流量基础设施、接口层、中间件整合、数据结构化。目前最确定的是接口层(Software for Agents)和数据结构化(Company Brain),流量基础设施和中间件整合讨论还不充分,但从工程角度看是真实的问题。
