a16z 和 YC 对 AI 时代基础设施的看法

今天整理了下 a16z Big Ideas 2026、Jennifer Li 访谈、YC Requests for Startups 2025–2026 中对基础设施层（数据库、存储、消息、中间件、计算）的讨论和看法。觉得挺有价值的。

核心判断：设计假设变了，不是功能不够

a16z 在 Big Ideas 2026 里说：现有企业后端是按人机 1:1 设计的，一个人触发一个请求，系统响应一次。这个假设在 Agent 时代站不住了。一个 Agent 的单次目标，可能在毫秒内触发 5000 个子任务、数据库查询、内部 API 调用的递归 fan-out。对传统数据库和限流器来说，Agent 的行为模式和 DDoS 没有区别。

他们的结论是：控制平面需要重新设计，"agent-native 基础设施"会出现，下一代系统必须把 thundering herd 当成默认状态，而不是异常。

他们认为这不是现有系统功能不够的问题，是设计假设在 Agent 场景下根本就是错的。并发模型、访问主体、事务边界、流量形态全变了。

Jennifer Li 是 a16z infra 团队的负责人，她的表述是：

"AI infrastructure is being rebuilt from scratch, not just upgraded. Everything running AI workloads today — storage, compute, orchestration, memory — was built for a different era. The entire stack is being rewired in real time."

这里面有四个部分：storage、compute、orchestration、memory。memory 被单独列出来，这是 AI 时代新增的一部分，传统 infra 里没有这个概念。

a16z 的投资层次

有个有意思的数据，a16z 从 150 亿美元的新基金里划了 17 亿给 infra 团队，是所有方向里最大的单笔。Jennifer Li 的投资框架覆盖从芯片设计到开发者软件栈的整条链路。

compute 层：GPU 集群、推理优化、硬件架构。这层 a16z 认为机会仍在，但他们寻找的不是卖算力的公司，而是"控制决策层"的公司，决定算力如何分配、模型如何部署、成本如何优化的软件。这类控制点在 AI 系统规模化后越来越值钱，逻辑和云时代的编排层类似。

storage 层：AI 工作负载需要的存储和传统对象存储的设计假设不同，也就是要更靠近计算、要支持非结构化和多模态数据、要支持向量检索。存储正在从事后考虑变成 AI pipeline 的核心组件。

orchestration 层：Agent 工作流编排，如何把高层目标拆解成可执行步骤，如何处理长时间运行的任务、重试、状态管理。这层目前很混乱，没有标准答案。

memory 层：传统 infra 完全没有的新层。Agent 需要跨会话记住上下文、任务状态、过去的决策，这不是数据库，不是缓存，是一个新的基础设施原语。

data pipeline 和数据系统层：Jennifer Li 明确说传统数据管道需要重新做。大量企业数据被困在 PDF、Zoom 录音、Slack 消息里，AI Agent 没法直接消费。谁能把这些结构化，谁就能解锁大量企业自动化场景。

a16z 对数据库的判断：从记录系统到执行层

a16z 对数据库地位变化的判断：

"In 2026, the strategic layer shifts upward. The system that understands intent and executes workflows becomes the product users care about. The database underneath becomes a commodity. Founders should build for execution, not storage."

数据库不消失，但战略地位在下降。护城河从"谁拥有数据"变成了"谁拥有执行层"。

Oracle 的动作形成了有趣的对照，它在反向操作，试图把消息队列、向量检索、AI 推理全塞进数据库，把数据库本身做成执行层。a16z 的判断是执行层是新战场，但不一定由数据库公司赢。

YC 的信号：RFS 的演变

YC 的 Requests for Startups 是比较可靠的信号来源，因为它来自看了大量真实 pitch 之后的总结，不是凭空预测。以下是 2025–2026 中和基础设施相关的方向。

Spring 2025（Agent 浪潮的起点）：这次 RFS 第一次明确提了几个方向：B2A（软件的客户是 Agent，不是人，API 设计、文档格式、权限模型要为机器重新设计）；Devtools for Agents（管理、部署、监控 Agent 的工具）；Secure AI App Store（Agent 运行环境的安全隔离）。这批奠定了后续几批的基调：Agent 是新的用户类型，现有软件和基础设施都没有按这个假设设计。

Summer 2025：这次聚焦消费者方向，基础设施信号少。但出现了 Inference AI Infrastructure in the World of Test-Time Compute，说明 YC 意识到推理和训练需要两套不同的基础设施，这是一个重要的工程判断。

Fall 2025（最聚焦的一批，只有 6 个方向）：6 个里直接有一个是 Multi-Agent Infrastructure，说明 YC 在这个时间点已经把多 Agent 系统的基础设施问题列为最高优先级。另一个方向"The First 10-person $100B Company"的潜台词是：AI 基础设施能让极小的团队运营极大的系统，基础设施的杠杆效应在这个时代被放大到新的量级。

Spring 2026：AI-Native Enterprise Software：不是在现有系统上加 AI 功能，而是从零重建。YC 的表述是"不能被 retrofit 的东西才有机会"，这句话是整个基础设施重建逻辑的核心。Multi-Agent Systems 也在这批出现，关注 Agent 之间的协调、通信、权限管理。

Summer 2026（最新，也是最激进的一次）

两个和基础设施直接相关的方向：

Software for Agents：现有软件是给人设计的，有 GUI、有鼠标点击流程、有人能容忍但机器不能容忍的模糊性。Agent 是不同类型的用户，需要机器可读的 API、CLI、MCP，需要 identity systems、permissions layers、payment infrastructure 全部为自主程序重新设计。YC 的原话是："APIs, machine-readable documentation, command-line interfaces, identity systems, permissions layers, and payment infrastructure designed for autonomous programmes."
Company Brain：每个公司的关键知识散在各处——邮件、Slack、数据库、人的脑子里。AI Agent 没法在这种状态下工作。需要一个新的基础设施原语，把碎片化的知识结构化、保持更新、变成 Agent 可以执行的技能文件。这不是搜索，不是 RAG，是一个新的基础设施层。

YC 中具体公司的信号

YC W26 和 Spring 2026 中，infra 方向的公司分布给出了更具体的信号。几个明确的子方向：

Auth/Identity：Agent 身份管理，谁授权 Agent 做什么。这在微服务时代有 OAuth，但 Agent 的身份模型完全不同，Agent 会代表人行动，权限边界更复杂。

Observability：Agent 做了什么、出了什么问题。Moda（W26）定位是"Datadog for agents" ，微服务时代的 Datadog 是基础设施，Agent 时代的 observability 也会是。

Testing：Agent 行为的测试和验证，传统单元测试的框架解决不了 Agent 的不确定性问题。

Payments for Agents：Agent 自主完成交易的支付基础设施。Maven（W26）在做 voice agent 的支付层。

Communication for Agents：YC Spring 2026 收了 primitive.dev，描述是"communication infrastructure for fully autonomous agents"，前 Microsoft/AWS/FB/Google 工程师在做。

这几个子方向加在一起，是 Agent 时代新增的基础设施层：identity、observability、testing、payments、communication。传统微服务时代都有对应物，但针对 Agent 的设计假设完全不同，对应物不能直接复用。

一个讨论不多但影响面可能最大的方向

流量模型变化对现有中间件的冲击。

a16z 说"thundering herd as default state"，YC 的分析里也提到"procurement is going machine-to-machine，reliability and determinism matter"。但这个方向目前在公开讨论里远没有 Agent framework 和 RAG 热。

比如现有消息队列按人工触发的业务流量设计，峰值可预测，流量平滑。Agent 的流量不是这样：突发、递归、并发极高，而且 Agent 之间的通信还需要语义层（能力发现、身份验证、权限检查），不只是消息传输。

现有限流器按人的请求速率设计，Agent 的速率直接超出量级。

现有数据库的连接池、事务模型按人机交互的响应时间设计，Agent 的并发访问模式完全不同。

这些是设计假设层面的问题，加参数解决不了，需要重新设计。这是真实的工程问题，不是叙事。

a16z 明确不看好的方向

Jennifer Li 有一个明确的保留态度：很多 AI infra 创业公司是被未来需求假设估值，不是被当前真实需求支撑。a16z 的判断是大量 AI 基础设施公司被过度估值。

他们认为真正有价值的是：控制决策层的软件（决定算力如何分配、模型如何部署），而不是只卖算力的公司；能降低异构硬件环境复杂度的公司；真正能把非结构化企业数据变成 Agent 可消费格式的公司。

不看好的是：没有控制层护城河、只靠 AI 叙事估值、没有真实收入支撑的公司。

总结

a16z 和 YC 的判断有一个共同的底层逻辑：AI 对传统基础设施的冲击不在功能层，在设计假设层。

传统基础设施的四个核心假设在 Agent 时代同时失效：请求来自人、速率可预测；访问主体有 UI；系统边界清晰、各层独立；数据是结构化的。

这四个假设的失效，对应四类重建机会：流量基础设施、接口层、中间件整合、数据结构化。目前最确定的是接口层（Software for Agents）和数据结构化（Company Brain），流量基础设施和中间件整合讨论还不充分，但从工程角度看是真实的问题。

a16z 和 YC 对 AI 时代基础设施的看法 ​

核心判断：设计假设变了，不是功能不够 ​

a16z 的投资层次 ​

a16z 对数据库的判断：从记录系统到执行层 ​

YC 的信号：RFS 的演变 ​

YC 中具体公司的信号 ​

一个讨论不多但影响面可能最大的方向 ​

a16z 明确不看好的方向 ​

总结 ​