大多数关于企业 AI 落地的讨论都是定性调研或自我报告。Kimberly Tan(a16z 合伙人)用内部数据和与企业高管的对话,给出了一份硬数字。
核心数据
- 29% 的 Fortune 500 已签定自上而下的合同、成功完成 pilot、在组织内正式上线某家 AI 创业公司的产品
- ~19% 的 Global 2000 同样已上线
- 从 OpenAI 2022 年 11 月发布到现在,不过三年出头。这个渗透速度在企业技术采购历史上极为罕见——Fortune 500 向来不是 early adopter。
用例分布:Coding 以外的世界
按营收权重排序,企业 AI 落地的用例高度集中:
Coding:比所有其他用例高出一个数量级,是绝对的主导用例。背后逻辑很清晰——代码是完美的 AI 任务:数据密度高、文本格式、无歧义、可执行验证、紧密的 human-in-the-loop 反馈循环。最好的工程师用 AI 工具后生产力提升 10-20x,ROI 清晰到不需要解释。
Support:与 Coding 处于用例光谱的两端。Support 是被外包给 BPO 的后台工作——高容量、高周转、有清晰的 SOP 定义。AI 在这里天然适配:有自然的人类接管出口(escalate to manager),ROI 可量化(ticket 量、CSAT、解决率),且客户对服务方是机器还是人不敏感。
Search:企业内部的跨系统信息检索。Glean 是这个领域的主要创业公司。法律搜索(Relius)、医疗搜索是更细分的赛道。
行业分布:意外的早鸟
Tech:最不出意外的 adoption 领先者。ChatGPT 报告 50% 的收入来自 tech 公司。
Legal:真正的意外。法律行业历来以采购周期长、不接受新技术闻名。但 AI 的文本解析、推理、总结和起草能力与律师的日常工作高度匹配。Eve、Harvey 等公司在 3 年内 ARR 做到惊人水平。
Healthcare:对传统软件响应迟缓,但对 AI 表现出前所未有的热情。医疗 scribes、医疗搜索、行政自动化——这些离散用例绕过了 EHR 系统,不需要 rip-and-replace,因此能快速扩展。
为什么有些能力强的领域落地慢?
Kimberly Tan 的分析框架:GDPval 衡量模型相对人类专家的胜率,但胜率和经济价值之间不是线性关系。
落地顺利的行业有一个共同特征:
- 基于文本
- 包含重复性工作
- 有自然的人类介入点
- 监管有限
- 输出可验证(代码能跑、ticket 能解决)
不满足这些条件的领域,即使模型能力理论上很强,落地也慢。会计和审计在最近 4 个月 GDPval 跳升 20%,预示着新一波机会。
对 AI 创业者的含义
- Coding 是上游:所有软件都依赖代码构建,AI 对代码的加速会向下游所有领域传导
- Legal 和 Healthcare 不是赢家通吃:不同类型律师(in-house、law firm、patent、plaintiff)有完全不同的工作流,Healthcare 的医生种类更多,细分机会远未饱和
- 关注能力到位但还没有 breakout 公司出现的领域:这些领域的基础设施和客户认知已经就绪,等模型能力到位就会爆发
- Long-horizon agents、computer use、跨模态(spreadsheets、presentations)是下一波基础设施
这份指南的"5种典型失败"诊断框架值得内化到任何 Skills 开发流程里。Silent Skill/Hijacker/Drifter/Fragile Skill/Overachiever 对应了 YAML description 写得太弱、缺少负面边界、指令不够具体、缺少 edge case 处理、缺少 scope 约束——每一种都是可以在写 SKILL.md 之前就预防的。5步测试协议也是实操性很强的质量门禁。