客户接入时几乎都会问云 egress 费用的问题。任何跑在你云账户外部的公共服务,调用时都要收全量 egress——哪怕实际在同一个区域。很坑,但大客户可以走私有网络绕开。
有一次聊 Databricks 收购,问他们怎么处理客户对 egress 的不满。对方说:"从来没被问过。"——史上最大无服务器数据库提供商,客户居然不担心 egress?为什么?
后来又和人聊 Archil,对方脱口而出:"你们和 WarpStream 有一样的问题吧?大家都在担心 egress,因为客户必须 1:1 读取放进服务的每一个字节。"那一刻,Hunter 开窍了。
数据库和文件系统的本质区别
在数据库里做搜索:发送查询语句,数据库内部执行计算,只返回匹配结果。
在文件系统里做搜索:你的机器把每个要搜索的文件全部下载到内存里,本地找匹配。
一次搜索在文件系统上可能是 100GB egress,在数据库上可能不到 2KB。数据库传输的是和数据交互的指令。文件系统传输的是原始数据本身。
洞察:Bash 就是文件系统的 SQL
既然数据库能嵌入计算,文件系统也可以。
让客户端发送 bash 命令,在文件系统内部执行,只返回结果——不传输原始数据。
好处:
- 零 egress 费用
- 无延迟焦虑
- 无需预估实例规格
- 执行层可以在内部做 planner 优化、跨计算资源分发
这正是 Archil 正在做的事——serverless execution,文件系统内置计算作为一等公民。
对 AI 的影响
AI 时代是大多数开发者第一次必须思考有状态系统:对话历史、提示词、记忆、上下文都是状态管理问题。Serverless execution 会成为这个技术栈的关键基础设施。
Archil 宣布 serverless execution 今日向所有 Archil 文件系统推送。
这个类比很准但不够深——Bash 作为指令语言的问题是没有类型、没有 schema、没有 planner。真正类似 SQL 的是有结构的查询计划,不是 bash 本身。不过对于无结构文件存储来说,这个方向是对的。