预测世界的执念：从量化交易到人类命运

一个从未公开的动机

sysls（@systematicls）说他从没公开写过这件事。驱动他投入几乎所有时间的，是一个执念：

建造一个世界模型，精通到能预测世界，从而消除所有市场——公共或私人——中的低效性。

如果你看过《西部世界》，他说的就是 Rehoboam 那种东西：一个能映射人类行为、预测未来的超级智能。有趣的是，Rehoboam 最初就是一个预测股价的模型。

金融市场是预测能力的终极试验场。它横跨各种时间尺度，而且具备极强的可扩展性和正反馈循环：

你预测得越准 → 获得越多资源 → 变得更能预测 → 循环往复。

他最害怕的是：在实现"预测社会所有有用事物"的宏大野心之前死去，然后被永远记住的只是一个"为了赚钱而赚钱"的人。

他相信可以建造一个实体，精通预测到能最小化所有人类系统中的低效性。一个能引导人类做出比启发式或随机猜测更好决策的世界模型。

这意味着：

他认为人类在与时间赛跑。作为物种，我们有限的时间来突破当前牢笼的边界。面对有限资源，必须最大化效率，才能在耗尽或条件恶化之前到达下一个边界。

如果我们在资源耗尽或离开变得不可能之前，没能找到逃离地球的方法，我们将不可避免地作为一个物种死在自己建造的监狱里。

他引用惠特曼的诗《啊，我！啊，生命！》——希望他的"诗篇"是一个让人类更高效、把到达下一个边界的概率推高一点的实体。

他从少年时代就痴迷预测。物理学的精确预测能力让他着迷：简单模型有深远含义，它们证明预测是可能的——只要知道足够的初始条件和系统参数，就能知道物体最终会落在哪里。

我们把系统建模为随机，只有当我们的预测不比猜测更好时——也就是没有足够信息生成优于随机的预测时。

以抛硬币为例：没有额外信息时，正反各 50% 是最佳预测。但如果知道硬币初始面朝、抛掷高度、施力大小、硬币尺寸质量、落点材质，就能构建出显著优于随机的预测模型。

他相信决定论有极限，但人类系统的预测潜力我们才刚触及表面。传统上，我们需要的数据要么极度稀疏，要么极度非结构化，而能找到高维数据中泛化模式的模型和算力之前并不存在。

核心原则：给定足够强大的模型，更多相关数据带来更好的预测——即使系统变得更复杂也成立。

所以一个试图预测世界的实体需要尽可能积累数据。近几年 LLM 的出现让我们学到：只要数据和模型的规模与复杂度足够，某种形式的智能就会涌现。

数据本身是被动的。需要模型把数据转化为实际预测。而且哪个模型最适合产生有用预测是个非平凡问题——感谢"没有免费午餐"定理。

机器学习的进步给了一个相当满意的解法：让数据决定模型的形式，而不是让理论决定。

真正庞大而强大的机器学习模型能捕捉高维模式并泛化，因为驱动它们的底层行为是可靠重复的。

这意味着存在一个世界：我们可以用一个创业者关注的 Substack 或订阅的播客作为特征，在他甚至还没注册公司之前，预测他成功的概率。

我们关心的模式更多是关于他的欲望、驱动力、世界观，而不是他每天怎么花 20 分钟。我们可以从旁侧数据中窥见这些信念。

更进一步，我们或许可以从一个人的童年经历、信仰体系、属性和性格中，在他成年之前就了解他的潜力。把资本分配到世界上那些注定会被浪费的天才身上，不是很好吗？

我们知道需要海量数据和算力来训练巨型模型学习高维模式。这 translates to 极其昂贵的 endeavor，但好消息是：数据和算力每天都在变便宜，非结构化数据在 LLM 的解析能力下越来越不是问题。我们也在变得惊人地擅长训练能在人类心智无法想象的维度中学习模式的巨型 god model。

但要建造这种规模的东西，需要一个能逐步资助其规模和野心的业务。从流动性市场的预测起步，再逐步进入更难的市场和系统，似乎是显而易见的选择。

所以，如果他死的时候还在运行一个看起来像简单现金抓取工具的东西，要知道他的耻辱是无法衡量的——那从来不是终点。

这篇文章他其实 2023 年就写好了（有 Substack 编辑历史为证），不是为了给 openforage 事后找补。