返回 FEED
GITHUB2026-05-29

LlamaIndex 用 Rust 重写文档解析器:457页 PDF 0.7秒解析

LlamaIndex 把自家的文档解析器 LiteParse 用 Rust 重写了。

核心成绩:457 页、100MB 的 PDF,解析只要 0.777 秒。支持 Python、Node.js、Rust 和浏览器四个环境,开源免费。

为什么要用 Rust 重写?v1 版是 Node.js 写的,解析速度受限于 Node 的运行时开销。换 Rust 之后,解析器直接跑在更底层的执行环境里,绕过了这层 overhead。对于需要处理大量文档的 AI 应用来说,这个改进直接影响 RAG Pipeline 的吞吐量和延迟。

LlamaIndex 本身是 AI 应用里最常用的数据连接框架之一,这次性能提升对构建知识库、文档问答类应用的开发者是直接利好。