返回 FEED
AGENT2026-05-25

AI 不好用,99% 是数据问题

Miles(@ma_zhenyuan)今天做了一个企业端的 AI 培训,主题是:企业 AI 升级的核心是数据治理。把内容分享给大家。

AI 的盲区

ChatGPT、Claude 这些公网 AI,能写文案、写代码、搜索公开信息。看起来无所不能。但它们碰不到你的核心数据。

你的销售数据在本地数据库,客户信息在内部系统,业务文档在私有服务器。这些企业最值钱的东西,公网 AI 一个都访问不了。

遇到过做电商的客户,想让 AI 分析销售趋势,结果发现 AI 只能分析公开的行业报告,自己的销售数据根本读不到。数据躺在 MySQL 里,AI 看不见。

最需要 AI 帮忙的地方,恰恰是 AI 够不着的地方。

没数据就是拍脑袋

去年有个做 SaaS 的朋友,开会讨论要不要砍掉一个功能。产品经理说用户不喜欢,运营说数据不错,技术说维护成本高。吵了两小时,没结论。

后来把用户行为数据拉出来,发现这个功能的活跃用户只有 3%,但这 3% 贡献了 40% 的付费。数据一出来,决策就清楚了:不能砍,得优化。

没有数据的决策,就是拍脑袋。有数据的决策,才能追溯、能优化。

企业 AI 改造的核心,不是让 AI 写更好的文案,而是让 AI 能访问你的私有数据。 打通数据这一关,AI 才能真正干活。

一句话背后的 5 个决策

你对 AI 说:"查 2026 年 3 月,某品牌在某平台的销售数据和客户反馈。"

看起来一句话,AI 背后要做 5 个决策:

第一步:选数据源

销售数据在数据库?客户反馈在 Excel?还是文档里?

见过一个公司,销售数据在 MySQL,客户反馈在钉钉群聊天记录里,产品信息在 Notion 文档。三个地方,三种格式。AI 得先判断去哪找。

第二步:理解条件

"3月"是 3月1日到 3月31日,还是最近 30 天?"某品牌"具体是哪个?"某平台"是天猫还是京东?

自然语言很模糊,AI 得翻译成精确的查询条件。

第三步:挑字段

数据库有几百个字段,你只要品牌、平台、销售额、反馈这几个。

有个客户的 ES 数据库,一条记录 800 多个字段。从里面挑出需要的 5 个,不容易。

第四步:定查询方式

数据库用 SQL,Excel 用 Python,Notion 用 API。不同数据源,不同方法。

第五步:验完整性

数据完整吗?有缺失吗?符合预期吗?

遇到过查出来的销售数据比上个月少了 80%。一查,原因是数据库迁移,部分数据还没同步过来。要是不验证,直接拿去做报告,就出大问题了。

这 5 步,每一步都可能出错。

三类数据,三种方法

知识库:让 AI 读懂文档

知识库用的是 RAG 技术。把文档切片、向量化,AI 就能检索。

向量化就是把文字变成数字。比如"请假流程"这四个字,变成一串数字 [0.23, 0.45, 0.67...]。AI 能理解这串数字,能搜索。

复杂点的知识库,表格和文档混在一起。优化检索方式,AI 才能找到最相关的内容。

场景 1:智能客服

一个做在线教育的公司,每天几千条客服咨询。"怎么退款?""课程有效期多久?""老师资质怎么样?"

他们把历史对话记录、FAQ、标准答案,全扔进知识库。AI 自动回复常见问题。

但关键是:AI 辅助,不是替代。AI 先答常见问题,复杂的转人工。客服能看到 AI 的建议答案,改改就能用,效率提高 60%。

为什么不能全交给 AI?因为大多数人看到智能客服,第一反应就是打"转人工"三个字。

场景 2:员工培训

一个 200 人的公司,新员工入职,HR 要讲一遍公司制度、请假流程、报销规则。每次讲 2 小时,一个月入职 10 个人,HR 要讲 20 小时。

他们把公司制度、流程文档、培训资料、工作手册,全放进知识库。新员工随时问 AI,快速上手。

培训时间从 20 小时降到 5 小时。

MCP:连接数据库

MCP(模型上下文协议)让 AI 能访问数据库。MySQL、PostgreSQL、ES,AI 自动写代码,提取数据。

为什么重要?

遇到过客户的 ES 宽表,一条数据 1200 个字段。销售额、客户 ID、订单时间、支付方式、优惠券、物流信息、售后记录...全在一张表里。

从 1200 个字段里精准定位需要的 10 个,非常难。业务逻辑复杂,字段之间的关系和含义,得理解透。

传统数据库接口是给程序员用的,得写代码查询。程序员写 SQL,跑一遍,看结果,改 SQL,再跑一遍。一个复杂查询,得折腾半天。

MCP 不一样,它是给 AI 用的。后端写硬核代码,处理复杂逻辑。前端用自然语言,AI 自动调 MCP。

用户说"查 3 月销售额前 10 的商品",AI 自动生成 SQL,调 MCP,返回结果。用户不用懂 SQL,不用懂数据库结构。

这是个范式转变。 以前设计 Excel、数据库,都是给写代码的人用。现在得给 AI 设计接口。

多 Agent 协作

单 Agent 不够用

一个 AI Agent 能力单一,上下文有限,不能并行。

生成"销售经营分析报告",得整合多个数据源:数据库查销售数据、Excel 读客户反馈、知识库查产品信息、网上搜行业趋势。

单个 Agent 干不了。就像一个人,既要查数据库,又要读 Excel,还要搜网络,忙不过来。

多 Agent 怎么配合

多 Agent 就像一个团队,分工明确:

  1. 用户提需求:"生成 3 月销售经营分析报告"
  2. 主 Agent 理解意图,拆任务:查销售数据、读客户反馈、查产品信息、搜行业趋势
  3. 分给 4 个子 Agent,各管一块:A 连 MCP 查数据库、B 写代码读 Excel、C 连知识库查文档、D 网络搜索找报告
  4. 4 个子 Agent 同时干活,并行处理
  5. 子 Agent 把数据返回主 Agent
  6. 主 Agent 交给写作 Agent,生成报告
  7. 输出完整报告

整个过程 5 分钟。

效果对比

以前做月度经营分析报告,要 2 天:数据分析师从数据库导数据、整理 Excel、做图表;运营写报告、加图表、改格式。

现在用多 Agent,5 分钟:AI 自动查数据、整理、做图表、写报告。人只需要看一遍,改改细节。

效率提升 200 倍。

核心要点

企业数据治理,记住这几点:

  • 数据治理是核心:企业 AI 升级,不是让 AI 写更好的文案,而是让 AI 能访问私有数据。文案谁都能写,数据只有你有。
  • 自然语言查数据不简单:背后有 5 个决策,每一步都可能出错。
  • 知识库解决客服和培训:RAG 技术让 AI 能读懂文档。但要 AI 辅助人工,不是替代。
  • MCP 连接复杂数据库:传统接口给程序员用,MCP 给 AI 用。后端硬核代码,前端自然语言。这是范式转变。
  • 多 Agent 协作处理复杂任务:单 Agent 能力有限,多 Agent 分工明确、并行处理。效率提升不是 2 倍,是 200 倍。

从公网到私有

企业 AI 改造,就是从公网 AI 到私有 AI。

公网 AI 是通用能力,谁都能用。私有 AI 是企业专属能力,只有你能用。

打通数据,AI 才能真正干活。

这不是技术问题,是系统工程。知识库、MCP、多 Agent,三个缺一不可。

你的 AI 能访问你的销售数据、客户信息、内部文档,它才真正是你的 AI。