joeseesun(qiaomu)开源了一个 Claude Code Skill:任何内容 → 任何格式。
核心能力
输入:你用自然语言说"把这篇微信文章生成播客",AI 自动完成后续全流程。
输出:播客 / PPT / 思维导图 / Quiz / 视频 / 报告 / 信息图 / 闪卡
关键组件:多源内容获取(含付费墙绕过)→ 上传 Google NotebookLM → AI 生成目标格式
支持的 15+ 内容源
| 类型 | 来源 |
|---|---|
| 社交媒体 | 微信公众号(MCP 浏览器模拟)、X/Twitter(推文+长线程)、YouTube(自动字幕)、播客(小宇宙/喜马拉雅/B站) |
| 网页 | 300+ 付费网站(NYT/WSJ/FT/Economist 等)、任意公开网页、搜索关键词汇总 |
| 电子书/文档 | PDF(支持扫描件 OCR)、EPUB、Markdown、纯文本、Word、PowerPoint、Excel |
| 其他 | 图片(OCR)、音频(转录)、ZIP 压缩包(批量处理) |
付费墙绕过:6 层级联策略
核心特性。自动检测并绕过 300+ 付费新闻网站的付费墙,按顺序级联尝试:
Level 1: 代理服务(r.jina.ai / defuddle.md)
↓ 失败
Level 2: 站点专属 Bot UA(Googlebot ~50站 / Bingbot ~4站)
↓ 失败
Level 3: 通用绕过(UA伪装 + X-Forwarded-For + Referer伪装 + AMP + EU IP)
↓ 失败
Level 4: archive.today 存档(CAPTCHA 自动检测)
↓ 失败
Level 5: Google Cache
↓ 失败
Level 6: agent-fetch 本地工具
每层失败才到下一层,最终确保内容获取成功率。
技术来源:学自 Chrome 扩展 Bypass Paywalls Clean,累计覆盖:
- Googlebot UA → ~50 站(NYT/WPJ/Bloomberg/Forbes/WIRED 等)
- Bingbot UA → ~4 站
- Cookie 清空 + Referer 伪装 → 计量付费墙
- AMP 页面 → ~10 站
- JSON-LD 提取 → 通用
技术架构
用户自然语言输入
↓
Claude Code Skill(智能识别内容源类型)
↓
┌───────────────────────────────────────┐
│ 微信 MCP │ 付费墙绕过 │ 播客转写 │ markitdown │
└─────────────┴───────────┴─────────┴───────────┘
↓
NotebookLM API(上传 + AI 生成)
↓
.mp3 / .pdf / .json / .pptx 等
使用示例
付费文章 → 播客
你:把这篇 The Information 文章生成播客
AI:检测付费墙 → Googlebot UA 绕过 → 获取全文 → 上传 NotebookLM → 生成播客
结果:/tmp/article_podcast.mp3
电子书 → 深度分析报告
你:深度分析这本书 sapiens.epub
AI:提取全文 → 上传 NotebookLM → 生成 10 个核心问题 → 逐一递归提问 → 输出 JSON
结果:/tmp/sapiens_analysis.json(10 个问答,含金句、核心观点、局限性分析)
微信文章 → 飞书文档
你:深度分析这篇微信文章并写入飞书
AI:MCP 浏览器模拟抓取 → 上传 NotebookLM → 生成问答 → 格式化 Markdown → 自动创建飞书文档
结果:飞书文档已创建
安装
cd ~/.claude/skills/
git clone https://github.com/joeseesun/qiaomu-anything-to-notebooklm
cd qiaomu-anything-to-notebooklm
# 一键安装所有依赖
./install.sh
# NotebookLM 认证
notebooklm login
notebooklm list # 验证成功
就这两样前置需求:Python 3.9+ 和 Git,其他依赖一键自动安装。
GitHub:joeseesun/qiaomu-anything-to-notebooklm,MIT 协议。