# PRD|AI 信息 Pipeline v1.0(迭代计划)

> 目的:为 Chao(AI 行业研究员)建立一个可持续的 AI + 半导体领域信息追踪和解读系统 > 负责人:ChAI > 创建日期:2026-02-02 > 状态:🟢 Phase 1 进行中


0. 固定前提

0.1 核心价值定位

  • 不是:爬虫、信息聚合、最快的新闻
  • :筛选后的精华 + 有深度的解读 + 长期积累的知识复利
  • 参考定位:卓克《科技参考》的"均匀难度梯度 + 参考而非指南"

0.2 输出约束(硬)

  • 所有 md 文件必须 UTF-8 with BOM(Android 兼容)
  • 禁止使用 markdown 表格(普通查看器渲染不了)
  • 使用层级缩进的 bullet points 表示结构
  • 不存储原文,只维护链接索引和解读

0.3 解读框架(v1.1,已验证)

  • 核心摘要 (TL;DR) — 3-5 个要点,30 秒抓住精髓
  • 核心论证 — 叙述型,有逻辑线,关键处用 quote
  • 作者立场 — 首次展开,后续按需(引用作者档案)
  • 对 Chao 的价值 — 战略信号、工作流启发、认知冲突
  • 附:上下文解码 — 术语/人物解释

0.4 更新节奏

  • 目标:每 2-3 天一次解读推送
  • 触发方式:Chao ping 或 cron 定时


1. 问题清单(当前状态)

| # | 问题 | 优先级 | 状态 | |---|------|--------|------| | 1 | 作者档案不完整,只有 8 个信源 | P1 | 进行中 | | 2 | 没有自动化检测新文章的机制 | P2 | 待开始 | | 3 | 解读产出依赖 Chao 手动触发 | P2 | 待解决 | | 4 | 缺少反馈收集和偏好学习机制 | P2 | 结构已建,未使用 | | 5 | 缺少主题/概念索引,无法跨文章关联 | P3 | 待开始 | | 6 | 中文信源未覆盖 | P3 | 待开始 |


2. 当前资产清单

2.1 目录结构

`` feeds/ ├── PROJECT.md # 本文件 ├── config.json # 信源配置 ├── feedback.json # 反馈记录(待使用) ├── INTERPRETATION_FRAMEWORK.md # 解读框架 ├── authors/ # 作者档案 │ ├── INDEX.md # KOL 图谱索引 │ ├── semianalysis.md │ ├── irrational-analysis.md │ ├── latent-space.md │ ├── zvi.md │ ├── bens-bites.md │ ├── ahead-of-ai.md │ ├── simon-willison.md │ └── last-week-in-ai.md ├── interpretation-*.md # 解读文档 └── digest-*.md/html # 周报文档 `

2.2 已完成的解读

  • interpretation-apple-tsmc-v3.md — SemiAnalysis, Apple-TSMC 合作
  • interpretation-simon-2025-year-in-llms.md — Simon Willison 2025 年度总结

2.3 作者档案覆盖

  • ✅ 已建档 (8): SemiAnalysis, Irrational Analysis, Latent Space, Zvi, Ben's Bites, Ahead of AI, Simon Willison, Last Week in AI
  • ⬜ 待补充: Stratechery, Asianometry, Import AI, The Batch, The Gradient, Interconnects


3. Phase 1:基础建设(本周目标)

3.1 作者档案补全(P1)

目标:覆盖 15 个核心信源

待补充列表

  • Stratechery (Ben Thompson) — 科技商业分析
  • Asianometry (Jon Y) — 半导体/亚洲科技
  • Import AI (Jack Clark) — AI 政策/安全
  • The Batch (Andrew Ng) — AI 入门级
  • The Gradient — AI 研究
  • Interconnects (Nathan Benaich) — AI 产业

每个档案必须包含

  • 主理人背景
  • 定位/方法论
  • 内容类型
  • 已知 bias
  • 阅读价值评级

验收标准

  • [ ] 15 个信源档案完成
  • [ ] INDEX.md 更新
  • [ ] 每个档案有 URL 可追溯

3.2 解读产出(P1)

目标:本周完成 5 篇解读

优先级排序

  • ✅ Simon Willison - 2025 Year in LLMs(已完成)
  • ⬜ Zvi - 最近一期 AI 周报
  • ⬜ SemiAnalysis - 最近一篇(TPU/Nvidia 相关)
  • ⬜ Latent Space - Agent Labs Thesis 或 Brex 深度
  • ⬜ Irrational Analysis - 最近一篇半导体投资

每篇解读必须

  • 遵循 v1.1 框架
  • UTF-8 BOM 编码
  • 发送给 Chao 并收集反馈

3.3 反馈机制启用(P2)

目标:开始收集和记录反馈

feedback.json 结构`json { "ratings": [ { "article_id": "apple-tsmc-v3", "date": "2026-02-02", "rating": "useful", "notes": "格式好,内容深度够" } ], "learned_preferences": { "preferred_depth": "high", "preferred_sources": ["SemiAnalysis", "Simon Willison"], "avoid_topics": [], "notes": "" } } `

验收标准

  • [ ] 每次推送后主动询问反馈
  • [ ] 反馈记录到 feedback.json
  • [ ] 每 5 篇解读后回顾一次偏好


4. Phase 2:自动化(2 月目标)

4.1 新文章检测

方案选择

方案 A:Cron 定时抓取 archive 页面

  • 每天 1-2 次检查各信源 /archive 页面
  • 对比上次记录的最新文章
  • 有新文章时通知 Chao

方案 B:RSS(如果可用)

  • 部分 Substack 有 RSS feed
  • 更轻量,但覆盖不全

推荐:先用方案 A,archive 页面抓取已验证可行

实现步骤

  • 建立 feeds/last_seen.json 记录每个信源的最新文章
  • 设置每日 cron(早 9 点 + 晚 9 点)
  • 检测到新文章时,生成待解读列表
  • 发送通知给 Chao:"有 X 篇新文章,要我解读吗?"

4.2 解读工作流优化

当前流程(手动):

  • Chao ping
  • ChAI 抓取文章
  • ChAI 写解读
  • ChAI 发送
  • Chao 反馈

目标流程(半自动):

  • Cron 检测新文章
  • ChAI 生成待解读列表
  • ChAI 主动推送:"今天有 3 篇新文章,我挑了这 1 篇最值得看的,解读如下..."
  • Chao 反馈
  • ChAI 记录偏好


5. Phase 3:知识图谱(3 月目标)

5.1 主题索引

目标:建立跨文章的主题关联

结构` feeds/topics/ ├── INDEX.md # 主题列表 ├── tsmc.md # TSMC 相关文章索引 ├── nvidia.md # NVIDIA 相关 ├── coding-agents.md # Coding Agent 相关 ├── china-ai.md # 中国 AI 相关 └── ... `

每个主题文件包含

  • 相关文章列表(链接 + 一句话摘要)
  • 关键人物/公司
  • 观点演变时间线

5.2 趋势追踪

目标:识别持续出现的话题,标记观点变化

实现

  • 每篇解读标注 topics: [tsmc, apple, foundry]`
  • 定期生成"热点话题"报告
  • 标记同一作者观点变化(如 Simon 对 agent 的态度演变)


6. 验收与回顾节奏

6.1 每轮迭代周期

  • 每 3-5 天一轮
  • 每轮结束时:回顾完成情况、更新 PROJECT.md、调整下轮计划

6.2 Phase 1 验收标准

  • [ ] 15 个信源档案完成
  • [ ] 5 篇解读完成
  • [ ] 反馈机制运转
  • [ ] Chao 反馈"有用率" > 80%

6.3 成功指标(长期)

  • 每周 2-3 篇高质量解读
  • 作者档案覆盖主流 AI/半导体信源
  • 形成可复用的主题知识库
  • Chao 感觉"心中有数"


7. 当前 TODO(按优先级)

本轮(今天下午)

  • [ ] 完成 Zvi 最近一期 AI 周报解读
  • [ ] 补充 2-3 个作者档案(Stratechery, Asianometry)
  • [ ] 更新 INDEX.md

下轮(明后天)

  • [ ] 完成剩余 3 篇解读
  • [ ] 设置新文章检测 cron
  • [ ] 启用反馈记录


8. 变更日志

| 日期 | 版本 | 变更内容 | |------|------|----------| | 2026-02-02 | v1.0 | 初始版本,Phase 1 定义 |


最后更新: 2026-02-02 15:22 GMT+8