关于这些调研，以及我怎么和 AI 合作

每次把调研分享出去，总会被问一句："这是 AI 做的吗？AI 到底帮你做了什么？" 这个页面就是直接回答这个问题—— 不是"AI 做的"，也不是"我一个人做的"，是一套可以反复使用、可以被质疑的协作流程。

分工 / 谁做什么

我

定义问题 · 挑战框架 · 核对关键事实 · 写判断

最难的部分不是执行，是定义。"这个问题被问对了吗？"、"这个对比对象合理吗？"、 "这个结论是不是被单一信源牵着走了？"——这些判断由我来做。 AI 给出的每一条 A 级事实和每一个核心结论，我都会回到原始信源核对；涉及行业判断、利益相关方动机、文化语境的结论，我会改写或推翻 AI 的草稿。

大规模检索 · 多源综合 · 结构化整理 · 草拟报告

AI 做的是一个人做不完的那部分：同时检索几十个中英文来源、交叉比对、按规定的格式（信源等级、日期、验证状态）整理成可核对的草稿。它不做判断——它给我足够多的、分类好的证据，让我能做判断。

工作流程 / 一个完整的协作循环

问题拆解

把一个模糊问题（"中国的独立女性主义内容创业能做吗？"）拆成可以验证的子问题：市场规模是多少？头部玩家是谁？监管红线在哪？读者付费意愿如何？每个子问题明确地理范围（单市场 vs 多市场），准备中英双语关键词矩阵。这一步我主导，AI 的任务是反过来质疑我的预设—— "你是不是默认了这个市场和美国市场结构相似？"

广度扫描（强制先做）

AI 对所有子问题做快速的全景扫描，绘制地图：有哪些玩家、哪些争议点、哪些信息是空白。这一步不深挖——先看全局，避免在错误方向上浪费时间。每个子问题至少 3-5 个独立来源，按地理市场分开收集。我的任务是审核：覆盖面够不够？是不是只看了英文世界？有没有漏掉关键反对声音？

深度挖掘

沿广度阶段画出的路线图深入。信息来自三个渠道：公开资料（行业报告、财报、学术论文、媒体报道）、产品端（竞品体验、用户评测、反向工程）、内部端（员工公开言论、工商登记、法院文书）。 AI 执行检索和整理，每一条发现都标注信源等级和日期。涉及关键结论的 A 级信源，我会亲自回到原文核对。

综合推理

只有经过验证的信息才进入推理链。AI 草拟"事实 → 逻辑 → 结论"的三段式论证，每一步必须可见——不允许出现无法回溯的黑箱结论。矛盾证据不强制统一，而是保留并标注。这一步是我和 AI 来回最多的一步——AI 的第一版推理经常被我推翻或改写。

结构化输出

所有主张使用内联信源标签，在正文中可以直接看到： [事实·A] 到 [事实·F] 标注信源层级， [推断] 标注推理出的结论， [未知] 标注待验证的线索。每个结论都可以从标签追溯回原始证据——读者不需要相信我，读者需要能自己检查。

为什么这套流程

AI 会幻觉

LLM 在数据稀疏的地方会自信地编造。必须显式标注信源等级——"这条是从哪里来的？"是每一句话都要回答的问题。

先广度再深度

AI 很容易在错误方向上越挖越深。广度扫描阶段不可跳过——在看完地图之前不许深挖。

推理链必须可见

"事实 → 推理逻辑 → 结论"三步必须显式。读者可以质疑每一步。

矛盾不强制统一

不同信源冲突时，保留双方观点并标注，交给读者判断。强行拉平矛盾是最常见的失真方式。

不同市场分开走

涉及多国对比时，每个市场单独走一遍完整流程，最后再交叉比较——而不是用一国的结构去套别国。

信源分级

A/B/C/D 四级评分。C/D 级只能作为线索，需要交叉验证后才能用于推理。

关于中英文信源

涉及非英语国家的议题（比如中国、韩国、日本、法国的女权生态）时，强制使用当地语言搜索—— 用英文搜"韩国女权"和用韩文搜"한국 페미니즘"得到的是完全不同的信息世界。每篇报告的信源列表会分开列出英文/国际信源和本土语言信源，读者可以直接看到哪些结论来自哪一边的资料。

工具栈

主要工具是 Claude Code（Anthropic 的命令行协作环境）——它让 AI 能直接读写文件、搜索网络、调用专门的调研协议，而不只是对话。所有调研过程都在 Git 里做版本控制，每次迭代都可追溯。报告最终以独立的静态网站发布，原始素材和生成流程都是透明的。