关于这些调研,以及我怎么和 AI 合作

每次把调研分享出去,总会被问一句:"这是 AI 做的吗?AI 到底帮你做了什么?" 这个页面就是直接回答这个问题—— 不是"AI 做的",也不是"我一个人做的",是一套可以反复使用、可以被质疑的协作流程。

分工 / 谁做什么

定义问题 · 挑战框架 · 核对关键事实 · 写判断

最难的部分不是执行,是定义。"这个问题被问对了吗?"、"这个对比对象合理吗?"、 "这个结论是不是被单一信源牵着走了?"——这些判断由我来做。 AI 给出的每一条 A 级事实和每一个核心结论,我都会回到原始信源核对; 涉及行业判断、利益相关方动机、文化语境的结论,我会改写或推翻 AI 的草稿。

AI

大规模检索 · 多源综合 · 结构化整理 · 草拟报告

AI 做的是一个人做不完的那部分: 同时检索几十个中英文来源、交叉比对、按规定的格式(信源等级、日期、验证状态) 整理成可核对的草稿。 它不做判断——它给我足够多的、分类好的证据,让我能做判断。

工作流程 / 一个完整的协作循环
1

问题拆解

把一个模糊问题("中国的独立女性主义内容创业能做吗?")拆成可以验证的子问题: 市场规模是多少?头部玩家是谁?监管红线在哪?读者付费意愿如何? 每个子问题明确地理范围(单市场 vs 多市场),准备中英双语关键词矩阵。 这一步我主导,AI 的任务是反过来质疑我的预设—— "你是不是默认了这个市场和美国市场结构相似?"

2

广度扫描(强制先做)

AI 对所有子问题做快速的全景扫描,绘制地图:有哪些玩家、哪些争议点、哪些信息是空白。 这一步不深挖——先看全局,避免在错误方向上浪费时间。 每个子问题至少 3-5 个独立来源,按地理市场分开收集。 我的任务是审核:覆盖面够不够?是不是只看了英文世界?有没有漏掉关键反对声音?

3

深度挖掘

沿广度阶段画出的路线图深入。信息来自三个渠道: 公开资料(行业报告、财报、学术论文、媒体报道)、 产品端(竞品体验、用户评测、反向工程)、 内部端(员工公开言论、工商登记、法院文书)。 AI 执行检索和整理,每一条发现都标注信源等级和日期。 涉及关键结论的 A 级信源,我会亲自回到原文核对。

4

综合推理

只有经过验证的信息才进入推理链。AI 草拟"事实 → 逻辑 → 结论"的三段式论证, 每一步必须可见——不允许出现无法回溯的黑箱结论。 矛盾证据不强制统一,而是保留并标注。 这一步是我和 AI 来回最多的一步——AI 的第一版推理经常被我推翻或改写。

5

结构化输出

所有主张使用内联信源标签,在正文中可以直接看到: [事实·A][事实·F] 标注信源层级, [推断] 标注推理出的结论, [未知] 标注待验证的线索。 每个结论都可以从标签追溯回原始证据——读者不需要相信我, 读者需要能自己检查。

为什么这套流程

AI 会幻觉

LLM 在数据稀疏的地方会自信地编造。必须显式标注信源等级——"这条是从哪里来的?"是每一句话都要回答的问题。

先广度再深度

AI 很容易在错误方向上越挖越深。广度扫描阶段不可跳过——在看完地图之前不许深挖。

推理链必须可见

"事实 → 推理逻辑 → 结论"三步必须显式。读者可以质疑每一步。

矛盾不强制统一

不同信源冲突时,保留双方观点并标注,交给读者判断。强行拉平矛盾是最常见的失真方式。

不同市场分开走

涉及多国对比时,每个市场单独走一遍完整流程,最后再交叉比较——而不是用一国的结构去套别国。

信源分级

A/B/C/D 四级评分。C/D 级只能作为线索,需要交叉验证后才能用于推理。

关于中英文信源

涉及非英语国家的议题(比如中国、韩国、日本、法国的女权生态)时,强制使用当地语言搜索—— 用英文搜"韩国女权"和用韩文搜"한국 페미니즘"得到的是完全不同的信息世界。 每篇报告的信源列表会分开列出英文/国际信源和本土语言信源, 读者可以直接看到哪些结论来自哪一边的资料。

工具栈

主要工具是 Claude Code(Anthropic 的命令行协作环境)——它让 AI 能直接读写文件、 搜索网络、调用专门的调研协议,而不只是对话。 所有调研过程都在 Git 里做版本控制,每次迭代都可追溯。 报告最终以独立的静态网站发布,原始素材和生成流程都是透明的。