17万+ 个数学严谨的 AI 市民孪生智能体,两种使用模式,三种仿真方法。以下是我们如何做到的、为什么可信、以及技术难度在哪里。
通用大模型做社会调研的三大致命问题
从人口普查到 172K 个独特的 AI 市民
基于 Agent-Based Modeling 的多轮意见动力学仿真
不是一次性问答,而是模拟真实社会中政策发布后 7 天内的意见演化过程。系统基于 Agent-Based Modeling(ABM)框架,运行 3 轮仿真,每轮注入递增的社会影响因子,捕捉经典社会科学中的信息级联(Bikhchandani et al. 1992)、群体极化(Sunstein 2002)和回音室效应(Jamieson & Cappella 2008)。
同一批 agent,两个不同政策方案(Context A vs Context B),各跑完整 7 天 3 轮。双比例 z 检验计算统计显著性(p < 0.05),输出效应量(百分点差异)。因为控制了人口结构变量(同一批 agent),只改变政策变量——满足 Rubin (1974) 因果推断框架中的反事实条件:同一"个体"在两个处理条件下的结果差异。
本体驱动的 AI 市场调研引擎 — 从需求对话到统计推断的全自动化流程
Sophie 是一个本体驱动(Ontology-driven)的 AI 调研引擎,而非简单的对话机器人。底层由 6 张知识图谱表(行业本体、话题图谱、情境事实库、受众预设、探测模板、问卷模式库)支撑,通过 RAG(Retrieval-Augmented Generation)管线将领域知识注入每一轮对话,确保问卷设计的专业性与一致性。
基于选择导向联合分析(Choice-Based Conjoint, CBC)方法论(Green & Srinivasan, 1990)。将产品/方案分解为多个属性维度(价格、功能、品牌等),生成正交属性组合,每个 agent 在多组 profile 对中做偏好选择。通过条件 Logit 模型估计各属性的部分效用值(part-worth utilities),输出:各方案的市场偏好份额、按收入/年龄/住房类型的细分偏好、agent 级别的选择理由追溯。适用于产品概念测试、定价弹性研究和市场份额预测。
Green & Srinivasan (1990). Conjoint Analysis in Marketing. Journal of Marketing, 54(4).
Lewis et al. (2004). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. NeurIPS.
Haines (2014). Product Management. McGraw-Hill — Stage-gate survey design framework.
Louviere et al. (2000). Stated Choice Methods. Cambridge University Press — Discrete choice experiments.
Cochran (1977). Sampling Techniques. Wiley — Stratified random sampling theory.
用真实历史数据验证系统准确度
我们用 7 个已有真实结果的历史事件来检验系统。核心原则:AI 的 context 中绝不包含被验证调查的结果——模型必须独立预测,不能"抄答案"。可以引用其他事件的数据作为参考锚定(如用 GE2020 数据锚定 GE2025 预测),但不可以引用被验证事件的结果。
LLM 训练数据偏向西方进步价值观。敏感议题上系统性高估"进步"立场(377A +21.6pp)。保守共识议题偏差较小。
互联网数据过度代表冲突。种族和谐低估正面看法 13.4pp。同时 LLM 倾向"强迫"表态,压缩中立选项(377A 中立:真实 36% vs 模型 17.9%)。
支撑系统运行的核心技术