有这么一种情况。一个算命先生说,你的孩子在三个月后的第几天,上午还是下午,几点出生;一般人去蒙的话,千分之一的概率。如果一个算命先生,给100个人算命,每个人都是计算千分之一概率的事情,有20个人很准确;有80个人没算到。
那么这种情况,到底说明算命有效还是无效呢?
——我们先把它抛到一边,再来看另一个例子:在真空中,无论铁球还是羽毛都以相同的重力加速度下落;但如果在空气里、用形状各异(流体)和密度各异的物体做测试,你很可能测出差别,偏离真空实验的结论。
这两种看似无关的事情,其实遵循同一个“信号——噪声”与“理想环境——非理想环境”的原理。下面用通俗的语言,一步步抽丝剥茧,看看算命和中医里的“科学性”到底掺杂了哪些概率魔法。
1. 随机蒙和真的有料:零假设 vs 备择假设
- 零假设(H₀):算命完全靠蒙,命中率 p₀ = 0.001(千分之一)。
- 备择假设(H₁):算命师有“秘密技巧”,实际命中率 p > p₀。
同样,自由落体实验中:
- 零假设:真空中重力加速度 g 恒定;
- 备择假设:可能 g 有微小差异或环境造成偏差。
在统计里,我们用“试验次数×命中率”算出期望命中数:100×0.001=0.1;标准差 ≈0.32。也就是说,纯蒙的话,100次里蒙中 0、1 次已经很正常;想要蒙中 20 次,要知道——在“纯蒙”假设下,观测到 ≥20 次命中的概率只有: 十的负三十八次方,几乎等于零!这简直是天方夜谭级别的小概率事件。
所以——当你观测到算命师在 100 次里命中 20 次时,零假设下几乎不可能出现这种结果,说明他“不是纯蒙”,而是真有某种信号在起作用。
2. 信号与噪声:为什么仍有 80% 失误
即便算命命中率从 0.1% 提升到 20%,失败率依然高达 80%。这就像在空气里做自由落体实验:
- 信号(Signal):重力加速度 g 本身。
- 噪声(Noise):空气阻力、测量仪器误差、物体形状差异……
在算命里,噪声来源于:
- 历法转换、时区记录、家长记错时间这些“输入误差”;
- 不同流派、不同大师对同一排盘步骤的微调叫“模型误差”;
- 心理期望、回忆偏差、自证偏差等“环境干扰”。
当噪声远大于信号时,绝大多数预测都会被淹没,只有极少数“误差恰好抵消”或“恰好符合模型”,才会落到正确位置。
3. 理想环境 vs 非理想环境
- 理想环境:
- 算命时使用标准化、自动化的排盘算法;
- 精确到秒的出生时间、经纬度、时区,且分派盲测对象;
- 多次独立试验,用统计检验给出置信区间和 p-值;
- 重复验证后,才能测出“真正的有效信号”。
- 非理想环境:
- 随意记录时间、手抄排盘、只看成功不提失败;
- 不做对照试验、不做双盲,也不估算噪声大小;
- 结果只告诉你“有案例”或“没案例”,根本没法量化效应。
中医也完全一样:要验证某个方剂是否真的有效,必须有统一来源的药材、标准化提取、双盲随机对照、大样本重复实验,才能把“安慰剂效应”“自然波动”等噪声排除,算出真实疗效。
4. “有效”并非“完美”
- 当统计上拒绝了“纯蒙”的零假设,说明模型里确实夹带了信号。
- 但信号有多强?信噪比又是多少?只有当单次预测的准确率、误差范围、可重复性,都达到一定门槛时,才算“实用”。
- 20% 命中告诉我们:算命师确有一套“套路”,但远不足以保证每次都准确;同理,中医里有些草药成分确实有效,也不能说所有方剂都万能。
5. 如何更科学地看待?
- 别把“80% 失败”当全部,也别把“20% 成功”当完美。
- 先做理想实验,控制好所有已知变量,得到效应量;
- 再做现实验证,评估在普通环境下的实用性、成本、副作用;
- 不断迭代,用现代统计学、药理学、数据科学工具,剥离噪声,优化模型。
结语
算命、中医、乃至任何声称“预测”或“治疗”的方法,都是在信号与噪声之间的博弈。我们既要承认“它们有可能藏着真正的信号”,也要警惕“噪声掩盖信号/噪声当成了信号”的双重陷阱。既不放过“真科学”,也不过分神化“经验主义”──这样,才能在概率的世界里,既保持好奇,也保持清醒。
发表回复