方法论和限制

本页介绍了数据集统计数据的计算方式以及解释结果时应注意的事项。

概述

Universal IQ Test 统计数据总结了大型在线数据集中的表现。这些数字是描述性的:它们显示谁参加了测试以及他们在此格式中的得分如何。它们不是临床智商诊断,也不代表人口平均水平。

数据来源

聚合值是根据 Universal IQ Test 数据库中已完成的 IQ 测试计算得出的。用于开发或演示的种子数据不包括在所有已发布的统计数据中。国家/地区图表不包括空白国家/地区代码。数据字段包括考试成绩、所用时间和自我报告的人口统计数据。

人口统计和覆盖范围

  • 年龄按年龄段(青年、年轻成人、成人、老年人)捕获,并用于年龄标准化。
  • 目前,性别记录为男性或女性,因此性别统计数据仅涵盖这两类。
  • 教育水平和学习领域是自我报告的,并标准化为一组固定的类别。
  • 国家/地区是自行报告的,并在提供时映射到 ISO 代码。

评分和智商量表

基本测试分数基于正确答案的数量,并以时间作为决胜局。对于已发布的统计数据,我们将分数转换为百分位数,然后将这些百分位数映射到标准 IQ 类型的量表(平均值 100,标准差 15)。这使得图表易于解释,但不会将在线测试转变为临床评估。

验证

验证的结果通过了时间、完成度和一致性的内部检查。 “所有结果”视图包括已验证和未验证的提交,这些提交在小部分中可能会比较嘈杂。

我们发布的统计数据

  • 每个类别的平均值、中位数和百分位数范围 (p10/p25/p50/p75/p90)。
  • 平均值的 95% 置信区间基于样本量和分数离散度。
  • 样本量 (N)、验证计数和验证率。
  • 附加上下文所需的平均时间。

当未存储完整方差时,离差是根据四分位数范围 (p25-p75) 近似得出的。置信区间是近似值,应解释为平均值的误差范围。

调整与比较

有些页面提供了年龄调整的方法。这些将组平均值重新加权到共同的年龄分布,以减少年龄组合差异造成的混杂。其他图表(例如分布)保持未调整并反映原始数据集。

限制和解释

  • 自我报告的人口统计数据可能包含错误或遗漏。
  • 样本量因细分市场而异,因此小群体的波动性更大。
  • 该数据集反映了 Universal IQ Test 的访问者,并非具有代表性的人口样本。
  • 在线测试条件(设备、语言、干扰)可能会改变性能。
  • 群体之间的差异通常很小,并且分布严重重叠。

常问问题

这是临床智商测试吗?

不。这些统计数据总结了在线测试数据集,不应被解释为临床智商评估。

可以直接比较类别吗?

是的,但请务必检查样本量和 95% CI。小 N 会产生嘈杂的排名。

为什么显示已验证与全部?

验证会删除低质量的提交内容。一切结果的观点更广泛,但也更嘈杂,尤其是在较小的群体中。

这些结果是否意味着因果关系?

不会。这些是来自自行选择的在线样本的描述性统计数据,并不意味着因果效应。