四分位距 (IQR) 计算器

集中趋势与离散度测量

输入以逗号分隔的数字列表,计算四分位距 (IQR)、四分位数并识别异常值。

实际示例

查看 IQR 计算器在不同数据集下的表现。

基础偶数数据集

基础偶数数据集

一个包含偶数个值的简单数据集,用于计算 IQR。

数据: 2, 4, 4, 5, 6, 7, 8, 9

包含奇数个值的数据集

奇数数据集

展示如何为奇数个数数据计算四分位数的示例。

数据: 10, 20, 30, 40, 50, 60, 70

识别异常值

包含异常值的数据集

该数据集包含明显的异常值,展示计算器如何识别它们。

数据: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49, 78, 108

考试成绩分析

真实世界数据

分析一组学生考试成绩,找出中间 50% 的分布范围。

数据: 88, 92, 80, 78, 95, 84, 76, 90, 81, 85, 93

其他标题
理解四分位距 (IQR):全面指南
深入了解 IQR 的概念、计算、应用及其在统计分析中的重要性。

什么是四分位距 (IQR)?

  • 定义统计离散度
  • 四分位数的作用
  • 为何 IQR 是稳健的度量
四分位距 (IQR) 是统计离散度的度量,简单来说,就是数据的分散程度。它表示中间 50% 数据点的范围。与极值(异常值)敏感的极差(最大值减最小值)不同,IQR 不受极端值影响,因此是理解大多数数据集变异性的更稳健、更可靠的度量。
四分位数的作用

要理解 IQR,首先要理解四分位数。四分位数将有序数据集分为四等份。划分这四部分的三个点是:

  • Q1(第一四分位数/下四分位数):第 25 百分位,25% 的数据低于该值。
  • Q2(第二四分位数/中位数):第 50 百分位,即整个数据集的中位数。
  • Q3(第三四分位数/上四分位数):第 75 百分位,75% 的数据低于该值。 IQR 就是第三四分位数与第一四分位数的差:IQR = Q3 - Q1。

概念示例

  • 假设有一组学生成绩:IQR 告诉你班级中间一半学生的分数范围,忽略最高和最低分。
  • 在房地产领域,某小区房价的 IQR 比平均值更能反映典型价格,因为平均值可能被极高或极低的房价拉偏。

IQR 计算器使用分步指南

  • 输入您的数据
  • 解读结果
  • 使用异常值检测功能
1. 输入您的数据
在输入框中输入您的数据,数字之间用逗号分隔。计算器支持整数、小数和负数。任何非数字文本在计算时会被自动忽略。
2. 解读结果

点击“计算”后,您将看到以下关键指标:

  • 排序后的数据:您的数字从小到大排列。
  • Q1、Q2(中位数)、Q3:计算出的四分位数。
  • IQR:Q3 - Q1 的结果。
  • 异常值界限:计算器使用标准公式(Q1 - 1.5IQR 和 Q3 + 1.5IQR)确定异常值阈值。
  • 异常值:数据集中超出这些界限的所有数据点。

实际操作演示

  • 数据输入:10, 2, 5, 8, 12, 15, 7
  • 计算过程:计算器首先对数据排序:2, 5, 7, 8, 10, 12, 15。Q1=5,中位数=8,Q3=12。IQR=12-5=7。
  • 结果:这些值会清晰显示,同时给出异常值界限,并确认未发现异常值。

IQR 的实际应用

  • 数据科学与分析
  • 金融与经济学
  • 科学研究与质量控制
数据科学与分析
IQR 是探索性数据分析的基础,也是箱线图(盒须图)的核心组成部分。箱线图直观展示五数概括(最小值、Q1、中位数、Q3、最大值),帮助快速识别数据分布和潜在异常值。
金融与经济学
分析师用 IQR 理解股票价格波动、人口收入分布或房市波动。由于其抗异常值能力,IQR 能稳定反映数据主体分布,过滤极端高低值。

应用场景

  • 零售公司可分析每日销售额的 IQR,了解典型业绩并设定合理目标,忽略节假日或系统故障等异常日。
  • 医学研究者可用 IQR 报告临床试验中血压读数的范围,清晰反映中间趋势,不被极端值扭曲。

常见误区与正确方法

  • IQR 与极差、标准差的区别
  • 四分位数计算方法(包含法 vs 排除法)
  • 偶数与奇数数据集的处理
IQR 与极差、标准差的区别
常见错误是用极差(最大值-最小值)衡量数据离散度,但极差对异常值极为敏感。标准差虽常用,但假设正态分布,也易受极端值影响。IQR 为非参数方法,不假设分布,更通用。
四分位数计算方法
四分位数有多种计算方法。本计算器采用广泛认可的 Tukey(包含法),即当数据点为奇数时,中位数参与 Q1 和 Q3 的计算。有些方法排除中位数,结果略有不同。我们的做法在大多数统计和数据分析平台中为标准。

方法说明

  • 数据集 (1, 2, 3, 4, 5, 6, 7),中位数 (Q2) 为 4。下半部分为 (1, 2, 3),其中位数为 2 (Q1)。上半部分为 (5, 6, 7),其中位数为 6 (Q3)。
  • 数据集 (1, 2, 3, 4, 5, 6),中位数 (Q2) 为 3 和 4 的平均值,即 3.5。下半部分为 (1, 2, 3),其中位数为 2 (Q1)。上半部分为 (4, 5, 6),其中位数为 5 (Q3)。

数学推导与公式

  • 五数概括
  • IQR 公式
  • 异常值判别规则
IQR 公式
核心公式很简单:IQR = Q3 - Q1。难点在于准确找到 Q1 和 Q3。
四分位数的查找方法
  1. 将数据从小到大排序。
  2. 找出整个数据集的中位数 (Q2)。
  3. 确定下半部分(中位数左侧,奇数时可包含中位数,视方法而定)。
  4. 下半部分的中位数即 Q1。
  5. 确定上半部分(中位数右侧)。
  6. 上半部分的中位数即 Q3。
1.5 x IQR 异常值判别规则

为识别异常值,我们为中间数据建立“围栏”。超出此范围的值视为异常值。

  • 下界 = Q1 - (1.5 * IQR)
  • 上界 = Q3 + (1.5 * IQR)

公式应用

  • 数据:{2, 3, 5, 6, 8, 10, 12}。Q1 = 3,Q3 = 10。IQR = 10 - 3 = 7。
  • 异常值检查:下界 = 3 - (1.5 * 7) = -7.5。上界 = 10 + (1.5 * 7) = 20.5。小于 -7.5 或大于 20.5 的数据点为异常值。