如何在Excel中运行回归

在回归分析中发现数据中有趣的相关性

Excel中的回归是自动化统计过程的一种方式比较几套信息看看自变量的变化如何影响因变量的变化。如果你想找到两件事之间的相关性,使用Excel中的回归分析是最好的方法之一。

本文中的说明适用于Excel 2019、Excel 2016、Excel 2013、Excel 2010。

回归的意义是什么?

回归是一种统计建模方法,分析人员使用它来确定多个变量之间的关系。

回归分析从一个变量开始,您尝试分析您正在测试的独立变量,以查看它们是否影响其单个变量。分析看起来看起来在独立变量的变化,并尝试将这些更改相关联,从而在单个(依赖的)变量中产生的变化。

这听起来像是高级统计,但是Excel让这复杂分析适用于任何人。

在Excel中执行线性回归

回归分析的最简单形式是线性回归。简单的线性回归只关注两个变量之间的关系。

例如,以下电子表格显示包含每天吃的卡路里数量的数据及其当天的重量。

体重和卡路里电子表格的截图

由于此电子表格包含两列数据,因此一个变量可能会对另一个变量产生影响,因此您可以使用Excel对此数据进行回归分析。

启用Analysis ToolPak Add-On

在使用Excel的回归分析功能之前,您需要在Excel选项屏幕中启用analysis ToolPak插件。

  1. 在Excel中,选择文件菜单并选择选项

    Excel中的选项屏幕截图
  2. 选择插件在左侧导航菜单中。然后,确保Excel加载项管理字段。

    Excel选项
  3. 最后,选择按钮。

    Excel加载项选项和Go按钮
  4. 在加载项弹出窗口中。启用分析ToolPack通过单击它前面的框添加一个复选标记并选择好的

    Excel Add-Ons弹出窗口

现在已经启用了Analysis ToolPak,您就可以开始在Excel中进行回归分析了。

如何在Excel中执行简单的线性回归

以体重和卡路里电子表格为例,您可以在Excel中执行如下线性回归分析。

  1. 选择数据菜单。然后,在里面分析组,选择数据分析

    选择Excel中的数据分析
  2. 在里面数据分析窗口,选择回归从列表中单击好的

    在Excel中选择回归数据分析
  3. 输入y范围是包含从属变量的小区范围。在这个例子中,这是重量。的输入X范围是个细胞范围它包含了自变量。在这个例子中,这是卡路里栏。

    在Excel中输入回归范围的字段
  4. 选择标签对于标题单元格,然后选择新工作表将结果发送到a新工作表。选择好的用Excel运行分析并将结果发送到一个新的表格中。

    excel字段用于将标签应用于新工作表
  5. 检查新的工作表。分析输出有许多值,您需要理解这些值来解释结果。

    Excel中回归分析输出的截图

    这些数字中的每一个都具有以下含义:

    • 多个R:相关系数。1表示两个变量之间有很强的相关性,-1表示有很强的负相关。0表示没有相关性。
    • R平方:决定系数,表示两个变量之间有多少点落在回归线上。统计上,这是离均值偏差平方和。
    • 调整了r square.:一个被称为R平方的统计值,根据你所选择的自变量的数量进行调整。
    • 标准错误:回归分析结果有多精确。如果这个误差很小,那么你的回归结果就更准确。
    • 观察:回归模型中的观测数量。

    回归输出中的其余值提供了关于回归分析中较小组件的详细信息。

    • df:称为与之相关的自由度的统计价值差异来源
    • 党卫军:平方和。如果大部分数据符合回归线,那么残差平方和与总SS的比值应该更小。
    • 小姐:回归数据的均方。
    • F:原假设的F统计量(F检验)。这说明了回归模型的意义。
    • 意义F.:称为F的p值的统计值。

    除非您了解统计和计算回归模型,否则摘要底部的值不会有很多含义。然而,多个R和R平方是最重要的两个。

如您所见,在此示例中,卡路里与总重量有很大的相关性。

Excel中的多元线性回归分析

要执行相同的线性回归,但要使用多个自变量,请选择整个范围(多个列和行)输入X范围

为输入X范围选择一个范围的截图

当选择多个自变量时,你不太可能发现相关性强,因为有太多的变量。

然而,Excel中的回归分析可以帮助您找到与一个或多个可通过手动查看数据来实现的那些变量的相关性。

此页面是否有帮助?