医学统计学——一般的简单线性回归

HarmonyOS

  前言

  截至目前为止,在今日头条发布的这些关于统计学的内容超过30篇,不知道对大家是否是有帮助。希望大家能够及时给我反馈,我会为大家写更多的文章。

  前面的章节,大部分讨论的是单一变量的统计学分析方法,描述的单一变量的统计特征和比较,该变量的组间差别。在医学研究中我们常常需要研究的是两个连续变量的关系。比如身高和体重,这里更多的使用的是回归与相关分析。那么这篇文章就给大家介绍,两列参数呈直线关系时,如何正确应用SPSS实现线性回归相关分析。

  概念解释

  在回答问题之前,首先给大家解释一下线性回归的概念,线性回归是分析两个连续变量之间存在相互变化的数量关系的统计方法。是回归分析中最基本,最简单的情况,也成为简单回归这两个变量的地位是不同的,其中一个做自变量,也称为解释变量。一般情况用X表示从正态分布的随机变量,也可以是能够精确测量和严格控制的非随机变量。另外一个作为因变量,也称为应变量,用y表示。

  通常回归叫假设为:

  自变量与因变量关系应该有线性的趋势。

  之间相互独立。

  给定X与任意值y都有对应的值。

  不同X对应的y的方差基本相等。

  为了方便统计分析,我们一般假设称为线性假设。即LINE,英文的首字母,系线性、独立、正态、等方差。

  开始着手

  我们开始一个实例来给大家解释一下这张的问题。

  借用某地方病研究调查的吧名正常儿童的尿肌酐含量。估计有几个含量与年龄的之间的关系。

  变量设置

  数据录入

  我们可以直观的看出,它的变量本身就是两列数据,X和y。因此不男看出,我们实际上是需要将X的数据和y列的数据。行,一个趋势分析,碳是否呈线性关系。他实际上是要求一个线性方程。y=kx+b。

  分析过程

  我们最好先来画一下该组数据的散点图,看数据是否呈线性关系。

  执行以下命令:

  散点图命令

  我们采用简单分布

  调整变量

  将尿肌酐含量作为y轴,年龄作为x轴,也就是说,尿肌酐含量是否随着年龄的变化呈现线性关系。

  散点图

  最后出现的散点图我做了一个红颜色的趋势线,实际上这些交叉点均在红色的趋势线左右分布,并没有特别离群的点,也就说明是可以做后续分析的。

  接下来是要做正太分析的,要不然不一定符合要求的。

  线性命令

  线性回归的方程变量

  这里我们是需要调整变量,以便检验正态性过程中对数据的线性关系处理

  统计量

  这里的回归系数统计量是估计参数,方法是模型的拟合度,残差采用的D-W方法

  图形输出

  这里要求的是图形输出的情况,当然,参照方法将SRESID作为Y轴,将自变量DEpnt作为X轴。选定直方图和正态概率图

  结果分析

  变量

  因为只有年龄一个自变量,所以这里的输入变量为年龄

  模型检验

  这里就是对模型是否可以进行线性回归方法进行操作的条件,看sig=0.04<0.05,因此,认为符合正态分布和方差齐性,可以进行检验

  参数

  这里的系数就是最重要的内容,设计到方程的建立,看到常量,实际上就是Y=kx+b里面的b,也就是b=1.662,而年龄系数为0.139,也就是k=0.139,好啦,线性方程出来了,y=0.139x+1.662。

  线性散点图-P-P图

  正态分布直方图

  后面两图用来回应数据内容,正态性和散点分布情况。

  后记

  是你回归的方法,操作起来可能比较麻烦。,但是如果知道其中的原理。该方法变得十分的简单。好了,今天就到这里了。欢迎转载,注明出处。谢谢大家!

标签: HarmonyOS