用SPSS做数据分析(1)

写在前面:

爬虫今天停更一天,今天是周六,今天要把最近网课学习SPSS课程做个总结和回顾,明天继续更新爬虫的内容,今天这篇文章主要是SPSS中的数据管理,一些关于数据的简单操作,是属于SPSS中比较基础的内容,希望看完博客能动手亲自实践一下,会有奇效

SPSS数据管理:

1.数据的录入:

1.采用SPSS软件将原始数据进行录入
2.采用其他软件录入,保存为其他数据格式的资料,如xls,txt(有格式的).sys等

SPSS中的数据文件格式:

😐

数据文件 文件拓展名 对应窗口
数据文件 .sav 数据编辑窗口
语法文件 .sps 语法编辑窗口
输出文件 .spv 结果管理窗口
脚本文件 .sbs 脚本窗口

在SPSS中打开对应格式的文件,根据提示保存和修改自己需要的格式
重要的是变量视图中的变量的一些属性

2.数据的保存:

SPSS能够把数据保存为各种数据的格式
在这里插入图片描述

3.数据的整理:

在数据分析之前,往往需要对数据进行整理.

1.数据合并

  • 数据量很大时,经常需要将一份大的数据分成几个小部分,将这些若干个小的数据文件合并成一个大的数据文件,是进行各种统计分析的前提
    数据 ---->添加数据
    在这里插入图片描述

合并类型:

1.纵向合并:是几个数据集中的数据的纵向相加,组成一个新的数据集,新数据集中的数据就是原来几个数据集中的总和,实质就是两个数据文件的变量列,按照各个变量名的含义,一一对应进行首尾连接合并,两个数据文件的变量相同,合并的目的是增加分析个案.(添加个案)
合并条件:

  • 两个待合并的SPSS数据文件,其内含合并是有意义的
  • 为方便合并,在不同数据文件中,内容含义相同的列,最好起相同的名字,变量类型和变量长度也要尽量相同
    2.横向合并;按照记录的次序,或者某个关键变量的数值,将不同数据集中的不同变量合并为一个数据集,新数据集中的变量数是所有原数据集中不重名变量的总和,实质就是将两个数据文件的记录,按照记录对应,一一进行左右对接,合并的两个数据文件的变量不同,但具有相同个案例数.(添加变量)
    合并条件:
  • 如果不是按照记录号对应的规则进行合并,则两个数据文件必须至少有一个变量名相同的公共变量,这个变量是两个数据文件横向对应相等的依据,称为关键变量.如学号,贵宾卡号等(这个变量的值在同一个数据集中必须是唯一的,不然也不能作为关键变量)
  • 如果是使用关键变量进行合并的对应,则两个数据文件都必须事先按关键变量进行升序排列(必须做的,容易出错)
  • 为方便SPSS数据文件的合并,在不同数据文件中,数据含义不相同的列,变量名应该为不同的名称

2.数据个案的拆分:

  • 在进行统计分析时,只需要对具有某种特性的数据进行分析,俺么就涉及到分组分析,则可以通过查分数据集加以实现,它能够使数据分析过程暗战分组变量进行分组分析,得到各个组的结果.

数据---->拆分文件
在这里插入图片描述

3.数据个案的排序

数据编辑窗口个案的前后次序是随机的,其先后顺序是由录入时决定.在做统计分析时,对数据进行排序,能更好的了解数据.
数据 ---->排序个案
在这里插入图片描述
完成对职工号进行排序的结果:
在这里插入图片描述

4.数据汇总:

数据 ----->分类汇总—函数(选择合适的函数)

5.数据的加权:

为了在统计分析中让计算机知道每个分类或者每一个区间组段的频数,需要定义权重变量.
权重变量通常表示每个分类或者每个区间组段的频数,它是数值变量,且必须取正值.

数据 ---->加权个案—选择需要加权的变量

6.数据重复查找:

数据—>标识重复个案

7.个案的选择:

在数据分析过程中,根据不同的要求,需要从SPSS中对所有个案中筛选出特定的个案进行分析,这可以通过给数据表设置选择条件或者过滤条件,来满足这一要求.
选择类型:

  • 按条件选择(常用)
    给出一个SPSS条件表达式,选择符合该表达式的个案.
  • 按数据范围选择(常用)
    选择一定的数据范围内的全部个案,要求给出数据范围的上,下界的个案编号
  • 随机选择
    对数据编辑窗口中的所有个案进行随机筛选
  • 过滤变量选择
    指定一个已经存在的变量作为个案选择的标准

数据----->选择个案----写函数表达式

8.计算新变量:

  • 使用SPSS算术表达式及函数,对所有记录或者满足SPSS条件表达式的记录,计算出一个新结果,并将结果存入一个指定的变量中
  • 通过使用SPSS算术表达式,SPSS函数,SPSS条件表达式进行实现

转换-----计算变量----使用SPSS算术表达式,SPSS函数,SPSS条件表达式
在这里插入图片描述
在这里插入图片描述
求出了性别是男的三门功课的平均成绩
在这里插入图片描述

9.变量值的重新编码:

数据分析中,将连续变量转换为等级变量,或者将分类变量不同的变量等级进行合并是常见的工作.比如知道班级每位同学的平均成绩,但是需要将这些同学的成绩分为优秀,良好,中等,差4个等级,那么如何通过SPSS功能来完成这一任务呢?重新编码过程可以很好地完成这一类任务

什么是重新编码?
重新编码相同变量:对原始变量的取值进行修改,用新编码直接取代原变量的取值
重新编码不同变量:将新编码存入新的变量,根据原始变量的取值生成一个新变量来表示分组情况.

写在后面:

说一些题外话,这篇文章比较基础,写的也不是很好,但是我感觉最重要的是:基础的东西,其实你需要实际去操作,才能掌握的更深,同时我最近都会更新关于SPSS做数据分析的系列文章,如果你喜欢,或者你需要这方面的文章不妨一起学习,一起进步?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章