您当前的位置:首页
 > 专题栏目 > 阿拉善盟社情与民意调查中心

调查问卷法中数据和资料的收集及分析

问卷法是在科学研究的过程中向研究对象收集研究资料和数据的一种方法,问卷法总是为一定的研究目的服务的,我们大多数时候难以做到对所研究的总体进行调查,但为了保证所做研究的或实验效果的普遍性和应用性,在用使用调查问卷法时,就要从取样(选取具有足够代表性的样本)、了解问卷测量的准确性、根据统计学的理论对数据进行有效的统计分析等方面去研究和控制。

一、在设计问卷中应注意的问题:

⒈问卷法是研究过程的一个关节,它是为一定的研究目的服务的,应该首先有一个明确的研究内容、主题或目标,问卷的设计不是随意的,是有目的的,是有服务对象的,而且研究某一课题时通常是有一个事先的猜想,并且设定自变量和因变量,研究它们之间的因果关系。
  ⒉一份问卷在设计完了以后不是马上就可以去发放的,要考虑问卷的设计是否能达到研究的要求,应该有一个调整、修改的过程。
  ⒊问卷设计好以后不是随意的发给一些人就可以了,让人去回答问卷并收集上来的过程就是我们在研究中取样的过程,无目的的做法必然造成资源的浪费,并且也不能取得有用和可靠的数据和资料。
  ⒋问卷的设计、取样、数据的收集和分析是一个系列的工作,哪一个环节的缺失都不能完成研究工作。

二、问卷法数据和资料的收集的有关方法:

⒈取样

研究的取样问题是研究的关键环节,样本并不一定是"越大越好",抽取有充分代表性的小样本,即可取得反映总体特征的可靠资料与数据,这样不但能接生人力、物力,而且能显著的提高研究的效率,取样还能起到减少损耗、保护总体的作用,(因为被测对象受到"污染"不利于作进一步的研究)。以缺乏代表性的样本进行的研究,其结果的可应用性是十分有限的,不少研究结果之所以至尽颇有争议而且应用甚少,其中一个原因是由于与这些理论有关的研究在取样方面存在严重缺陷,使这些研究难以重复或验证。
取样所应该事先考虑的问题是:所研究的是什么总体?需要多大的样本?样本的主要特点是什么?如何选取这种样本?如何使样本具有足够的代表性?如何减少取样的误差?等等。
取样的过程实际上包括三个方面(1)规定总体,对总体作出明确的定义;(2)选取样本,运用适当取样方法抽取样本;(3)统计推论,从样本的统计数据估算出总体的有关参数。样本是有偏或者无偏的,采用无偏的样本,统计推论才能得出符合实际的参数值。
  取样的方法很多,这里介绍四种比较好掌握的方法:

①简单随机取样法(simple random sampling):

在随机取样中,总体中每一个体被抽选的机会是均等的,运用随机取样方法所选取的样本称为"随机样本"。

可以使用严格制作的随机数字表,随意的"进入"包含总体数目的随机数字区,选取所需要的样本数目。在研究者对所研究的总体中各类个体的比例不了解的况下,简单随机取样是最好的取样方法,但如果样本较小,简单随机取样就可能发生偏向,例如:从1000名学生中抽取20名学生,有可能抽到的都是男生,补救的方法是加大样本数量。

②分层随机取样(stratified random sampling):

先把总体分成若干层次或子总体,然后独立、随机的从每一层次选取样本,所谓层次,就是指不同类型的个体。例如:高一、高二、高三三个不同层次。为使所取样本是比较理想的"无偏"样本,最好采用非比例分层取样的方法,例如:高一学生350人,高二学生270人,高三学生200人,若按同比例取样,高三的学生数目就会少,而高一学生数目就会很多,所以可按10%,13%,17%的比例分层抽样,可获得"无偏"样本。还应注意的是,对于非比例样本,还应以各层次数目与总体数目的比例值对结果进行加权。

③系统取样法(systematic sampling):

是从总体中取一随机起点,从该起点开始选取每k项元素(个体或分数等),直至取满所需要的样本量,k值一般以样本量与总体量的比值来确定。例如:在1000名学生中抽取100名,样本与总体的比值是1/10,在系统中取样时就从随机起点开始分别选取第10名、第20名……。此方法比较简单,而且样本更为准确,但应注意:以随机数字表(这种数字表在大多数统计书中都可以找到)决定第一样本元素;此外,要是在总体中也存在周期性波动或变化,所取样本易发生系统性偏差。

④聚类取样法:

在研究不知道或不很了解总体的特征时,可以采用聚类取样法,即先把总体分成若干群类,然后在各群类内进行取样,这种方法成本较低。并且,为了提高精度,必须把总体细分,尽量做到减少群类间的差异,尽可能加大群类内的差异,而上面所讲的分层取样发则尽量加大层次间的差异而缩小层次内的差异,相比之下,聚类取样更为有效。

此外,还有非随机取样法、方便取样法、顺序取样法等等,可以根据研究所涉及的学科的不同适当选用取样方法的。

⒉问卷测量的准确性:

问卷设计必须使问卷的测量具有一定的准确性,问卷测量的准确性包括五个方面的特点:效度、测量工具之间的相关、同质性、信度和分数的分布。
以上每一项的测量都有相关的公式和方法,它们所涉及的数学知识比较简单,如果需要的时候可以到相关的统计书中进行查找,但需要说明的是,每一项指标的评定方法都不止一种,要视问卷的具体情况而定,这是一个比较复杂的过程,问卷调查的目的与问卷的设计之间的因果关系要很清楚,对问卷的设计也没有理论依据,只是凭借对调查问卷的一般认识而设计的,内容只是出于同学对某问题的兴趣,没有研究的方向和课题,对于如果真正进行问卷调查之后的又要做些什么也没有考虑,应该说这些问题的产生是很正常的,当我们知道了一项研究的设计包含着一系列相关的方面:研究的理论框架、收集数据的方法、加工数据的途径以及样本设计等等以后,再加上相关的理论学习,就可以做一些简单的研究工作了。
在这里只简单的说明以上五点中的一些内容,让大家对于研究的方式方法有一个感性上的认识。
  ⑴信度:测量的信度即可靠性,它是测量反映被测特征真实程度的指标,有人称之为测量的准确性,即:测量信度是指测量结果反映出个体某方面的真实的个体差异。高信度的测量很少受到随机因素或事件的干扰,能够准确无误的测量出所需的各种特征和过程。测量信度有相应的估算公式,一般来讲,测量误差越小,信度越高。
影响信度的因素有:①测量项目的数目:在一定限度内,一个测验或一次测量中所采用的性质相同的项目越多,测量信度也越高。②测量的程序:测量程序对测量信度的影响很大,包括测量的指导语、程序安排、测试场地的环境、多组测量之间的间隔时间等等。③测量项目的质量:例如问卷中的选题设计应具有代表性。④测试人和受试者都会对信度有影响。
  ⑵效度:指测量的有效性,即测量到的是不是所要测定的特征。例如:如果一项语言能力的测验测得的竟然是机械能力,那么这种测验就完全没有效度。效度的指标比较复杂,分成很多种类型,在这里就不一一讲述了。
  影响效度的因素有①测验的组成:选题与构思、测验的长度、项目的难度等等。②测量程序;③所用样本与受试者的特点等等。
  信度和效度的评定标准很多也比较复杂,如有需要可以去查阅相关的书籍和资料。

⒊数据的处理:

用问卷等方法所得到的结果,可以收集到一些或大量的数据,对数据的处理可以分为统计和分析,并得到研究结果的过程。

⑴统计(分析):是研究方法的重要组成部分,在此基础上才能做进一步的分析和研究,在做统计分析时首先要了解数据的特征。当收集了数据后,需要用计算机做出一些数据图形,然后观察数据所表示出的特征,其中包括数据的集中趋势、离散程度、偏态度、峰态度等,并且判断数据呈现一种什么样的分布,如正态分布、二项分布、t分布、f分布、x2分布等等,用来判断数据的呈现规律。它们各有其特点和用途,但其中以正态分布最常用,最基本的,统计学的许多技术问题,只有在假定总体观察值为正态分布时才得以解决。

⑵数据的进一步分析:

例如:相关分析:自变量与因变量之间的关系。
  回归分析:猜想或寻找数据的规律,主要用途是预测将要发生的事件。
  除此之外根据研究内容的不同需要,还有很多种其它的分析方法。这些工作很少借助人力,有专门进行统计的软件,例如象spss、sas

编辑:阿拉善盟统计局
信息来源:阿拉善盟统计局
Produced By 大汉网络 大汉版通发布系统