统计学是自然科学、人文科学和社会科学中广泛应用的一种科学分析方法。因具有系统性、逻辑性、可操作性、可重复性、可简约化性等优点 ,统计学在语言学研究中大有用武之地。 (桂诗春、宁春岩 ,1997) 从国际语言学研究领域流行的趋势来看 ,在众多科研方法中 ,研究者大量使用统计分析方法。(韩宝成 ,2 0 0 0 ) 有研究表明 ,从 80年代后期开始 ,中国学者在语言学与应用语言学研究中使用现代化的统计和测量手段进行量化研究有了上升的趋势。(高一虹等 ,1999) 但近期国内研究者运用这些研究方法的情况如何 ?在实际操作过程中研究者是否能达到自己的研究目的 ?统计手段使用得是否恰当 ?笔者带着这些问题对 1995至 2 0 0 0年国内出版的十种外语类核心期刊中统计手段的使用情况进行了调查。经SPSS统计的数据 (见表 1)和卡方检验的结果显示 ,十种期刊 1995至 2 0 0 0年 5年之内发表的文章中统计手段的使用有着显著差异 (PearsonChi Square =80 0 71,Sig = 0 12 < 0 5 )。从数量上看 ,《外语教学与研究》中运用统计手段的文章最多 ,紧跟其后的是《现代外语》 ,接下来是《外语与外语教学》、《外语界》和《解放军外国语学院学报》 ,而《国外语言学》 /《当代语言学》和《外语学刊》中此类文章相对要少得多。但从质量上看 ,《现代外语》所刊登的很多文章的作者对统计手段都有较深的研究 ,注重严谨和多样化。仔细阅读运用了统计手段的这些论文 ,我们发现 ,国内学者虽然已经注意应用一些数据分析的方法 ,但相当多的人对统计手段不太熟悉 ,在各种统计方法的具体使用中有许多不尽人意的地方 ,下面我们将逐一分析表 1.各期刊统计手段使用频数期 刊统计手段描述统计T检验卡方检验相关方差分析回归其他合计国外语言学 /当代语言学解放军外国语学院学报外国语外语教学外语教学与研究外语界外语学刊外语研究外语与外语教学现代外语合计32 61115423536332 82 0 25584179392111388312726135 13111121112323115212152 24234 6132 588495105 387379 一、描述统计方法描述统计方法在所调查的十种核心期刊中用得最多。通常文章作者用交叉表列出每个范畴的频数 ,并计算其百分比 ,如《外国语》 1997年第 6期《英汉人称代词回指和预指比较研究》 ,《外语教学与研究》 1998年第 1期《书信语篇礼貌现象调查》、1999年第 4期《从认知角度看汉语的空间隐喻》 ,《外语界》 1997年第 1期《面向 2 1世纪开发新一代大学英语教材》等。有些作者在文章中还使用了相应的图表 ,如《外语教学与研究》 1999年第 1期《我国外语教辅类期刊语言质量现状和趋势》、第 2期《中、西应用语言学研究方法发展趋势》等。 关于集中量数 ,各期刊文章中使用平均数较多 ,没有发现使用中位数或众数报告数据的趋中位置的。这比较合理 ,因为平均数的计算涉及每一个数据 ,不像中位数只反映数据分布中段的情况 ,而众数在分布中不一定总是处于中段 ,因此可能不具代表性。此外 ,平均数计算简单 ,操作方便。(桂诗春、宁春岩 ,1997) 然而为了避免极端数据的影响 ,我们还应报告数据的离散量 ,因为数据分布的差异程度和离散程度也很有意义 ,如两个某次考试平均分一样的班级 ,在分数分布上可能迥异。注意到这一点的文章基本上都在列出平均数的同时报告数据的标准差。就大多数研究问题来说 ,这也够用了。有些文章仅用描述统计就可以反映问题了 ,但有些若能进一步做卡方检验或方差分析等 ,则更有说服力。我们将在下面举例说明。二、推断统计方法(一 )T检验T检验用以检验平均值的差异是否显著 ,由于可以不必考虑平均值是否呈正态分布 ,所以应该使用较多 ,但实际情况并非如此。如《解放军外国语学院学报》 1999年第 1期《论英语客观试题猜测的是与非及衡量方法》中 ,作者做实验 2时凭经验说明答题时间的差异 ,实际上可使用T检验。《外语教学》 1996年第 3期《论加强公共日语教学听力训练的必要性》一文 ,最后的成绩对比也应运用T检验。《外语教学与研究》 1999年第 2期《大学新生英语语营实践报告》中 ,营前、营后成绩对比应做一次T检验。《外语界》 1995年第 4期《应用CAI的一项研究》一文不需要做相关 ,也没必要看分布 ,应为简单的T检验。应该指出的是 ,T检验分为单样本T检验、配对T检验和独立样本T检验。其中配对T检验可比较一个样本实验前后的平均值有何差别 ,或是一批学生在两个不同的测试中的成绩有何差别 ,或是不同的阅卷员对同批试卷评分的平均值有何差别。独立样本T检验对两个样本参加一次测试的两个平均值做比较 ,这两个样本的数目不一定相等。这两种方法的原理大不相同 ,但很容易混淆。所以我们做T检验时应指出用哪一种 ,遗憾的是我们调查的文章中很少明确说明。另需注意的是 ,我们要保证两个对比组的安排是随机的 ,还要注意不能对几个组的平均值做交叉比较 ,因为这样会误导我们拒绝无差别假设 ,从而得出接受实验假设的结论。做交叉比较应使用方差分析。这样的错误我们的确在调查中发现了 ,如《外语教学与研究》 1998年第 4期《汉语主题突出特征对中国学生英语作文的影响》中的T检验有三组受试 ,1999年第 12期《大学英语学生 4级阶段词汇量状况调查》有三份试卷 ,都应做方差分析。《解放军外国语学院学报》 1998年第 4期《母语迁移与主体突出结构》、 1999年第 5期《外语语法学习中的年龄角色》 ,《外语教学》 1998年第 1期《硕士研究生使用英语学习策略的特点的实证研究》、2 0 0 0年第 1期《语言迁移对二外学习者英语写作的影响》 ,《外语教学与研究》 1998年第 1期《非英语专业本科学生词汇学习策略》、 2 0 0 0年第 5期《英语难词记忆法的实验研究》 ,《现代外语》 1995年第4期《完形—删词测试的评分程序的设计》等论文中很多使用了T检验 ,其实做方差分析更准确、简捷。(二 )卡方检验卡方检验是一种非参数检验 ,主要是检验频数的分布和某个概率分布模型是否一致。它有单向表和双向表两种检验 ,即把频数按一种或两种分类标准进行整理和排列 ,并了解同一因素内部或两个因素之间是否相互独立。在各种问卷调查中我们常需要使用这种方法来决定被调查人的各项反应是否有显著性差异。但是很多作者仅仅满足于描述统计 ,统计频数 ,计算百分比 ,没有进一步做卡方检验。如《解放军外国语学院学报》 1996年第 3期《英汉书评中的礼貌策略比较》 ,《外国语》 1996年第 5期《会话中的阻碍修正结构分析》 ,《外语教学》 1999年第 4期《理工科学生英语学习现状调查》、《培养大学生专业英语阅读能力探讨》 ,《外语教学与研究》 1995年第 3期《汉英部分语篇衔接手段的差异》 ,《外语界》 1998年第 2期《大学英语阅读课教师话语的调查与分析》、 2 0 0 0年第 3期《专业英语教学现状调查报告》 ,《外语研究》 2 0 0 0年第 3期《英语因果关系句汉译过程的心理语言学个案研究》 ,《外语与外语教学》 1995年第 1期《关于双语词典的形式描写》、 1998年第 3期《 97高考英语试题分析与 98命题预测》、 1998年第 7期《论大学英语听力测试新题型的增设》 ,《现代外语》 1995年第 1期《英汉词典自动转换生成汉英词典的计算机实验研究》、 1995年第 2期《从语篇思维模式看英文写作教学》、 1996年第 4期《针对“NTO”的听力训练》等。三、相关和回归(一 )相关相关分析主要检查变量之间的相互依存关系 ,如各种因素与学生成绩的关系、各评分员评判的一致性等。在调查的十种期刊中 ,相关分析是排在描写统计后使用得较多的一种统计手段。但在具体应用中我们还是发现了一些缺憾 ,如《解放军外国语学院学报》 1999年第 4期《内 /外向性格与英语学习》一文中相关系数表不清晰 ,系数值好像是忘标小数点了。《外语教学》 2 0 0 0年第 3期《心理素质与口语表达》一文没有报告相关系数。《外语与外语教学》 1997年第 6期《〈大学英语测试与专业阅读〉研究报告》中也没有报告相关系数、显著性。《外语界》 1998年第 3期《段落汉译英作为大规模标准化考试题型的可行性》中相关分析结论给得过早 :所抽样本大小没交代。我们不能将相关系数的显著意义和相关系数的意义混为一谈 ,因为相关系数的显著性水平和样本大小有关 ,样本小 ,误差大 ,因此要求也高。所以最好还应报告样本的大小。另外 ,《外语教学》 2 0 0 0年第 4期《论性格倾向对英语学习的影响》中作者在进行了相关分析后 ,又做了T检验 ,其实相关系数已经能体现显著性水平了 ,不需要再做T检验。《解放军外国语学院学报》 1999年第 1期《论英语客观试题猜测的是与非及衡量方法》的作者凭经验观察难度系数与学生把握度间的关系 ,实际上我们可进行相关分析。而《外语界》 1997年第 3期《浅谈大学英语课外教学》经过描述统计后 ,最好再做一个与成绩的相关检验。(二 )回归回归分析是考察几个自变量和一个因变量的关系。这些自变量各自对因变量都有所影响 ,但要考察它们联合起来对因变量又是怎样影响的 ,我们可以把这些因素放入多元回归的方程式里进行计算。《外语与外语教学》 1998年第 3期《外语学习动力与策略运用之关系》中做了回归分析 ,但没有提供回归公式 ,做得不够细致。四、方差分析若要分析几个变量同时起作
More summaries about the 十种外语类核心期刊(1995-2000)统计手段使用调查