专门科技语体和通俗科技语体多特征对比研究

更新时间:2009-03-28

一、引 言

科技语体,亦称“科学语体”,也有少量文章简称为“科技体”或“科学体”。汉语科技语体最常见的分类是将其分为专门科技语体和通俗科技语体,前者的功能是“准确而系统地记述自然、社会或思维现象,严密论证这些现象的规律性”[1],后者则是向非专业人员深入浅出地说明各类科学问题,具有普及科学知识、激发学习兴趣的作用。

高比例风电并网下基于卡尔多改进的深度调峰机制//菅学辉,张利,杨立滨,韩学山,王明强//(8):110

我国的语体研究取得了诸多成果[2],但截至2016年5月,“知网”中有关科技语体的研究论文仅133篇。其中英汉科技语体对比研究4篇,外语(包括俄语、英语、法语、日语、阿拉伯语)科技语体研究66篇,汉语科技语体研究只有63篇。本文是基于汉语的科技语体研究,故我们对汉语科技语体研究文献进行了重点考察。结果显示,我国的汉语科技语体研究,尚存在如下几个问题:

Q:您爱人是哪个国家的?平时在国内的时间长还是国外的时间长?国外的风俗习惯和国内差别大吗?特别是中西方教育最大差别在哪里?

第一,重视程度有待提高。从共时看,“知网”收录篇名包含“语体”的论文有两千多篇,其中汉语科技语体论文只有63篇,占比不足3%。从历时看,从1965年第1篇到2005年以来每年100篇以上,语体研究论文数量显著增加,但汉语科技语体研究论文数量所占比例不增反减。这说明,学界对汉语科技语体的研究缺乏应有的重视。

 

表1 汉语科技语体研究的几个视角

  

研究视角文献举例数量5非对比 对 比理论研究《科学语体的语言特点》[3]《浅论科技语体中的“似乎VP”句》[4]《现代汉语科技新闻语体述要》[5]《科学语体与艺术语体的差异性研究》[6]科技语体的概念、特点等的宏观研究科技语体中具体语言现象的微观研究科技语体中下位具体分支语体的研究科技语体与文学或艺术语体的对比研究《语体功能翻译方法及其在C/E科技体翻译中的应用》[7]11 9 19应用研究合计19 63

第二,研究视角有待拓展。表1归纳了我国汉语科技语体的研究视角。本文认为,专门科技语体和通俗科技语体在语体、风格上都有很大差异,因此有必要将二者进行区分并进行深入的个体研究或对比研究。但“知网”显示目前只有2篇论文[8-9]研究通俗科技语体,尚未发现单独探讨专门科技语体或将二者进行对比的研究论文。

专门科技语体和通俗科技语体各20万字(不含标点),前者共有126933个词次(token)、13477个词型(type),后者共有133196个词次、15677个词型。

第三,研究方法有待改进。上述63篇汉语科技语体研究,有39篇运用定性方法,24篇不同程度地运用定量方法,主要集中于单个或少数语言特征的对比分析,如《科学体与艺术体定中结构的比较》[10]《艺术语体和科技语体方位词差异研究》[11]等。单特征或少数语言特征的对比分析虽使个别语言特征的研究得到了深入,但无法系统反映其语体全貌,而且多数研究在样本选择上也往往“以偏概全”,以专门科技语体的语料来代表全部科技语体。

由表10可见,两分支语体在句长和长短句分布上差异很大。从长度看,专门科技语体小句均长比通俗科技语体多2.25词。Miller曾对瞬时记忆广度进行过研究,认为人的记忆广度约为7±2个单位[15]。以此为据,二者句长关系可表现为“5〈通俗科技语体〈7〈专门科技语体〈9”,可见句子较长是专门科技语体的特点之一。从标准差看,专门科技语体整句句长、小句句长的标准差分别比通俗科技语体多8.05字和3.12字,这说明专门科技语体的句子长度更加参差不齐,而通俗科技语体句子之间的长度差异则相对较小。

因此,本文基于大规模标注语料库,运用多特征计量方法,力图对专门科技语体和通俗科技语体的语言特征进行较为细致、深入的对比,同时结合各自的情境特征对其语体特征成因进行探讨。该研究,在理论上将语体研究的少数语言特征对比拓展至多特征对比,深入到语体特征成因的功能解释层面。在实践上亦有多方面价值,该研究用于翻译,可提高科技文本汉译的精度;用于教学,可增强科技文章写作的直观指导;用于语言信息处理,可提高科技语体自动识别的可操作性。

二、语料构成、统计工具和语言特征提取

(一)语料构成

本文语料来自国家语委现代汉语通用平衡语料库,在选择语料时,综合考虑了字数、作者、内容、来源和时间跨度五个方面。专门科技语体文本主要来自教材、著作和期刊,通俗科技语体文本主要来自著作和期刊,时间跨度尽量对齐,尽量选择不同作者的文本,每个文本截取2000字(不含标点),建成了共200篇总计40万字的对比语料库(见表2)。

(二)语料分析和处理工具

本研究使用的语料分析和处理工具有:史晓东分词和词性标注软件;Debug分标注语料词频统计程序、词汇密度和句长统计程序;SPSS软件;Microsoft Access和 Microsoft Excel软件等。[12]

(三)语言特征提取

分析采用自动标注与人工标注相结合,共提取55个语言特征,涉及词汇、语法、修辞三个层面。词汇层面包括词长、超用词、罕用词、标准型/次比、词型覆盖率以及部分词类和特定词语。词类统计使用史晓东分词系统,部分特定词语的考察则基于以往相关文献的研究结论。比如程恒(2008)指出判断动词“是”和存在动词“有”在科技语体中的频次较高[13],本文即对这两个词语进行了考察;尹世超(1985)认为科技语体句子繁化的表现形式之一是并列成分多[14],本文则通过考察“和”类连词来统计“带形式标记的联合短语”。句子层面考察了句长、句类、复句等,修辞层面考察了比喻、拟人、反问、设问和引用五类辞格。

突突突,突突突……底柱身后三挺马克沁突然怒吼起来,不到最后时刻,底柱是不动用高处这座碉堡内机枪的,这是五连的底牌,轻易不肯暴露目标。

三、专门科技语体和通俗科技语体的语言多特征对比

张广才岭属于长白山支脉,位于中国东北地区东部山地北段的中轴部位(孙红阳等,2015),近年来,该区域大面积成熟林被砍伐,随后建立了落叶松(Larix gmelinii)人工林,同时部分裸地形成次生林。尽管如此,张广才岭地区仍然残余部分成熟森林,此区域的成熟林至少达 400 a,自禁止商业性采伐政策执行后,次生林和人工林林龄也约达50 a。目前,此区域由人工林、次生林和成熟林形成的森林景观为研究不同森林类型中生物多样性模式提供了理想的环境。

(一)词类和部分特定词语对比

均值比较和T检验结果显示,34项词类和特定词语(见表3)中有28项存在显著差异。其中10项(名词、介词、连词、外语词、方位词、区别词、助词“的”、其他助词、科学符号、“和”类连词)在专门科技语体中的出现频次显著高于通俗科技语体;18项(人名、量词、副词、叹词、熟语、处所词、状态词、拟声词、语气词、助词“得”、助词“地”、第一人称代词、第二人称代词、第三人称代词、疑问代词、指示代词、时态助词、判断动词“是”)在通俗科技语体中的出现频次显著高于专门科技语体。其他6项中的5项(地名、存在动词“有”、时间词、数词、动词)在专门科技语体中的频次高于通俗科技语体,另1项(形容词)在通俗科技语体中的频次高于专门科技语体,但都不存在显著差异。

 

表2 语料分布概况

  

领域专门通俗海洋7篇5篇气象2篇2篇农林10篇10篇数学3篇2篇物理10篇9篇电子5篇8篇生物24篇23篇化学11篇13篇天文9篇16篇地理5篇3篇医学14篇9篇总计100篇100篇

 

表3 专门科技语体和通俗科技语体词类和部分词语的标准化频次(千分比)

  

的地得语言特征名词人名地名外语词方位词处所词时间词形容词状态词数词量词动词专门体343.214 7.671 5.606 11.338 30.020 3.476 8.031 51.573 0.487 41.056 26.464 239.284通俗体266.391 15.790 3.818 0.603 26.752 7.442 7.989 54.784 3.983 41.310 34.597 238.293语言特征判断动词“是”存在动词“有”科学符号第一人称代词第二人称代词第三人称代词疑问代词指示代词“和”类连词其他助词时态助词专门体14.616 7.947 2.818 1.622 0.144 7.305 1.073 0.018 2.314 7.611 7.617通俗体16.586 7.259 0.015 16.472 6.325 18.694 5.923 0.021 0.859 4.169 24.469语言特征拟声词叹词介词连词副词区别词语气词熟语专门体7.209 0.213 0.629 0.031 0.000 50.817 43.473 58.159 10.387 1.156 6.190通俗体6.342 0.769 2.626 0.871 0.975 40.153 23.977 86.118 5.018 16.915 8.424

如前所述,程恒在艺术语体和科学语体的对比中提出判断动词“是”和存在动词“有”在科技语体中的比例较高。本文没有对比科技和文艺语体,但统计结果显示,判断动词“是”在专门科技语体和通俗科技语体中的出现频次分别为14.616‰和16.586‰,存在动词“有”分别为7.947‰和7.259‰。也就是说,在科技文本平均1000个词中,判断动词“是”有15个左右,存在动词“有”有7个左右。后文我们在“高频词”统计中发现,判断动词“是”在两个分支语体中都是处于第3位的高频词,“有”是分别处在第6位和第13位的高频词(见表7)。这一结果进一步验证了程恒2008年提出的结论。尹世超认为科技语体句子繁化的表现形式之一是并列成分多,本文统计结果显示,“和”类连词在专门科技语体和通俗科技语体中的比例分别为2.314‰和0.859‰,前者显著高于后者。

(二)词长对比

型/次比是词型(type)与词次(token)数量之比,用于考察语体的词汇丰富度。简单的型/次比并不能说明问题,因为文本越大,值就越小,因此若要精确得出文本的词汇使用情况,则需计算标准型/次比。本文利用自编程序对文本进行标准化处理,分别计算出了两分支语体的标准型/次比,见表6。结果显示,通俗科技语体标准型/比高出专门科技语体约4个百分点,二者在假设方差相等的情况下存在显著性差异。这说明通俗科技语体的词汇使用明显比专门科技语体更加丰富多样。

表4显示,两分支语体的平均词长分别为1.58和1.50,二者存在显著差异。表5显示了两分支语体从单音节词到六音节及以上各音节词的分布情况。其中通俗科技语体的单音节词比例超过55%,明显高于其双音节词比例,这说明通俗科技语体虽诉诸于笔端,但具有相当程度的口语化特征。而专门科技语体中的双音节词比例高于其单音节词比例,双音节与其他多音节词比例之和超过54%,说明专门科技语体书面化特征更强。

 

表4 专门科技语体和通俗科技语体平均词长对比

  

均值平均词长专门通俗方差方程的Levene检测F 2.154 Sig.0.144 t 1.58假设方差相等假设方差不相等均值方程的t检验df 198 192.075 Sig.(双侧)1.50 6.703 6.703 0 0均值差值0.075 0.075标准误差值0.011 0.011

 

表5 专门科技语体和通俗科技语体具体词长对比

  

均值方程的t检验词长均值(百分比)Sig.(双侧)方差方程的Levene检测F 0.997专门Sig.0.319 45.666 0.177 39.999通俗55.310 2字词1字词0 0 0 0 1.385 0.241 3.469 3字词4.042 6.230 0.013 1.126 48.674 4字词1.230 0 0.347 0 0 1.002 0.318 48.707 1.839 0.043 0.065 5字词0.032 6字词及以上t-10.641-10.641 10.402 10.402 2.567 2.567 0.938 0.938 5.191 5.191 0.791 0.791假设方差相等假设方差不相等假设方差相等假设方差不相等假设方差相等假设方差不相等假设方差相等假设方差不相等假设方差相等假设方差不相等假设方差相等假设方差不相等df 198 194.513 198 191.858 198 186.767 198 182.958 198 120.014 198 192.288 0.011 0.011 0.35 0.35 0.43 0.43均值差值-9.644-9.644 8.675 8.675 0.574 0.574 0.104 0.104 0.281 0.281 0.011 0.011标准误差值0.906 0.906 0.834 0.834 0.223 0.223 0.111 0.111 0.054 0.054 0.013 0.013

(三)标准型/次比对比

本文对于词长的计算仅限于汉语词汇,分别统计两类语体的平均词长和不同音节词的比例。一般而言,单音节词比例越高,口语化程度就越高;双音节词比例越高,平均词长越长,语体的书面化程度就越高。

《重生》三部曲与英国军人的男性气质危机 ……………………………………………… 王 岚 周 娜(5.80)

(四)超用词对比

超用词是指文本中出现频次高的词,表7显示的是两分支语体中按频次由高到低排位前50的超用词。结果显示,二者在超用词的使用上,差异显著。首先,从超用词的出现频次来看,专门科技语体前50位超用词频次所占比例之和较通俗科技语体低约7个百分点。其次,从具体的词语使用来看,专门科技语体超用词中名词、助词、介词、连词比例较高,尤其是抽象名词(如“作用、系统”)在专门科技语体中出现频次高;而通俗科技语体超用词中动词、形容词、数词、副词、代词比例较高。此外,人称代词在两分支语体中的分布差异最为明显。人称代词在通俗科技语体中不仅出现频次高,而且各类人称代词均有出现;在专门科技语体中则仅第三人称代词(“它”和“其”)频次较高。此外,语气词“了”、助词“得”“着”也仅出现在通俗科技语体的前50个超用词中。

 

表6 专门科技语体和通俗科技语体标准型/次比对比

  

均值(百分比)均值方程的t检验标准型/次比专门通俗t Sig.0.611 Sig.(双侧)47.375 43.414假设方差相等假设方差不相等方差方程的Levene检测F 0.260-6.181-6.179 df 258 257.047 0 0均值差值-3.961-3.961标准误差值0.640 0.641

(五)罕用词对比

罕用词是指出现频次低的词,本文通过计算不同频次段的词型比例来对比两分支语体中罕用词的使用情况。表8显示,在出现频次为1—4的每个频次段里,通俗科技语体的词型比例都高于专门科技语体;在5—500的每个频次段里,专门科技语体的词型比例都高于通俗科技语体;而在500以上的频次段里,通俗科技语体的词型比例又开始高于专门科技语体。这表明,通俗科技语体的低频词和高频词比例都高于专门科技语体,而专门科技语体的词汇使用则多集中在中频词上。该结果既和前面的超用词统计结果相一致,又与标准型/次比的统计结果相印证(因为通俗科技语体低频词比例高,词型就多,标准型/次比自然就会高)。

 

表7 专门科技语体和通俗科技语体超用词对比

  

22 2 在10 23 3 是11 1 的24 12超用词词型词次(合 计7 中8 了14 16 18 19 20 21 25.79%种6 有合 计对而就时能可到大4 和0.57 0.38 0.90 0.59 13 0.32 0.51 0.46 0.71这0.56 0.42 1.26 0.39 0.34 5 一0.29 0.29 1.46 0.27 1.49 0.66 0.27 0.26 9 个0.25 34 7.18 28 33 36 29 37 30%)超用词 词 型 词次(39 31 40 41 42也43 44 35 46 47 48 49 27 38 50所系 统作 用为其它与后以地可 以都于及使两专门科技语篇很与研 究内下并进行动 物26从0.24 0.22上0.23 0.22 0.22%)超用词 词 型 词次(0.22 0.24 0.22 32 0.21 0.21 0.24 0.21 0.22 0.20 0.20 0.24 0.19 0.19 0.19 0.18 0.18 0.18 0.18 12 13 14 6 0.24 7 5 8 15 16 4不2 9 32.80%10 17 19 20 21 22 23 11 24这我了个的是有不地在就了着上他和说它我们你里到小一1.87 3 1.66 1.14 1.39 0.95 0.77 0.90 0.80 0.77 1.33 0.73也0.70 0.70 0.69通俗科技语篇0.69%)超用词 词 型 词次(0.62 0.60 0.55 0.50 0.48 0.45 0.44 0.43 29 31 32 33 30 34 36 17等45 28 1 37 46 35 38 39 40 41 42 43 44 45 47 48 49 50又人那大很去都还能中得种看来27她会他们什 么可 以从两出好0.31 0.32 0.34 0.33 0.31 0.30 0.29 0.31 0.29要26 0.28 0.39 0.33 0.27 0.21把18 0.26 0.21 0.37或0.26 6.31 0.25 0.24 15 0.23 0.21 0.38 0.22 0.22 0.33%)为0.17 25 25 0.37 0.21

 

表8 专门科技语体和通俗科技语体罕用词对比

  

语篇专门通俗出现频次词型比例词型比例1 2 3 4 44.27%45.49%14.82%16.14%7.83%8.64%4.92%5.48%5-50 25.28%22.27%51-100 1.66%1.04%101-200 0.78%0.53%201-500 0.34%0.24%501-1000 0.06%0.09%〉1000 0.04%0.07%

(六)词型覆盖率对比

专门科技语体的超用词比例低于通俗科技语体,但其绝大多数词型的词型覆盖率却高于通俗科技语体,究其原因,在于专门科技语体的用词主要集中在中频词(见表8)。正是中频词的大量集中使用,使得专门科技语体在超用词和词型覆盖率之间的关系上整体呈现出不同于其他汉语语体的独有特征。

③工程项目划分时,应按从大到小的顺序进行,这样有利于从宏观上进行项目评定的规划,不至于在分期实施过程中出现层次、级别和归类上的混乱,漏掉一些施工内容。一般在划分初期,首先对照初步设计批复文件确定单位工程,之后逐个确定分部工程、单元工程。质量评定时,由低层到高层逐级进行工程质量控制和质量检验。

 

表9 专门科技语体和通俗科技语体词型覆盖率对比

  

语篇 前N个词型505001000150020004000600080001000012000专门通俗覆盖率(%)覆盖率(%)25.79 32.80 54.73 57.78 66.41 66.98 73.26 72.62 77.97 76.57 88.21 85.81 92.92 90.81 95.68 93.83 97.26 95.74 98.84 97.24

 

表10 专门科技语体和通俗科技语体句子均长和标准差

  

整句小句语体专门通俗词数/整句25.28 16.67字数/整句40.862 25.079标准差25.522 17.472词数/小句8.34 6.09字数/小句13.484 9.159标准差8.333 5.209

  

图1 词型覆盖率趋势图

词型覆盖率是文本中前N个词型出现的词次数与总词次数的比例,其比值就是前N个词的词型覆盖率。一般而言,超用词比例高的文本词型覆盖率也高;而罕用词或低频词比例高的文本,词型覆盖率则较低,这样的文本词汇较为丰富。专门科技语体和通俗科技语体的词型数分别为13477个和15677个。本文最初以2000个词型为一段,计算从前2000个词型到前12000个词型的覆盖率。结果显示,专门科技语体的词型覆盖率始终高于通俗科技语体(见表9)。而前面的超用词统计结果显示,专门科技语体的超用词比例显著低于通俗科技语体(见表7),这与一般的超用词与词型覆盖率之间的关系不符。于是我们将词型覆盖率的分段计量向前推至前50、前500、前1000和前1500词。此时结果显示,专门科技语体在前1000个词型之前,其词型覆盖率都低于通俗科技语体(这就和超用词的统计结果及一般的规律相一致了),到前1500个词型之后,专门科技语体的词型覆盖率就开始一直高于通俗科技语体(见表9和图1)。

“那是,我不喜欢的工作我都干五年了,人一辈子有几个五年?我想过得幸福点,干自己喜欢干的事儿,过自己喜欢过的日子,这要求过分吗?”

为了更好地促进创业型中小企业的发展,企业应该在企业核心竞争能力的基础上,及时对自己企业所具备人力资源或人才质量进行检测,并及时为企业增添新的力量,及时为企业培养有发展潜力的人才,以在企业面临问题的时候很快地提供核心人才。除此之外,企业还应该适当地在企业中建立人才招聘标准、工作人员绩效考核、后备人才的培训以及企业各岗位的职业技能培训等等。总而言之,不断地加强人力资源管理战略是促进创业型中小企业快速发展的关键部分。

(七)句长对比

通过句长(包括整句和小句)统计,不仅可获知文本的句子分布概括,一定程度上也能反映出语体的书面化程度。本文利用自编断句程序和ROST PreLang字词句篇章文集预处理程序(0.9.8.52版)分别提取出语篇中所有的整句和小句。然后将结果导入Excel进行人工校对,删去所有标点,计算出专门科技语体和通俗科技语体的句子均长和标准差。

止水条膨胀剂速凝剂防冻剂防水剂光亮剂砂浆剂破碎剂堵漏剂脱模剂保坍剂灌浆剂界面剂着色剂蒸养剂养护剂缓凝剂早强剂泵送剂发泡剂引气剂絮凝剂阻锈剂增稠剂粘接剂增强剂流平剂

第四,研究深度有待加强。学者们大多认为专门科技语体逻辑严密、高度抽象、内容概括、表意准确、论述客观;多用语义单一的书面化词语,词法严谨、句法规范,在修辞上受限较多。通俗科技语体内容通俗易懂、语言生动形象,常用具体词语代替抽象词语、科学术语,句式富于变化,修辞选用较为自由。虽然学者们对上述特征基本达成共识,但细化程度有待提高,对其语体特征成因及导致二者语体特征差异的影响因素也需进一步探讨。

(八)句类对比

情境特征是指与语言运用相关的情境因素,情境特征决定语体的语言特征。Biber(2009)[18]认为情境特征的分析非常重要,他形成了一个能够广泛应用于各类语体分析的情境特征框架:参与者、参与者间关系、渠道、生成环境、背景环境、交际目的和话题。本文结合汉语专门科技语体和通俗科技语体的情境特征,对其语言特征及二者差异进行功能解释。

 

表11 专门科技语体和通俗科技语体句类对比

  

语体专门通俗陈述句98.55%83.53%疑问句1.45%10.00%感叹句0.00%3.85%祈使句0.00%2.62%

(九)比较句对比

马恕凤(2007)认为科技语体往往通过比较的方法对两种及以上的事物进行相对精确的论证,因此科技语体中的比较句较多[16]。我们对语篇中出现的所有比较句都进行了人工标注。结果显示,专门科技语体和通俗科技语体中的比较句分别占总句数的5.42%和6.71%,前者比后者少1.29%。此外,经过细致考察我们还发现,专门科技语体中通过“于”字进行比较的句子有41个(占0.82%),通俗科技语体中仅有4个(占0.05%)。可见,专门科技语体惯于使用“于”字进行比较。

为了培养符合时代要求的人才,一些高校尝试实行创新型教学模式。教学不再局限于课本知识,旨在拓展学生的创新思维和发散性思维。

(十)复句对比

按分句间的意义关系,复句可分为联合复句和偏正复句。通过对复句的考察,可以得知语体的严密性和逻辑性。本文考察了递进复句、因果复句、转折复句、假设复句和条件复句。受标注方法限制,我们仅统计了带形式标记的复句分布情况。

表12是五类复句在两分支语体中的所有形式标记及分布状况。从数据看,五类复句在专门科技语体中的比例均高于通俗科技语体,按差异显著程度由高到低排列,依次为因果复句>假设复句>转折复句>条件复句>递进复句。尤其是因果复句,二者差异达到5%以上。

 

表12 专门科技语体和通俗科技语体复句对比

  

复句类型形式标记因果复句转折复句假设复句条件复句递进复句由于、因为、因而、因此、所以、故、因为(由于)……所以(故、因此、于是、以致、从而)、之所以……是因为、既然……那么虽然、尽管、但、却、然而、可是、只是、不过、虽然(虽说、虽是)……但是(然而)若、如果、如果(假如、假使、假若、倘若、倘使、要是、如、若、若是、万一)……就(便、则)、即使(就算、哪怕)……还(也)只要、不然、否则、除非、无论、只有……才、不论(无论、不管)……都(总)而且、并且、甚至、以至、何况、尚且、别说、不仅(不但、不光、非但)……而且(也、还、反而、连)在语篇中的比例专门8.66%4.68%4.16%2.19%1.04%通俗3.17%3.43%2.06%1.30%0.78%

 

表13 专门科技语体和通俗科技语体的修辞对比

  

语体专门通俗比喻0.82%2.74%拟人0.66%11.20%反问0.00%1.86%设问0.88%1.28%引用4.14%0.14%

(十一)修辞对比

科技语体内容较为专业,因此为实现好的交际效果往往会选用一些有助于说明对象的辞格,这一特性与比喻、拟人的认知功能相契合,因此文本对比喻和拟人辞格进行考察。反问和设问既是疑问句的细化,也属于修辞范畴,前者表强调,后者常作为引出下文的“引子”,二者都具有引起注意的功能,因此本文也对其进行考察。此外,高平(2000)指出引用是科技语体不可或缺的表达方式之一[17]。因此我们也对引用进行了考察。

在经济全球化、文化多样化、社会信息化等多方面因素的交叉作用下,当今世界进入了“不确定性时代”,国际秩序的变革为中国战略传播创新提供了难得的历史机遇。“一带一路”倡议的传播作为国家战略传播的重要内容,成为了一个研究热点。

表13显示,两分支语体在辞格使用上也存在较大差异。专门科技语体只有“引用”比例显著高于通俗科技语体,其他四类修辞使用频次都明显比通俗科技语体低。反问修辞在专门科技语体中没有出现。拟人手法在两类语体中出现的频次差异最大(超过10%),这是由于通俗科技语体中有20篇科技文艺作品是科学童话,通篇采用拟人手法写就,而专门科技语体中完全不存在此类语篇,只有少量拟人化的句子。

四、专门科技语体和通俗科技语体的语言特征功能解释

句类分为陈述句、祈使句、感叹句和疑问句。由于未发现可供使用的句类标记软件,本文采用人工标注方法,以标点为句类形式标记,以“句号”表示陈述句、“问号”表示疑问句、“叹号”表示祈使句和感叹句(二者再需人工区分),进而统计四种句类的分布情况。由表11可见,两分支体的句类分布差异也十分明显。专门科技语体句类单一,只有大量的陈述句(占98.55%)和极少的疑问句(占1.45%);通俗科技语体各类句子则均有出现,除陈述句外,其他三类句子比例都高于专门科技语体。

专门科技语体和通俗科技语体在生成环境和背景环境上没有明显差异。背景环境对二者的语言特征影响不大,生成环境则决定了二者均以书面形式呈现,都有充足的时间来生成、编辑、修改或校对,因此二者都具有书面文本的规范性。专门科技语体和通俗科技语体的情境差异主要体现在参与者、参与者间关系、渠道、交际目的和话题五个方面(见表14),也正是这五个方面的不同,直接导致了专门科技语体和通俗科技语体在很多语言特征上的差异。

1.从参与者及参与者间关系来看,科技语体的参与者只有发话者和受话者,即作者和读者。专门科技语体的作者多是科学技术领域的研究人员、专家,少数是受过专业教育的学习者,受话者既有相关领域专家,也有具备相关知识储备的学生、学者。通俗科技语体的作者社会属性相对复杂,有研究人员、专家学者,也有具备相关科学技术知识的作家或文学爱好者,受话者则是科技领域的初学者或对科学技术感兴趣的青少年和儿童。从参与者间关系来看,专门科技语体的作者和读者都是同一领域的专家、研究者、学习者,因此知识共享程度较高;而通俗科技语体面向科技领域的初学者或没有相关科技知识的青少年和儿童,因此读者和作者的知识共享程度低。正是上述参与者及参与者间的关系差异,使得专门科技语体的文本更加追求专业性,而通俗科技语体的文本显得更加通俗化。所以专门科技语体的专业术语、科学符号多,平均词长、平均句长也都比较长,介词、连词、复句、名词、多音节词等出现频次也都高于通俗科技语体,这些都是专门科技语体追求专业化,聚焦于信息和表达明确性的重要体现。而通俗科技语体之所以比喻、拟人等修辞手法较多,人名、代词、助词、熟语、判断动词和时态助词等出现频次都高于专门科技语体,则是其追求趣味性和通俗化的表现。

 

表14 专门科技语体和通俗科技语体情境特征对比

  

无直接互动读者与作者的知识共享程度较高情况复杂基本不存在私人关系书面形式;科学笔法出版物有时间计划、编辑、修正或精读、或速读,有机会重读不共享公开交际场合说明、解释多种多样(如期刊论文提出新观点,教科书对学习者教育、指导)基本是真实的,有部分推论表达认知立场海洋、气象、农林、数学、物理、电子、生物、化学、天文、地理、医学多种多样情境特征专门科技语体科技领域的研究人员、专家、学者发话者(作者)参与者科技领域的研究人员、专家、学者受话者(读者)参与者间关系渠道生成环境背景环境互动性共享背景知识社会角色私人关系表现形式特定媒介生成接收参与者是否共享时空环境公开或私密的交际场合一般交际目的交际目的具体交际目的话题真实性立场表达涉及领域话题通俗科技语体科技领域的专家学者或具有相关科技知识的作家、文学爱好者科技领域的初学者或对科技感兴趣青少年和儿童无直接互动读者与作者的共享程度较低作者在知识领域比读者更加权威基本不存在私人关系书面形式;文学笔法出版物有时间计划、编辑、修正或精读、或速读,有机会重读不共享公开交际场合说明、解释多种多样(如科普文章普及知识、科学故事激发兴趣)以真实信息为主,有部分虚构内容以表达认知立场为主,部分带有个人观点海洋、气象、农林、数学、物理、电子、生物、化学、天文、地理、医学多种多样

2.从渠道和交际目的来看,渠道方面,专门科技语体和通俗科技语体都以书面形式通过出版物形式呈现在读者面前,不同的是,专门科技语体通常以科学笔法来呈现内容,常伴有公式、图表等形式;通俗科技语体则以文学笔法来呈现内容,常设定一定的故事情节,并配有人物、动物或自然景象的图片。交际目的除了共同具有的介绍、解释和说明外,专门科技语体常通过客观论证和推论提出新观点,通俗科技语体的主要目的则是引发读者对科技的兴趣,因此可以通过虚构故事或情节的方式来呈现相关的科技内容。专门科技语体在体现专业性的同时,也表现其表达的严谨性和客观性,所以专门科技语体的陈述句、“引用”较多,表现各种逻辑关系的复句较多;而通俗科技语体则采用多种表现手法并带有相当程度的主观性特征,所以通俗科技语体中人名、量词、副词、代词、处所词、状态词、拟声词、语气词等的出现频次显著高于专门科技语体,并伴有较多的比喻、拟人、疑问、祈使和感叹等。

3.最后从话题来看,尽管专门科技语体和通俗科技语体都涉及11个科技领域,但是因其具体话题不同,直接导致了两类语体在超用词、罕用词、标准型/次比和词型覆盖率等几个语言特征上的不同。专门科技语体的话题聚焦于科技领域的某一具体话题,领域不同,话题不同,用词也往往不同,因此专门科技语体里不会出现复现率非常高的专业词语,所以我们看到,在专门科技语体的前50个高频词中,只有“研究”“作用”“系统”和“动物”几个专业性词语进入前50个超用词中,但没有一个进入前25个高频词中。从前50个高频词的总体比例来看也远低于通俗科技语体。通俗科技语体的前50个高频词则全部是在通用语体中复现率非常高的语词,这些词语在通俗科技语体中的高频出现进一步说明了通俗科技语体在话题上的大众化特点。而通俗科技语体罕用词出现频次高于专门科技语体,则反映出通俗科技语体话题的分散性。专门科技语体尽管不同领域不同作者聚焦于不同的话题,但与广大的生活话题或虚构的文学世界相比,专门科技语体的话题范围毕竟狭窄得多,其内容与通俗科技语体相比相对集中,因此其罕用词出现频次并没有通俗科技语体高。通俗科技语体的话题范围广,聚焦的内容分散,因此罕用词多;罕用词多,其标准型/次比自然就较高。但正如前文所述,通常情况下,某一语体的高频词比例高,其词型覆盖率通常也会高,但是本文的统计结果却有些反常,本文中通俗科技语体的高频词高于专门科技语体,其词型覆盖率却低于专门科技语体。这是由于,通俗科技语体尽管高频词比例都高于专门科技语体,但大量的中频词比例却低于专门科技语体,因此导致其绝大多数词型的覆盖率都低于专门科技语体。

五、结 语

专门科技语体和通俗科技语体是汉语科技语体的两大下位分支。本文基于国家语委现代汉语通用平衡语料库,借鉴Biber多特征分析模型,采用定量和定性相结合的分析方法,对我国汉语专门科技语体和通俗科技语体的语言特征进行对比研究,并探讨其背后的影响因素。

在语言特征的提取上,本文以自动为主、人工为辅的方式标注了55个语言参项,涉及词汇、句子、修辞三个层面。经过均值比较、独立样本T检验和人工判断后,共得到49项显著差异。在词汇层面,名词、介词、连词、外语词、方位词、区别词、助词“的”、“和”类连词、其他助词、科学符号(共10项)在专门科技语体中的出现频次显著高于通俗科技语体;人名、量词、副词、代词、叹词、熟语、处所词、状态词、拟声词、语气词、助词“地”、助词“得”、判断动词、时态助词(共18项)在通俗科技语体中的出现频次显著高于专门科技语体。此外,专门科技语体的词型覆盖率高,双音节词多、词长较长;通俗科技语体的超用词多、罕用词多,标准型/次比高,单音节词多。在句子层面,专门科技语体句子更长,陈述句和表示因果、转折、假设、条件、递进等逻辑关系的复句较多;通俗科技语体句长适中,句类丰富。在修辞层面,引用在专门科技语体中出现频次高,比喻、拟人、反问、设问则在通俗科技语体中有较高的出现频次。地名、时间词、动词、存在动词、形容词和数词这6项语言特征在专门科技语体和通俗科技语体中不存在明显差异。

专门科技语体和通俗科技语体的生成环境和背景环境基本一致,使得二者均呈现出规范的书面语体的基本属性;一般交际目的、发话者和涉及话题领域的部分一致,使得二者呈现出科技语体的部分共性(比如大量或一些与科学技术有关的词语、大量或部分科学符号等,这也是科技语体区别于其他语体的一般共性)。专门科技语体和通俗科技语体在语言特征上的差异主要源于参与者及其关系、渠道、交际目的和话题等情境因素的不同。专门科技语体是科技领域相关人员的研究论证、学术传播,以科学笔法写就,话题范围较窄;通俗科技语体是面向科技爱好者的知识普及、兴趣激发,以文学笔法写就,话题范围广泛。因此前者会通过一些高频出现的语言特征以呈现专业科技语体的专业性、信息性、客观性、严谨性和表达的明确性,而后者则通过另一些高频出现的语言特征以呈现通俗科技语体的普适性、趣味性、多样性和大众化。

注释:

①本文利用自编程序对文本进行标准化处理,将126933词的专门科技语体和133196词的通俗科技语体分别拆分成1000词一段的小语篇,经处理后得到专门科技语体127篇、通俗科技语体134篇,然后再分别计算两类语体的型/次比均值,即是标准型/次比。

②此“了”为助词。

③此“了”为语气词。

参考文献:

[1]骆小所.现代修辞学[M].昆明:云南人民出版社,1994.

[2]骆健飞.韵律、语体、语法:汉语动词辨析及教学的新视角[J].云南师范大学学报(对外汉语教学与研究版),2015(1).

[3]王德春.科学语体的语言特点[J].语文学习,1983(3).

[4]宗守云.浅论科技语体中的“似乎VP”句[J].中国语文,2002(1).

[5]良止,赵娟廷.现代汉语科技新闻语体述要[J].修辞学习,2001(6).

[6]高明扬.科学语体与艺术语体的差异性研究[D].昆明:云南师范大学,2000.

[7]申英姬.语体功能翻译方法及其在C/E科技体翻译中的应用[D].延吉:延边大学,2001.

[8]邹洪民.消极修辞与积极修辞的辩证统一——谈阐释性通俗科技语体的语言特点[J].当代修辞学,1993(5).

[9]黎运汉,张维耿.通俗科学体的语言风格特点[J].暨南学报(哲学社会科学),1982(3).

[10]马晓红.科学体与艺术体定中结构的比较[J].社会科学家,2006(4).

[11]袁方.艺术语体和科技语体方位词差异研究[D].广州:暨南大学,2006.

[12]张未然.基于语料库的汉语词法能产性量化研究——以“儿、子、性、化、家”的派生为例[J].云南师范大学学报(对外汉语教学与研究版),2015(4).

[13]程恒.艺术语体与科学语体状中短语差异研究[D].广州:暨南大学,2008.

[14]尹世超.科技教育语体初探[J].语文研究,1985(2).

[15]Miller G A.The Magical Number Seven,Plus or Minus Two:Some Limits on Our Capacity for Processing Lnformation[J].The Psychological Review,1956(63).

[16]马恕凤.“比”字句在科技语体和艺术语体中分布情况考察[J].唐山学院学报,2007(4).

[17]高平.简论科技语体[J].洪都科技,2000(3).

[18]Douglas Biber,Susan Conrad.Register,Genre and Style[M].New York:Cambridge University Press,2009.

 
刘艳春,赵艺
《江汉学术》 2018年第03期
《江汉学术》2018年第03期文献
100%安全可靠
7X18小时在线支持
支付宝特邀商家
不成功全额退款