零.引言

在现代汉语词典大家族中,以学习词典命名或者以语文学习、语言学习为编纂目的的词典已经有50多部。从编写原则、体例、配例、收词范围、读者画像、词典释义等几个方面来看,它们彼此之间的差别是很明显的。比如《汉语学习词典》(1998)是一部适合中学生、中小学教师和其他中等以上文化程度的读者使用的内向型语文词典。这部词典编写的初衷是为母语者的语文学习服务的,所以收词、释义以现代汉语为主,兼顾古代汉语。

《现代汉语学习词典》(2010)也是一本内向型的语文词典,但是这部词典收词注重时代性和文化性,收词、释义和配例尽量贴近人们的现代语言生活,追求通俗易懂,深入浅出,在释义用词用语方面,显然已经有了元语言的意识。更重要的是该词典还标注了词类、语类,标示了名词的典型量词搭配,这对非母语学习者来说是很有帮助的。该词典还特别设置了“注意”栏目,提示一些特殊用法和易错字词;同时还设置了“辨析”栏目,对同义词、易混词等进行辨析,这可以为汉语二语学习者所利用。同义词辨析、近义词辨析是汉语二语学习者最头疼的事,也是教师最头疼的事,因此这部分显然考虑到了汉语二语学习者的需求;此外该词典还设“语汇”栏目,附列逆序词界定的近义词,帮助学习者扩大词汇量;设“知识窗”栏目,介绍与词语有关的知识和信息。部分条目配有插图,作为释文内容的补充。这虽然是一部内向型的现代汉语词典,但是汉语二语学习者和汉语教师也可以使用。

吕叔湘主编的《现代汉语八百词》(1980)是我国第一部现代汉语用法词典,主要供非母语人士学习汉语使用,虽然这本书不以词典命名,但这的确是一本外向型的学习词典,汉语第二语言学习者和汉语教师都可以使用,汉语研究者也可以从中找到很多有研究价值的问题。在此期间相继问世的外向型学习词典还有:《现代汉语学习词典》(孙全洲1995),《现代汉语常用词用法词典》(李忆民1995),《当代汉语学习词典》(张志毅2020),

《商务馆学汉语词典》(鲁健骥、吕文华2006)。其中《商务馆学汉语词典》是专门为汉语第二语言学习者编写的,收录常用字2400多个,常用词10000多条,词典在编排上显示搭配和用法,注意说明词的使用环境,标注词的具体用法。释义追求准确易懂,易为外国学生接受,显然编者已经具备了原始的元语言意识。此外,还有《汉语水平考试词典》(邵敬敏2000)、《汉语5000词用法词典》(郭先珍、张伟、周行健2015)、《汉语教与学词典》(施光亨、王绍新2011)、《现代汉语用法词典》(冯志纯2010)等等。

外向型词典编纂过程中,很多编者已经有了元语言的意识。但这种元语言的意识还是比较原始和初步的。词典编纂者已经注意到,要用通俗易懂的字、词和句子来对词条进行释义,考虑到了词语之间的搭配,考虑到了同义词、近义词的辨析,但是还没有完全考虑到元语言的提取并严格运用提取出来的元语言词汇。根据杨玉玲、宋欢婕、陈丽娇(2021)对《商务馆汉语学习词典》的统计,虽然元语言词汇总量控制在6000词左右,但是仍有16.38%的超纲词。而且6000词的元语言词汇对于第二语言学习者来说还是太多了。

从目前外向型汉语词典编写和出版的现状来看,很多编纂者已经意识到元语言的重要性,但是在具体操作的过程中仍然有很多技术性问题,这些问题并不容易解决,需要进行有针对性的专题研究。在词典释义和用例方面如果采用元语言词汇,词条的解释势必会有局限,甚至会出现释义不充分不准确。这显然是一个悖论:追求释义的元语言性,会牺牲释义的充分性和准确性;追求释义的准确性和丰富性,会增加学习者的词汇负担。一本好的外向型词典应该在二者之间求得平衡。

一.汉语学习词典的学术研究

在外向型汉语学习词典的研究方面已经有学者出版了著作或发表了论文。比如张宜华(2011)《基于用户认知视角的对外汉语词典释义研究》从用户认知的角度对外向型词典的释义进行研究;蔡永强(2016)《对外汉语学习词典学》首次尝试从理论上搭建体现“编纂者—词典文本-用户”互动的“对外汉语学习词典学”;翁晓玲(2017)《基于元语言的汉语学习词典释义模式研究》对《商务馆学汉语词典》的释义模式中的元语言进行全面分析,从释义模式上归纳为三种模式:框模、词模与句模;从词典结构上分为三个维度:宏观结构、中观结构与微观结构,三者纵横交错,内容涵盖宏观结构、中观结构、微观结构的释义框模元语言以及释义词模、释义句模元语言,由此全书构拟出一个汉语学习词典释义模式元语言的分析框架,为汉语学习词典元语言系统研究提供了一个新的视角。

刘若云、张念、陈粉玲(2012)用元语言的理论,对外向型学习词典的用例语言和内容进行研究;杨玉玲、宋欢婕、陈丽娇(2021)力图将元语言的理念和意识贯彻到词典编写的每一个环节。但是我们也注意到,有时为了使用更加简单的词语和句子来给词释义和配例,反而损害了释义的充分性和准确性,因此使用元语言词汇与词典释义的充分性和准确性之间是有矛盾的。张志毅《当代汉语学习词典》(2020)按照理念先行的思路进行编写界定的近义词,以“义细、例丰、元少、用多”8个字为原则,《当代汉语学习词典》所用元语言词汇4233个,可以看出编者已经尽力了。这部词典探索性很强,但是篇幅不大,收词只有6683个。

外向型的语言学习词典元语言问题的研究已经被越来越受重视,但在实践当中依然会遇到各种各样的问题。我们应针对这些问题进行理论的探讨和实践的检验。

二. 汉语学习词典中的元语言研究

元语言的概念来自于逻辑学和哲学领域的“说谎者悖论”。这个逻辑学悖论可以追溯到公元前2世纪的古希腊学者厄皮门尼德(Epimenides),他设想出一个自我否定的命题:所有的克里特岛人都是说谎的。该命题简化为“我在说谎”(“我”是克里特岛人),如果

“我”提出的这个命题是假的,那么“我在说慌”就是真的;如果“我”提出的这个命题是真的,那么“我在说慌”就是假的,这显然是一个矛盾。这是因为语言表述涉及到了对象语言(object-language)和元语言(meta-language)。

词典释义就是在用语言解释语言,很难避免这种说谎者悖论。所以在词典中需要专门用来释义的元语言系统,但是这个元语言系统应该有多大,如何提取,运用中如何解决释义不充分不准确,这些都是实际的问题。在语言学领域和词典学领域,已经有一些学者在探讨元语言理论、元语言释义和元语言观的问题(苏新春2003,安华林2005,赵新、刘若云2009),这些探索为词典编写中元语言的提取和运用打下了基础。

元语言又被称作纯理语言,理论上,这是我们在讨论语言问题的时候必然会用到的一些基本概念和基本词汇,它们必须是清晰的,而且是不需要也无法为其他概念所界定的。同理,我们在编写外向型词典的时候用来释义的语言形式必须是最基本的元语言。不仅仅是在词典编纂中会用到元语言的概念,在自然语言处理的过程当中,也必须归纳出一些元语言。比如Wierzbicka(1996)以及Goddard(2002)把语言中的各种词归纳为15种自然的语义原语(也就是元语言范畴)。具体如下:

互相依赖的近义词互相依赖的近义词互相依赖的近义词_界定的近义词_沉着近义词严肃近义词

这15个语义原语就是15个大的语义范畴,我们可以用这些基本的原语概念来表述外部世界的种种表现。这些语义原语是我们对外部世界的自然分类,也是提炼元语言的基础。这15个大的语义范畴彼此之间是不能交叉的,每一类语义范畴对内应该具有普遍性,对外应该具有排他性。但是这15个语义范畴并不能完全涵盖语言中所有的基本概念,比如汉语语气词所表达的情态范畴在这里就找不到。

众所周知,语言的意义存在于我们的心理词典中,而且是以网络系统的形式存在的。如果以“新媒体”和“传播”为核心的语义关系,通过语义网络分析工具我们可以画出下面的语义网络图:

互相依赖的近义词互相依赖的近义词互相依赖的近义词_沉着近义词严肃近义词_界定的近义词

在我们的心理词典中,没有哪一个意义是孤立存在的,意义和意义之间是有联系的,“新媒体”与“创新”“融媒体”“数字化”“视觉传达”“传统文化”“红色文化”等概念意义产生关联,“创新”与“路径”“发展策略”“传播路径”“文化产业”“乡村振兴”“艺术设计”等概念意义产生关联,“新媒体”与“传播”产生关联,这样就构成了两个语义网络,而这两个语义网络之间又通过语义共性联系起来。在这个语义网络的任何一个终端,都可以再建立自己的语义网络,如“数字媒体”,可以关联更多的语义单元。从这个意义上说,符号系统的语义网络很像是我们所处的宇宙,每一颗星球都处在一个系统中,这个系统又与更大的系统产生关联,更大的系统再与其他的系统产生关联。我们知道太阳系是银河系的一部分,而银河系只是宇宙当中的一小部分。但是在这个系统中不管有多少个星球,它们的基本构成成分都是分子、原子和量子。

两个有内在关联的词汇,无论相距多远都会发生量子纠缠。在语言符号的语义网络中,每一个意义都可以在语义的网络中找到自己的位置,每一个意义都与其他的意义发生联系。语义的网络是一个层级体系,我们的心理词典与我们可以看到的各种词典在结构上是不一样的,我们现在看到的词典所有的词条都是按照一定的顺序排列的,目的是有利于检索,而心理词典是按照层级体系排列的,这是我们认识外部世界的自然结果。所以认知语言学认为意义就在我们能够意识到的经验当中。发现意义的途径只能通过内省,通过抽象、联想和概括等一系列思维过程。当然内省的结果可以用实验的办法、计算机模拟的办法或者语料库的办法去验证。在网络系统中,概念意义与概念意义之间的距离是可以进行空间计算的。元语言的提取也应该照顾到我们的认知过程,要与我们的心理词典有对应关系。但是研究语言意义时会碰到至少三个挑战,这些都是不能回避的。

第一个挑战,是循环论证的问题。比如我们怎么知道一个词的语义是什么?我们要用词或者句子来解释这个词的意义,这在同一个语言里边,有时很难做得圆满。比如在解释“牢固”这个词的时候,用的是“结实;坚固”;在解释“结实”的时候用的是“坚固;牢固”(《现代汉语词典》第6版),在解释“坚固”的时候用的是“结合紧密,不容易破坏;牢固;结实”(《现代汉语词典》第6版)。由此可见,在编写词典的时候如何处理同义词和近义词的释义问题是一个很不容易处理的难题。我们应该避免用A解释B,用B解释A的情况,这种“互训”的现象在词典释义中是硬伤。

第二个挑战,是我们如何准确地界定一个语言单位的意义。有些使用频率很高的词,很难精确地下定义。比如“跳”的意义是什么?词典里给的解释是:腿上用力,使身体突然离开所在的地方。但是没法解释“皮球跳得很高”,因为皮球是没有腿的。因此词典里又增加了一个义项,叫做物体由于弹性作用突然向上移动。但是这个定义没法解释眼跳、心跳这样的意义,眼跳和心跳不是由于弹性作用,也不是向上移动,于是只能再加一个一项,叫做一起一伏地动。假如反过来问,当你看到“一起一伏地动”这样一个句子的时候,你会想到这是“跳”吗?“跳舞”“跳神”“跳槽”“跳井”“跳楼”“跳海”“跳绳”“跳水”中的“跳”应该怎样释义?它们是同一个意义单位吗?语义与知识相关,但是如何区分语言知识和百科知识?“太阳每天东升西落。”根据语言学知识,这个句子没有错,它的意义也是清楚的。可是根据百科知识,地球的自转导致太阳每天东升西落这个现象,但这只是一个假象,天文学知识告诉我们这种认识是错的。

第三个挑战,是我们理解一个语言形式的意义时离不开对语境的理解,而语境不是一个稳定的参数。比如“你要钱还是要命?”这句话究竟是什么意思呢?如果是一个蒙面歹徒对你说这句话,那是他想要你的钱,否则要你的命。但如果是你的至爱亲朋跟你说这样的话,只是向你表达劝诫,不要把钱看那么重,不要玩命赚钱,生命比钱更重要。类似于“要”这样的虚词都是使用频率极高的,它们的意义很难把握,在词典编写的时候也很难确切地表达出来,如“要”的一个义项是这样写的:“因为希望得到或收回而有所表示;索取:要账|小弟弟跟姐姐要钢笔用”(《现代汉语词典》第6版)。看到“因为希望得到或收回而有所表示”我们很难想得到这是“要”的意义。这还涉及到了语言学的另外一个分支学科——语用学。而在词典编写中给出的例句不可能包含很全面的语境信息。

为了解决循环论证的问题,有人提出元语言的概念,要用这些元语言的词汇来解释语言中的其他词汇。在第二语言教学领域这个问题尤其突出,词典和教材里的生词注释,如果采用元语言的话是比较合理的,否则有可能会用一个超纲的词来解释词典里的一个生词,即用生词解释生词。但是在自然语言当中,很难找到这些元语言,因为它们必须是中性的,意义单纯的。因此又有人提出用形式语言来描写语义,这就是形式语义学(formalsemantics)。形式语义学把语言符号中的意义用形式化的方式表达出来,这对于自然语言处理来说是有帮助的,但是对于汉语二语学习者来说未必合用。

语言中的意义除了理性意义之外,还有色彩意义和语体意义。孙淑芳、薛文博(2016)运用自然语义元语言的理论对俄汉语的情感词“сочувствие”(同情)进行了实证分析,以此来说明自然语义元语言理论的解释力。在词典释义时,如何考虑不同意义之间彼此的联系?如在赞美一个女孩子长得好看时可以用很多的形容词,这些形容词彼此之间是有联系的(我们根据BCC语料库中它们出现频率的高低做成下面的“词云”):

互相依赖的近义词互相依赖的近义词互相依赖的近义词_沉着近义词严肃近义词_界定的近义词

对于外向型汉语学习词典来说,大家对建立这样一个元语言系统是没有争议的,关键是建立一个什么样的系统和如何建立这样一个系统。词典中对词汇意义的阐释只能用最基本的词汇,而哪些词汇是最基本的词汇?同义词辨析也需要有一些基本的元词汇系统,否则就会造成循环释义。例如:

融入:融合

融入(róngrù)有混入,融合的意思。指小的事物进入大的整体,成为整体的一部分。多指精神层面的融合和接纳。

①融入社会|融入团体|融入集体

②高科技日渐融入人们的生活当中,使现代人愈发注重生活质量了。

融合(rónghé)表示几种不同的事物混合成一体。也指不同个体或群体在接触之后,认知、情感或态度倾向融为一体。

③这座建筑物融合了东方和西方的诸多文化元素。

④线上与线下的互动融合已成为新时代零售行业变革的主要方向。

“融入”和“融合”在意义上有交叉,但是在释义的时候不能有交叉。这就需要一个元语言系统。李葆嘉(2003)提出“面向信息处理的现代汉语元语言研究”这一课题,也提出现代汉语元语言系统,认为有词汇元语言、释义元语言和析义元语言、认知元语言四个层面。孙道功(2011)《现代汉语析义元语言词典》依据代表性、广布性和共现性三原则已收入

3500词,并基于词的词汇信息、常规信息、语法信息、释义信息、类义场信息、义征表达式信息、义位组合信息等属性字段建立了文件结构。这是为语言工程服务的元语言词典,其中的一些做法值得借鉴和吸收。

张博(2008)指出,对外汉语教学界对学习者易混淆词的辨析基本上是在近义词的框架下进行的,缺乏量化调查和认定标准,也缺乏对学习群体的针对性。因此张文提出编纂外向型易混淆词辨析词典的几个基本原则:(1)面向单一母语背景的汉语学习者;(2)兼顾频率、分布和常用度选收词语;(3)兼收与词混淆的词组和语素;(4)以词义和搭配关系为辨析重心;(5)行文采用学习者的母语;(6)适当控制语例所用词语和句子结构的难度。在体例设计上,应注意针对混淆点进行辨析,将词义辨析与搭配规则的提炼结合起来,优先讲解和列举当用词,避免强化错误,适当分析致误原因。这为汉语外向型学习词典的编写提供了另外的思路,值得参考,尤其是对于双解词典的编写来说,用学习者的母语来解释词义也有很多问题值得深入探讨。

尽管大家对元语言的概念有不同的理解,但是在词典学当中对象语言和元语言的二元对立是相当明确的。词典中的对象语言就是被解释的词条,元语言是用来解释这些词条的工具。这个工具可以包括自然语言中的基础词汇,也可以包括一些抽象的符号。在词典编纂中,不只是义项的释义需要有元语言的意识,配例和用法的阐释也需要有元语言的意识。张志毅(2004)提出语文辞书元语言的12种规则:同质、科学、等值、整体、组合、简化、明言、单义、规范、程序、原型、大词库。杨玉玲(2021)运用JIEBA分词软件和QUITA词频统计技术,从一部近700万字的外向型汉语学习词典中提取出2994个释义元词,并对其频率分布、增长趋势、难度分布、用字情况等进行了全面分析。统计结果显示:2994个释义元词与《汉语水平词汇等级大纲》的重合率为88.2%,11.76%的超纲词是专有名词和释义功能词;甲、乙、丙级词共占76.5%;释义文本难度为初等二级;2994个释义元词共用汉字1609个,和《汉语国际教育用音节汉字词汇等级划分》3000汉字的重合率为99.5%,仅有8个汉字不在3000常用汉字之内。这是有相当大的难度的。

汉语外向型学习词典的单语词典是用汉语来注解汉语,双语词典是用汉语和其他语言来注解汉语。我们发现有的词典采取了多模态的展现形式,由语言、符号、图画、表格共同完成释义的任务。其用意就是用最简单、最基本的词汇和语句来解释更为复杂的语义内容。但是如何找到这些最简单最基本的词汇和语句形式呢?这确实是一个难题。我们认为汉语学习词典的元语言问题包括以下几个方面:

第1个问题是,汉语学习词典的元语言词汇应该有哪些?与现在正在使用的词汇等级大纲的关系是什么?能不能在元语言词汇集和等级大纲之间建立一种联系?

第2个问题是,汉语学习词典的元语言词汇是如何提取出来的?其科学性和有效性如何保证?

第3个问题是,汉语学习词典的释义、配例、同义词辨析、近义词辨析和相关的知识信息都应该使用元语言词汇吗?

第4个问题是,汉语学习词典中的例句在句法难度上和句子长度上也应该有元语言的观念,但是在具体操作时应该怎样落实?

第5个问题是,汉语学习词典中的文化内容也应该有元语言的观念。也要考虑元信息(meta-informative)和元认知(meta-cognition)的问题。当然这是更高一个层次的问题。说到底语义网络跟认知是有联系的,我们可以通过一些语义分析工具来找到词汇之间在语义上的连结网络,并把它们作为词典编写的参照。

第6个问题是,在编写外向型汉语学习词典时,如何观照自然语言中的语义网络和认知概念网络的问题。词典中的任何一个词都不是孤立存在的,它总是与其他的词在意义上产生联系。这种联系就会构成一个语义网络,而这种语义网络是有认知基础的。如何去发现这个网络,并用合适的语言把这个网络描写出来,不管是自然语言还是形式语言,甚至是多模态的形式。

三.结语

外向型学习词典的编纂是一件不容易的事,既要考虑到词典释义和配例语言的简单易懂,又要考虑到释义的准确性和充分性,这两者之间是有矛盾的,这是带着脚镣跳舞的工作。元语言的提取和应用就是对编写者的一种限制。这其中的甘苦,只有编写者自己知道。发现词典中存在的问题比较容易,提出一些建议和意见也比较容易,但真正要把这些意见和建议落到词典编纂的实际工作中确实存在很多困难。

随着计算机技术的发展、网络技术的发展和各种语料库、数据库、教材库的建成使用,词典编纂有了可资借鉴的工具和数据来源,我们可以利用技术手段解决词典编纂过程当中元语言词汇的提取问题,也可以在编写的过程中随时核查所使用的释义语言、配例语言、文化知识扩展语言中的词汇是否有超纲词,元语言词汇的提取和应用问题也有望得到解决。

目前一些电子版词典的研究也已经提上议事日程,为方便用户使用,电子版词典不能简单地把纸版的词典直接放上去,而是要发挥电子版词典的优势,词汇和词汇之间的关联、词义和词义之间的关联、汉字和汉字之间的关联、词类和词类之间的关联,在电子词典中可以比较方便地展示出来,这在纸版的词典中是做不到的。

作者简介

界定的近义词_沉着近义词严肃近义词_互相依赖的近义词互相依赖的近义词互相依赖的近义词

崔希亮

北京语言大学教授,博士生导师,曾任北京语言大学校长(2005-2017),中华炎黄文化研究会副会长,北京语言学会会长,中国语言学会常务理事。现任中国书法国际传播研究院院长,兼任世界汉语教学学会副会长,教育书画协会副会长。获北京大学文学学士、硕士和博士学位,加拿大麦克马斯特大学人文科学名誉博士、韩国启明大学艺术学名誉博士,罗马尼亚锡比乌卢西安.布拉嘎大学、康斯坦察奥维迪乌斯大学名誉博士。

研究方向:汉语国际教育、现代汉语语法与汉语熟语。