如果把我们日常所说的话联成一个网络,这种网络会是什么样子呢?它的中心又是什么呢?科学家们发现真实系统的结构大多是一种具有小世界和无尺度拓扑特点的复杂网络,汉语的结构也是如此。以此为基础和依据,探寻汉语网络结构的中心节点,能加深对汉语结构以及网络结构动力的理解。
这项题为“汉语句法网络的中心节点研究”的成果发表于今年4月的《科学通报》第10期上。浙江大学的刘海涛教授与其博士生陈芯莹共同进行了该项研究。
人类对语言结构的研究和探索从未停止,而新兴的研究方法常常为语言研究注入活力,带来惊喜。最近兴起的网络科学,把整体概念带入到语言结构研究当中,成功地描绘出了“语言的地图”。
国内外有关语言复杂网络研究的成果不少。尽管语言网络的构造原则各有千秋,但大部分研究都偏重于对各种网络共性的探讨,例如小世界和无尺度特征等。这种偏重共性的研究,会给人“天下网络一般黑”的感觉,这使得语言结构的差异也被淹没在了语言网络的整体特征当中。怎么才能从这些相似的网络中挖掘出它们自己的个性呢?只能深入到结构的内部去,更加仔细地观察节点的分布特点,特别是中心节点的特点。
陈芯莹和刘海涛通过构建两个不同的汉语句法网络,依据词频和词分布选取了“的”、“了”、“在(介词)”3个虚词节点进行了网络特征值的测量,并分别将它们从网络中剔除,以观察对整体结构的影响。结果表明3个虚词均是网络的中心节点,但地位各有不同,它们对网络整体结构的影响也有较大区别。这一结果为汉语虚词研究提供了新的科学证据,首次量化了个别词对整个语言系统的影响。 该项研究还证明,汉语的句法结构具有鲁棒性。即使是在去掉最中心节点的情况下,绝大部分节点还能相互链接。
该项研究还指出,在网络结构的研究中应重视节点自身的特性。虽然宏观的网络数据很重要,但网络的构建动力、它们的形成、发展和变化的背后是节点的个性。节点根据自身的不同特性而自发地连接,最终形成了小世界、无尺度的网络。节点的个性才是决定各种网络结构的根源。
这项研究由国家社会科学基金资助,研究结果首次揭示了语言网络结构中不同中心节点的作用与特点,是近年来语言结构研究与网络研究的一个新突破,但研究人员表示,这项研究仍属于一项探索性工作,未来还有许多问题有待于进一步的研究。(来源:EurekAlert!中文版)
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。