“大规模”由“大”与“规模”组合而成,其核心语义为“形容事物的范围、数量或程度远超常规”[1] 。该词在现代汉语中常被用于描述社会行动(如大规模扫黑行动)、学术研究及技术开发项目(如大规模汉语词汇知识库构建)等场景。
南京师范大学李斌团队于2021年主导构建了“大规模汉语历时词库”和“先秦词网(WordNet)”,旨在通过数字化手段系统梳理古汉语词汇的历时演变。该库覆盖词汇量逾16万条,解决了基础单位界定、词汇古今关联及跨语言对比等难题。
自秦汉时期起,汉语逐渐减少大规模造新字,转而组合现有字词创造新词汇(如“电脑”)。这一策略降低同音字混淆风险,提升沟通效率,成为汉语词汇发展的重要特征。
郑州大学团队整合24个多源词典及知识库,构建了包含16万条核心库及33万条扩展库的大规模汉语词汇语义知识库。该库为自然语言处理提供词汇语义及关系信息支撑,其自动合并算法效率显著优于传统方法。
腾讯AI Lab于2018年开源包含800多万词汇的中文词向量数据集,通过大规模多来源语料组合实现高覆盖率,涵盖传统数据集欠缺的短语及新兴网络词汇。
“大规模”在英语中对应“large-scale”“extensive”,德语中译为“groß angelegt”“umfangreich”,法语则表述为“sur une grande échelle”“en grand”等。其在专业领域应用频次差异显著:计算机科学技术领域引用达1545次,电子通信领域为637次。
警方曾展开大规模扫黑行动以整顿治安,此类行动具有覆盖区域广、投入资源多的特征,体现了该词描述社会活动时的典型语义指向。