语境是语言学科(语言学、社会语言学、篇章分析、语用学、符号学等)的概念。
语境概念最早由人类学家马林诺夫斯基所提出,分为情景语境和文化语境。也可以区分成语言性语境和社会性语境。 语境(语言的文化背景、情绪景象、时空环境等)的介入,一方面使多义的语言符号趋向单义,另一方面又使语言符号节外生枝,增生出语境意义。语境意义甚至可以掩盖语言符号自身具有的意义而成为交际的主信息。语境也控制着交际者对语言符号的选用。我们这里所谓的语境意义,是指在语境中,语言符号实际具有的涵义,包括赋予义和解释义。[1]
汉语中,“上下文”一词的出处,最早可追溯到唐代贾公彦《周礼义疏·秋官》。
《周礼·秋官》“原文:“若国札丧 ,则令赙补之 ;若国凶荒 ,则令委之 ;若国师役 ,则令槁之 ;若国有福事 ,则令庆贺之 ;若国有祸灾 ,则令哀吊之。凡此五物者 ,治其事故。贾公彦 [义疏 :此一“经” ,据上下文皆据诸侯国 ;此文虽单言“国”亦据诸侯而言。]
贾疏是说 :“小行人职”一“经” ,根据上下文 ,皆是以诸侯国为据而言 ;这段文字中虽单说一个“国”字 ,也是指诸侯国 ,“令”的对象是诸侯。这样看来 ,贾疏所用“上下文”一词 , 已经具有语境的的含义。 上下文
语意分析(semantic analysis)技术系指将一长串的文字或内容,从其中分析出该个段落的摘要以及大意,甚至更进一步,将整篇文章的文意整理出来。此项技术可以应用在解读影片、音讯等档案,使得搜索引擎能够搜寻到文字以外的物件,方便使用者省去大量时间观看影片、聆听音讯,同时也可以帮助使用者提前了解影片与音讯的内容。
语意分析技术在早期基于奇异值分解(Singular Value Decompositiob, SVD)、非负矩阵拆解法(Non-negative matrix factorization,NMF)等方式,近年来则有用各种型态的类神经网络(Neural Network, NN)来完成语意分析的目的。
奇异值分解
在线性代数的领域里,奇异值分解(SVD)将一个大的矩阵拆解成三个小的矩阵。
正常的情况下,将奇异值分解(Singular Value Decompositiob, SVD)套用在一个m×n复数矩阵'M,可以矩阵M表示为M=UΣV,其中U是m×m复数幺正矩阵(unitary matrix),而Σ则是一个m×n的对角矩阵(diagonal matrix),而在对角线上的所有直接为非负的值,V(共轭转置矩阵(conjugate transpose matrix)V,倘若所有元素皆为实数,则可视为V的转置矩阵')则是一个n×n复数幺正矩阵。在对角矩阵中,Σi,iofΣ便是所谓的M的奇异值(singular value)。而U的m栏则被称做是M的左奇异向量(left-singular vectors),V的n栏则被称做是M的右奇异向量(right-singular vectors)。