蜜桃君

天涯大盗

羽桐老师,

数月前我做了一个中英文的认知属性知识库,通过跨语言的词汇比喻属性比较,来体现不同语言使用者对词汇隐喻的认知程度。我选用明喻格式(as Adjective as Noun 如 "as dumb as pig" 像猪一样笨),通过搜索引擎挖掘,自动生成50万个明喻句子,然后进一步标注、分析。仍用猪的例子,普通的词典对猪的解释只是外形、属性和用途,但对猪的认知含义如“笨、懒、丑“不会说明,因为这是基于人的认知判断。所以传统的词汇语义学一般将其作为附加在概念上的附加义,并没有特别重视。而认知语言学不区分概念义和附加义,在隐喻研究的框架下,将这些认知的附加义都作为猪的”显著特征“,用作隐喻的喻底,比如”他是头猪“。为了突出人的认知体验属性,我把”显著特征“一般化为“认知属性“,也便于进一步从认知语言学的角度进行分析。近年来,名词的显著特征不仅成为国内外隐喻分析、自动理解和生成的重要依据,还应用于反讽等修辞手法的识别理解。

我面对的主要难题就是认知属性的自动提取非常困难,所以采用明喻格式利用WordNet, HowNet(如提取德语时则需要GermaNet,但由于没有获得它的使用权限,我决定选用谷歌刚开放的Google Books n-gram的5000万册电子图书作为海量的数据库来检索明喻格式。为了匹配,我同样利用Google Books n-gram重新做了英文的数据库,目前已经完成。英文的格式就是as Adjective as Noun. 这样的明喻格式。而德文的格式我想是Adjective wie Noun. 但是搜索结果里面有大量不正确的句子要手工确认,因为wie的意思太多了。为了更有效用,我尝试用 so Adjecktive wie Noun.这样的格式进行挖掘,但又担心这样会使得到的结果大大减少,量不够大,概率就会不准。

请问用什么样的搭配格式,会更容易保证形容词+名词的搜索结果质量?是不是在wie前面加上什么修饰词,这样结果会更好一点?比如我用so + 德语的形容词+ wie搜索,质量稍微好一些,但还是不尽如人意。希望得到你的指点。

不胜感激。祝安!

陈琛

Powered By mitaojun.com

版权所有,转载请注明来源及文章链接。苏ICP备2020049409号