当前位置: 首页 > 范文大全 > 公文范文 >

基于计算语言学的维吾尔语句子分析

时间:2022-05-08 19:15:03  浏览次数:

【摘 要】维吾尔语句法分析是维吾尔文信息处理领域一个重要的基础性课题,同时也是一个公认的难题,在机器翻译,文本摘要,信息过滤,自动问答中都有广泛的应用,该论文通过研究国内外相关句法分析算法与理论,再结合维吾尔语自身的特点对计算语言学中的句子分析进行了讨论,由于维吾尔语作为一种自然语言,具有自然语言所共有的一些规则,发现国内外的经典句法分析方法同样适合于维吾尔语的句法分析.

【关键词】计算语言学;维吾尔语;句子

计算语言学的研究对象是自然语言。自然语言是人类区别于其它动物的重要标志之一。人借助于自然语言交流思想,达到互相了解,组成人类社会生活;人还借助于自然语言进行思维活动,认识事物的本质和规律,创造了人类的物质文明和精神文明。计算语言学的研究结果必须要通过计算机自然语言处理来检验,计算语言学的结论要做得通,更重视理论的实用性,要求研究者“躬行实践,身体力行”;而传统语言学家则要求讲道理,传统语言学的结论要说得通,更重视逻辑的完美性,要求研究者“自成一家,词严义密”,计算语言学研究语言时必须先分析后理解,在分析之初。

一、计算语言学概念

计算语言学又称为自然语言理解、自然语言处理和人类语言技术等,是以语言学为研究基础,内容涉及计算机科学、逻辑学和心理学等学科的一门典型的交叉学科。其主要研究内容是通过建立形式化的数学模型来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器来模拟人的部分乃至全部语言能力的目的。

计算机不可能懂得或理解所分析的语言片段的意思,理解是分析的结果;而传统语言学研究语言时,往往是先理解后分析,在分析之初,研究语言的人根据自己的语感和内省的经验,早已知道并且理解了所分析语言片段的意思,理解是分析的必要前提,计算语言学是边缘交叉学科,要求研究者具有语言学、数学和计算机科学的全面的知识,这就要不断地进行知识更新的再学习;而传统语言学一般不涉及数学和计算机科学,但需要具备语言学和人文科学的深厚功底,才能得心应手地进行研究,计算语言学是边缘交叉学科,要求研究者具有语言学、数学和计算机科学的全面的知识,这就要不断地进行知识更新的再学习;而传统语言学一般不涉及数学和计算机科学,但需要具备语言学和人文科学的深厚功底,才能得心应手地进行研究。

二、基于计算语言学的维吾尔语句子研究状况

维吾尔语属于阿勒泰语系突厥语范畴,属黏着性语言,其特点是:基本词素按词中形态连接而构词;词根固定不变;词根添加词尾构成新词;词尾可以按语言学规则有限变化从而改变词义,对句子和短语的结构进行分析,找出词、短语等的相互关系以及各自在句子中的作用等。在语言自动处理的研究中,句法分析的研究是最为集中的,这与乔姆斯基(Chomsky)的贡献是分不开的。主要方法有:短语结构语法、格语法、扩充转移网络、功能语法等。

新疆维哈柯文字具有编辑处理方向与汉英文相反,字符宽度不等及连笔复杂变形规则复杂,与汉英文兼容处理时光标控制复杂,断行续行匀齐复杂等特点,处理技术难度大。20多年来,新疆的科技人员经过艰辛的努力,克服了一系列困难,解决了维尔文信息处理的技术难题,开发了一系列维哈柯文信息处理系统软件及产品,为新疆地区信息化奠定了基础,对新疆地区经济发展、技术进步、社会进步及民族团结,有着非常重要的意义和作用。但新疆的维哈柯文信息处理技术还需要进一步发展,还有许多事情要作。随着西部大开发战略的进一步实施,在援疆计划的支持下,相信新疆的多文种信息处理事业会得到进一步的促进与加强,必定会带动新疆经济、技术与社会的发展与进步。

三、计算语言学以及它的必要性

计算语言学是我们要掌握的重要课程之一,计算语言学的研究也像其他学科一样,有科学研究与技术研究两个层次。科学研究的目的是发现语言的内在规律、探索语言理解和生成的计算方法、建設语言信息处理的基础资源;而技术研究则借助应。信息抽取是指从一段自然语言文本中抽取指定的事件、事实信息,并以结构化形式描述信息,供信息查询、文本深层挖掘、自动回答问题等应用,为人们提供有力的信息获取工具。信息抽取技术作为计算语言学学科的重要技术,在搜索引擎技术、自动文摘、文本分类等海量信息处理中发挥了重要作用。

计算语言学作为语言学、逻辑学和计算机科学交互作用的产物,作为语言学顺应信息时代发展的产物,体现了语言学、现代逻辑和信息科学融合的一个趋势。逻辑学与语言学和信息科学融合及其研究成果说明,这种融合是时代赋予计算机科学研究的历史重任,对语言学、逻辑学和计算机科学的发展将是极为有利的,同时也会大大推动语言学和信息科学的发展。

四、结语

随着国家西部大开发政策的实施和政府上网工程的启动。以及电子商务的发展,西部地区少数民族语言系你处理工作越来越显得迫切和重要。少数民族语言信息处理起步晚,进度慢,人力财力投入少,远远不能满足社会发展的需求,数字鸿沟不断加大,饮起了国家线管部门和领导层的高度重视。要缩短社会需求和研究进展的差距,就必须加大投入,指定和完善政策措施。据我们了解国家这方面的成册措施即将出台。在这种环境下召开一次全国性的,以民族语言信息处理为内容的专题会议,将对我国的名族语文信息处理工作起到很大的推动作用。我国从上世纪80年代开始进行民族语言文字信息处理工作,一直处于国际领先地位,但今年发达国家对小语种(及少数民族语言)语言信息里处理非常关注,并设立专门机构或加大投入,在有些方面已经走在我们的前面,在这种机遇与挑战并存的竞争环境中承办全国性的,少数民族语言信息处理专题会议,宣传我们的工作,进行交流,势在必行。

参考文献

[1] 翁富良,王野翊.计算语言学导论[M].中国社会科学出版社,1998,09.

[2] 范海虹,刘大勇.论计算语言学的学科交叉性[J].廊坊师范学院学报(自然科学版),2012(03).

[3] 缪成,袁保社.维哈柯汉英多语种处理平台的设计与实现[J].计算机工程,2004,10.

推荐访问: 维吾尔 语言学 语句 计算 分析