获奖名称: | 智能化中文信息处理及其应用技术研究 |
获奖时间: | 2003年 |
获奖类别、等级: | 山西省科技进步一等奖 |
主要完成人: | 刘开瑛 郑家恒 杨尔弘 周晓强 李国臣 王素格 张永奎 张仰森 曲开社 谭红叶 |
成果简介: | |
中文信息处理技术是我国软件产业发展的重点。本项目围绕中文信息处理的资源建设、计算模型、实用软件开发等几方面开展了卓有成效的研究工作,取得了一系列成果。 1 、资源建设:按照 国家标准,建成了大规模真实语料库、地名用字库、 交集型歧义字段库 等基础资源; 首次将评测与语料加工技术融为一体,建成了 基础 知识资源库 ; 采用“字义基元化、词义组合化”观点,建成了“语义关联网络”。 2 、计算模型:提出了 统计、规则、自学习并举的一系列计算模型,进行 语言知识的自动获取、组织、更新和应用。 3 、计算语言学理论:提出了以经验主义为主导、基于语料库的中文信息处理应用理论模型,在国家主办的“中文信息发展战略规划”第 43 次香山会议上做了重点介绍。 4 、实用软件研发: 成功研发了 自动分词、词性标注、短语标注、词义排歧等语料库深加工实用软件,集成为语料库深加工软件开发平台;开发了信息检索、过滤、文本分类、文本校对和全文检索等一系列智能软件。 5 、应用及反响:推出的“基于语料库的词典编撰软件”开创了辞书编撰一代新风;面向全国和山西农业生产,建立的小麦词汇知识关联网络模型为北方小麦栽培管理信息化提供了技术支持; 开发的 《汉语自动分词与词性标注系统》、《全文智能检索软件》等软件并被美国 IBM 总部、德国人工智能研究所购买,同时被国家语委、清华大学等国内 30 余家研究单位采用; 连续 5 年承担并圆满完成了国家“ 863 ” 智能机接口的评测任务,对国内外分词和词性标注的研究起到了促进和导向作用 。 6 、论著及人才培养:出版专著两部(《自 然语言处理》、《中文文本自动分词和标注》),在国内一级刊物和国际会议发表论文近 60 余篇,其中 7 篇被 SCI 、 EI 收录。培养了近 50 名中 文信息处理专业的硕士和博士研究生。建成了一支团结协作、学术思想端正的科研队伍。 |