搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
出版时间 :
组织机构名称多维度研究
0.00     定价 ¥ 88.00
浙江图书馆
  • ISBN:
    9787568073103
  • 作      者:
    陈慧
  • 出 版 社 :
    华中科技大学出版社
  • 出版日期:
    2021-07-01
收藏
畅销推荐
编辑推荐
1、以真实的媒体海量数据为数据基础;2、专门针对组织机构名称这一特殊名称进行研究;3、结合了语言学、社会语言学、计算语言学、语料库语言学的理论与方法的跨学科研究。4、*以媒体海量数据为基础的组织机构名研究专著,提出的相关概念、规则、方法对于自然语言处理、语言本体研究有一定的理论价值和应用价值,可以用于国家政府部门的组织机构命名、管理、规范化工作。
展开
作者简介
陈慧,北京外国语大学中文学院副教授,汉语国际教育专业硕士研究生导师。华中科技大学汉语言文学学士,武汉大学社会语言学硕士,北京语言大学自然语言处理博士。在计算语言学、对外汉语教学、计算机应用、教育学、教育技术学等领域公开发表中英文论文近五十篇。多篇论文被SCI/EI/ISTP/CSSCI收录。为《国家语言生活状况绿皮书》(2005、2009、2013年)作者之一。参与并结项国家社科项目“语言接触对聋人手语发展演变的影响研究”、国家自科项目“中文文本自动分类关键技术研究”、国家语委重大项目“国家语言资源监测”。独立承担并结项国家语委重大项目子项目“基于语料库的组织机构名研究”、汉办多语种基地项目“汉语课堂教学实例库建设”及五项北外中文学院院级项目。当前独立承担并在研校级项目为“汉语中介语语料库技术及教学应用”。
展开
内容介绍
本书基于大规模动态流通语料库,抽取395万条左右的海量中文组织机构名称数据及其相关信息。以大数据为基础,从分词标注技术、语言资源开发与应用、语言规范化、语言本体等多个角度,针对组织机构名称这一特殊词语类别进行深入研究,从中心词角度提出中文组织名称形式化分类体系,提出中文组织名称“领域表征值”概念,并应用这一概念研究文本分类和通用词语,提出组织机构名称的两种结构模式、四类结构成分及其形式、性质、规则条件,以及组织机构名缩略的九个规则。确定了中文组织名称的三类上下文搭配形式、组织机构名称的分布特征,及中文组织机构名称识别方案。本书的主要内容包括组织机构名称识别、组织机构名称的界定与资源建设、组织机构名称规则、组织机构名称动态监测、组织机构名称的规范化等。
展开
精彩书摘
名词根据其外延大小,可分为专有名词和普通名词。专有名词(Proper Noun)是一类专用、特有的名词,外延小,所指明确,包括人名、地名、民族名等。
组织机构名称(Organization Name)属于专有名词中特殊的一类,它是组织、机构的专有名称。组织是按照一定的宗旨和系统建立起来的集体;机构是机关、团体等工作单位及其内部组织[中国社会科学院语言研究所词典编辑室,2016]。一般我们对组织和机构不加区分,笼统地合称之为组织机构(Organization),有时也称为机构、机构团体,泛指机关、团体或其他企事业单位,包括学校、公司、医院、研究所和政府机关等[刘开瑛,2000]。
组织机构主要分为四类: 民间组织团体,如协会、公会、商会、老乡会、同学会等;体育、演艺等专业团队,如心连心艺术团、东京奥运会中国体育代表团等;行政事业单位,行政单位指各级政府机关,事业单位主要是教育、科研、文化、卫生等政府单位;企业公司,该类包含了集团、公司、厂、酒店、银行等[雷静,2003]。
组织机构名称的结构成分中包含着普通词语、地名、人名、商标甚至标点符号,是专有名词中长短*为参差(二字至二三十字均有分布)、结构*为复杂(叠床架屋式的结构)、形式*为多变(一个全称往往有各种缩略形式)的一类。
根据《中国语言生活状况报告》绿皮书2005年第一次发布到*近2020年的发布数据,在我国平面媒体、有声媒体、网络媒体用词用语中,组织机构名称在词种(type)数量中的比例稳定在35%以上[ 每个词无论出现多少次,在词种上都计数为1。]。在年度独用词语中的比例稳定在40%-43%。
组织机构名称研究具有多学科的价值。本书基于大规模真实语料数据,从汉语本体、语料库语言学、语言资源建设、语言生态观测、语言治理、语言信息处理等维度对组织机构名称进行专门研究。
荀子在《正名篇》中论述名称与实物的关系时指出“名无固宜,约之以命,约定俗成谓之宜,异于约则谓之不宜;名无固实,约之以命实,约定俗成谓之实名。”这里的“名”和“实”对应着西方现代语言学之父索绪尔(Ferdinand de Saussure)所讲的“能指”(signifier)和所指(signified)。索绪尔认为语言符号的能指与其所指的关系是任意的,即约定俗成的。
任何一种语言利用语音单位传递信息、表情达意时,都有一套系统的规则对语音单位进行组织、安排。也就是说语言的使用并非语言单位的随意堆砌。这种组织安排的规则即是语法。它包括句法和词法。受语法规则制约的语言单位或者说语义材料是词汇。学界通常把全民常用的稳固的构词能力强的词汇作为基本词汇。方言词、行业词语、文言词、新词语、网络词语、外来词、字母词等属于一般词语。从词性角度看,词汇分为名词、动词、形容词、副词……等类型。
根据以上分类,组织机构名称属于一般词语,属于名词。但作为一般词语和名词的中的一大类,组织机构名称相关的汉语语言学本体研究,十分少见。组织机构名称一般来说语义透明度高,语法结构清晰,且语言使用状况并不复杂,而传统语言学本体研究领域关注的是语言的“问题”特别是“难题”。因此组织机构名称并不具备传统语言学本体研究的价值。从词汇角度来说,从事语言本体研究的学者对于专有名词乃至对组织机构名称的研究甚少。在仅有的组织机构名称本体研究中,研究方法上,主要是学者自省式搜索语例,静态的分类描写,其研究成果也甚少能为其他学科所用。
组织机构名称真的不存在“语言问题”吗?并不是。只是它们的语言问题常常和翻译、语言信息处理、社会语言学、信息管理相关。所以这些领域的学术研究者和实际工作者才关注组织机构名称的语言问题。例如,翻译界要保证不同语言所书写的组织机构名称完全一致、语用对等。语言信息处理界为解决语言文字的识别问题,需要对组织机构名称进行内部结构和字词分析。信息管理界和社会管理领域为减轻组织机构信息复杂、灵活、不标准、不准确带来的管理问题,有一些数据处理和命名使用的规定。然而,语言学本体研究本身并不能很好地支撑这些领域的应用研究。
本书基于395万多条组织机构名称的识别结果,通过厘清结果中合法的组织机构名称和不合法的组织机构名称这个思路,抽丝剥茧式地分析这一类词语的搭配、结构规则、组成成分的字符属性、成分的词性、各种成分和词语使用条件、缩略规律等。
本书在词语研究的视角、方法和工具上或能给予其他研究者一些启发。首先有高达395万多条大规模数据的支撑,能得到极其丰富的组织机构名称样本。其次,这些样本均来自真实的语言生活,因此我们是深入国家语言生活,考察的是实际使用中的组织机构名称的生态,而非孤立的、静态的、形式无变化的组织机构名称。这好比多媒体中的大规模视频素材和的图片素材,能捕捉到的信息不可同日而语。
展开
目录
1多维度看组织机构名称(1)
1.1组织机构名称与汉语本体研究(1)
1.2组织机构名称与语料库语言学(3)
1.3组织机构名称与语言资源建设(5)
1.4组织机构名称与语言生态观测(8)
1.5组织机构名称与语言治理(13)
本章小结(15)
2组织机构名称的识别(16)
2.1组织机构名称在自然语言处理中的特殊性(16)
2.2组织机构名称识别的现状(17)
2.3组织机构名称识别的传统技术(19)
2.4组织机构名称识别技术的*新发展(25)
2.5组织机构名称识别的困境(27)
2.6组织机构名称数据研究工作的价值(31)
本章小结(33)
3组织机构名称的界定与资源建设(34)
3.1组织机构名称的社会学界定(34)
3.2组织机构名称的工程定义(35)
3.3组织机构名称、非组织机构名称的区分(38)
3.4组织机构名称的资源库建设现状(40)
3.5组织机构名称的资源库建设的总体构想(41)
3.6组织机构名称研究数据库规模与结构(48)
3.7组织机构名称辅助校对系统(55)
本章小结(59)
4组织机构名称的分布特征(60)
4.1高频词中的组织机构名称(60)
4.2组织机构名称的领域分布(64)
4.3组织机构名称的历时分布(72)
4.4组织机构名称的媒体分布(75)
4.5组织机构名称的字长分布(77)
本章小结(81)
5组织机构名称的结构规则(82)
5.1组织机构名称结构规则研究的背景(82)
5.2组织机构全称的结构模式(84)
5.3组织机构名称的结构成分(90)
本章小结(98)
6组织机构名称的缩略规则(99)
6.1组织机构名称缩略的理论原则(99)
6.2组织机构名称简称的三种结构及其应用(104)
6.3分词系统中的组织机构名称简称标注问题(105)
本章小结(107)
7组织机构名称的用字用词(108)
7.1组织机构名称的用字研究(109)
7.2组织机构名称识别结果用词概貌(114)
7.3组织机构名称识别结果中的词性(116)
7.4组织机构名称识别结果中的字符串(121)
7.5组织机构名称的禁用词(124)
本章小结(127)
8组织机构名称的中心词(129)
8.1组织机构名称中心词的获取(129)
8.2组织机构名称中的伪中心词(132)
8.3组织机构名称中的小概率中心词(134)
8.4组织机构名称中的单义中心词(136)
8.5组织机构名称中的兼类中心词(139)
8.6组织机构名称简称的中心词(144)
8.7基于中心词的组织机构名称形式化分类(147)
本章小结(159)
9基于大规模文本的组织机构跟踪实验(161)
9.1国家语言资源生态研究的意义(161)
9.2国家语言生态观测工作综述(161)
9.3组织机构名称动态观测的意义(163)
9.4组织机构名称动态观测的方法探索(164)
9.5一个实验(167)
本章小结(171)
10组织机构名称的规范化(172)
10.1组织机构名称规范化研究的内容(172)
10.2组织机构名称规范化研究的原则(172)
10.3组织机构名称规范化研究的意义(174)
10.4组织机构名称命名的规范化(176)
10.5组织机构名称使用的规范化研究(182)
本章小结(185)
参考文献(186)
附录A图表索引(194)
附录B相关数据样例(197)
后记(215)
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

温馨提示:请使用浙江图书馆的读者帐号和密码进行登录

点击获取验证码
登录