+ 我要发布
我发布的 我的标签 发现
公开标签 #语料库
BCC语料库:http://bcc.blcu.edu.cn/ BNC——英国国家语料库(British National Corpus):http://www.natcorp.ox.ac.uk/ BOE——柯林斯英语语料库(the Bank of English):http://www.collinslanguage.com/wordbanks/ 联合国文件数据库(提供80万份六种语言平行文档)http://documents.un.org/simple.asp ANC——美国国家语料库(America
1 汉语中介语语料库 汉语中介语语料库(http://qqk.blcu.edu.cn/#/login)由北京语言大学( 原北京语言学院)于1992年开始建设。该语料库立足于汉语教学已收录1635位外国学生共5774篇成篇成段的汉语作文或练习材料,总字数约353万,其中1731 篇约104万字的语料经过断句、分词和词性标注等加工处理。目前该全球汉语中介语料库仍处于努力建设过程中,北京语言大学仍然努力于建设全球汉语中介语语料库,其规模预计达5000万字,包括笔语语料、口语语料和多模态子库。笔语语料规模预计达
1 北京大学计算语言研究所双语平行语料库 该语料库为大型汉英、汉日双语语料库,包含汉英句子级对齐语料20万句对、汉日句子级对齐语料2万句对、汉英词汇级对齐语料1万对,旨在为机器翻译等应用系统的研发提供基础资源和标准的评测语料 。 1 北京外国语大学双语平行语料库 由王克非负责构建的汉英和汉日两个平行语料库目前仍在建设中。该语料库包括2000万字的日汉对译文本语料库和3000万字词的通用型汉英平行语料库两个部分。目前2000万字的日汉对译文本语料库的平行对应语料分为文学与非文学、汉译日和日译汉存放,做到段
1 中国科学院汉英平行语料库 中国科学院汉英平行语料库是在对中英文篇章对齐的双语文本进行段落对齐、句子对齐加工后建立的一个句子级对齐的双语语言信息和知识库,该语料库借助互联网等其他媒体搜集中英文篇章级对齐的双语文本,面向多领域多体裁,采用基于双语辞典的句子对齐方法进行了文本对齐,并对双语文本句子对齐结果实现自动评价。 2 南京大学双语词典研究中心英汉双语平行语料库(NJU_BDRCBC) 该语料库的总体规模共约200万对英汉平行句对,英语和汉语词例数高达2亿词次,其素材一方面来源于南京大学双语词典中心拥
1 国家语委现代汉语通用平衡语料库 该语料库是由国家语言文字工作委员会主持,面向语言文字信息处理、语言文字规范和标准的制定、语言文字的学术研究、语文教育以及语言文字的社会应用,总体规模达1 亿字,语料时间跨度为1919-2002年,收录了人文与社会科学、自然科学及综合三个大类约40个小类的语料(http://www.cncorpus.org)。其中标注语料库为国家语委现代汉语通用平衡语料库全库的子集,该子集是按照预先设计的选材原则进行平衡抽样,对语料进行分词和词类标注,并经过三次人工校对,最后得到约50
平时和英语口语写作打交道,常会遇到这种情况:想知道某个搭配地不地道、某个说法怎么讲,而词典上查不到。因为,一则词典毕竟收词有限,二则,多数词典全文索引不大便利。 这时就得求救于索引范围更大的在线语料库了。这类服务网上有不少,这几年用下来,有两个我最觉得最顺手:Ludwig,Linggle。 Ludwig 全名 Ludwig.guru ,我认为它最大的优点,是语料来源全部精选过,靠谱,不用我再去筛选例句是哪里来的。而且查询结果列表,每个例句旁边就是来源,想细读一番上下文,顺手就能点开。 另一点不错的,是
1