CCL 2018同时接受中文和英文投稿。录用的中文稿件将被推荐至《中文信息学报》、《清华大学学报》(自然科学版)、《中国科学》及其他计算机类中国科技核心期刊(中国科学技术信息研究所制订)。作者必须根据会议和期刊的审稿意见进行相应修改,《中文信息学报》对未完成修改的稿件保留不予发表的权利。《清华大学学报》(自然科学版)、《中国科学》和其他计算机类中国科技核心期刊可能会要求对推荐论文进行再审,通过后方能发表。被录用的英文稿件将由Springer Lecture Notes in Artificial Intelligence (LNAI)出版。
“第六届基于自然标注大数据的自然语言处理国际学术研讨会”(The Sixth International Symposium on Natural LanguageProcessing based on Naturally Annotated Big Data, NLP-NABD 2018)将与CCL 2018同时召开。
NLP-NABD涵盖了前面列举的所有自然语言处理的研究内容,尤其关注在大数据时代自然语言处理的前沿方法和技术。这里所谓的“自然标注”是指由互联网用户根据其自身目的(而不是出于自然语言处理研究的目的)对各种互联网资源进行的“不自觉”的手工标注,计算语言学家们可以将这些标注自觉地和系统性地应用在自然语言处理的各种研究中。例如,标点符号有助于词边界的识别,社交媒体中的社会标签也有助于关键词抽取,而维基百科中的条目类别信息则可以为文本分类提供帮助。在这些例子中,“自然标注”都是以显式的形式出现的,但在很多情况下,也可以以隐式的形式出现,如短语“Beijing and other cities”“cities such as Beijing”中所蕴含的两个模式“cities such as NOUN”“NOUN and other cities” 就是一种隐式的“自然标注”,可用于抽取常识知识ISA(NOUN, city)。NLP-NABD 2018聚焦国内外在此方向上的各种前沿研究进展,如:如何在自然标注大数据上有效进行大规模无监督/半监督机器学习(如深度学习),如何将学习到的资源、模型和已有的手工标注的核心资源和核心语言计算模型结合起来,等等。NLP-NABD 2018受到国家973计划项目“面向三元空间的互联网中文信息处理理论与方法”(编号:2014CB340500)资助支持。