汉文互联网语料资源平台发布

汉文互联网语料资源平台发布

本文转自:网信中国微信公众号  1月9日,在中国网罗空间安全协会东谈主工智能安全处分专委会责任年会上,汉文互联网语料资源平台细致面向社会发布。  在中央网信办指引下,中国网罗空间安全协会会同国度互联网救急中心,协同东谈主工智能产、学、研、用单元,共同设立汉文互联网语料资源平台,面向社会提供汉文互联网基础语料展示下载工作。平台支抓行业领域、执行模态、体量范围等多种标签分类,便于用户下载与使用。  现在平台共入驻27个语料数据集,数据总量约2.7T,主要分三类:一是中国网罗空间安全协会会同国度互联网救急中心等设立的汉文互联网基础语料;二是东谈主民网、北京智源商讨院、上海东谈主工智能实验室等单元分享的互联网语料;三是中国网罗空间商讨院、中国国度版块馆、中国大百科全书出书社、中国社会科学院藏书楼等单元孝顺的优质汉文基础语料样本。登录中国网罗空间安全协会官网,即可在首页注册使用平台。  下一步,平台将依托中国网罗空间安全协会东谈主工智能安全处分专委会建立的语料共建分享机制,抓续吸纳优质汉文互联网语料进驻,探索开展数据起原合规评估、质料评价、安全检测等工作,构建健康可抓续的汉文互联网语料征战期骗生态,促进和救济大模子产业发展。






Powered by 数字视野网 @2013-2022 RSS地图 HTML地图