来源:国家数据局
近日,联著实业入选“中国人工智能产业发展联盟(以下简称‘AIIA’)数据标注分委会”首批成员单位,将与其他成员单位协同,推动我国数据标注产业技术水平、行业能力和国际竞争力的提升,助力我国人工智能创新发展。
数据标注贯穿于算法训练、模型评估、迭代优化以及场景应用等多个环节,为人工智能技术的落地生根提供了坚实基础。1月,国家发展改革委、国家数据局等四部门联合发布《关于促进数据标注产业高质量发展的实施意见》,对数据标注产业高质量发展具有重要的意义。
为贯彻落实国家大数据战略,支撑数据标注产业发展战略规划和落地建设,推动数据标注高质量标准体系建设,搭建数据标注产业生态,作为现国内权威人工智能行业联盟组织,AIIA数据委员会正式成立“数据标注分委会”(以下简称“分委会”),并面向全国征集分委会成员单位。目前,分委会已吸纳177家成员单位,涵盖地方政府、央国企、事业单位、企业以及高校和科研机构。
分委会的成立将搭建起数据标注领域产学研用协同发展的平台,汇聚各类经营主体,促进技术交流与创新,围绕关键核心技术开展协同攻关;共同开展标准研制,从源头上把控数据质量,提升标注效率,保障产业可持续发展。
科技创新型企业是推动数据标注产业高质量发展的重要力量,联著实业一直专注于文本智能技术的持续创新,以让机器语言和人类语言相互理解交流为核心价值,助力我国强人工智能技术实现新的跨越。
去年,由联著实业全资子公司——文灵科技(北京)有限公司和新华通讯社通信技术局联合牵头起草的国家标准《中文新闻语义结构化标注》(以下简称“《标准》”)通过立项,即将进入专家审核阶段。
《标准》规定了中文新闻写作常用表达方式所包含语义的术语和标注方法,包括新闻稿件标注说明、标注预处理、语义模板标注、新闻事件语义元标注、新闻事件关键词标注,以此形成语义标识体系,为实现计算机自动识别新闻语义、生成知识库或神经网络训练集提供标准化的操作方法,减少人工标注的复杂性和不确定性,有助于提高数据标注的自动化程度。而语义标识体系不仅可以应用于新闻行业,其通用性与延展性具备解锁多元领域的应用潜力,为各类模型训练提供高质量中文语料库,从而提升我国大模型理解中文、传递中华文化价值的能力。
作为数据标注领域的重要国家标准,《中文新闻语义结构化标注》的制定和实施将为我国数据标注产业的发展提供技术支撑和规范引领,以新一代高水平数据标注提升高质量中文数据供给质量、充分释放数据要素价值,同时为全国范围内标准体系完善和推广提供宝贵经验。
作为首批成员,联著实业将秉持创新精神,同时深度参与行业标准制定,与众多伙伴携手,推动数据标注产业高质量发展。在人工智能蓬勃发展的浪潮中,助力行业迈向新高度。