2025年5月29日,全國數標委在京組織召開中央企業高質量數據集建設和標準化研討會。全國數標委秘書處、中國電子技術標準化研究院副院長范科峰出席會議,國家數據局數字科技和基礎設施建設司派員參會。
會上,全國數標委秘書處介紹了高質量數據集標準體系、重點標準研制及驗證情況,中國石油天然氣集團有限公司、中國石油化工集團有限公司、中國交通建設集團有限公司圍繞高質量數據集建設及重點標準驗證分享了工作經驗,與會專家圍繞高質量數據集下一步標準化工作研提了意見建議。
會議指出,人工智能技術快速發展,高質量數據集作為訓練人工智能模型的基礎,已成為人工智能賦能千行百業的核心要素。針對當前高質量數據集建設中存在的規范缺失、質量參差、效率不高等問題,全國數標委加快研制高質量數據集技術文件及系列標準,明確高質量數據集的建設路徑、格式規范、分類要求、質量評測體系等,推動人工智能模型從能用向好用轉變,有力推進各行業領域數智化轉型。下一步,全國數標委將重點開展以下工作:一是加快重點標準研制,聚焦產業共性需求,推進高質量數據集建設指南、格式要求、分類指南、質量評測規范、數據標注、數據合成要求等重點領域標準制定。二是深化標準驗證試點,以中央企業為重點開展先行先試,完善標準內容并打造示范案例,加速更多行業推廣應用。三是做好標準試點平臺工具,提高標準的實用性和可操作性,提高標準驗證試點效率,有序推進高質量數據集建設。四是加強國際標準協同,參與并積極承擔ISO/IEC JTC1/SC42 WG2國際標準工作,推動高質量數據集國家標準與國際接軌。
本次會議由全國數標委秘書處組織召開,吸引來自中央企業、國有企業、民營企業、科研機構、高等院校等數據領域專家代表近400人參會。
