关于组织开展2025年度重点行业语料库揭榜挂帅项目申报工作的通知
各市工业和信息化局、财政局:
为贯彻落实《山东省人民政府办公厅印发〈关于支持人工智能全产业链创新发展的若干政策措施〉的通知》《关于促进经济稳健向好、进中提质第三批政策清单》,加速重点行业语料资源汇聚整合,助力人工智能产业高质量发展,根据《山东省省级“语料券”奖补资金管理办法及实施细则》,现组织开展2025年度重点行业语料库揭榜挂帅项目申报工作。有关事项通知如下:
一、任务内容
聚焦工业制造重点行业的基础理论研究、产品研发设计、生产管理运行、过程质量检测等关键环节和特定场景的知识语料汇聚,基于结构化数据(如数据库中的表格数据)、非结构化数据(如文本、图像、语音等)和半结构化数据(如日志文件、XML文件等),通过清洗、去噪和统一格式,用于支持自然语言处理、计算机视觉、机器学习、深度学习等任务,满足行业大模型或场景大模型开发、训练和微调需求的高质量语料库。
二、推荐条件
(一)申报单位条件
1.具有独立承担民事责任能力的企业,经营状态正常、近三年内无严重失信记录,符合财政涉企资金“绿色门槛”制度要求;
2.拥有与行业语料库建设相关的核心数据、关键技术、自主知识产权等基础能力;
3.具备语料收集、整理、标注所需的软硬件设施和专业团队。鼓励项目承担主体联合具有优势学科的高校或科研机构编制建设方案;
4.进行数据语料采购或治理时,不能违反国家安全、商业秘密、个人隐私、科技伦理等相关政策法规要求,完成必要的安全合规处理。
(二)申报项目条件
1.项目为正在实施或计划实施的项目,具有加快实施的必要性、重要性、紧迫性,语料库产品通过持续优化与高质量扩充,能够显著提升大模型训练的效率精度与安全可靠水平,建设周期一般不超过一年;
2.在技术或产品性能上有较大创新,在特定领域或行业内具有高度的专业化和适用性,有明确的市场需求和较强的市场竞争力;
3.项目应有明确的应用推广方案及生态建设预期,预期目标包括不限于新增销售收入、服务大模型企业领域及数量,以及组织供需对接、交流推广等活动情况;
4.项目要有明确的实施计划和资金保障,确保能够按计划完成建设;
5.项目验收时行业相关语料库数据量不低于10万条,具有较高的数据质量、领域覆盖程度、潜在价值和应用成效,项目验收时应通过第三方测评;
6.鼓励各行业语料库项目加快语料资源优化整合,积极开放公共语料。
三、申报程序
(一)企业申报。各市工业和信息化局会同市财政局按照企业自愿原则组织申报,省属及中央驻鲁单位按属地申报。申报企业按要求编制《山东省重点行业语料库揭榜挂帅项目申报书》(见附件2),申报材料须符合国家保密相关规定。
(二)初审推荐。各市工业和信息化局牵头对申报项目进行评审论证,于9月26日前将推荐文件、汇总表、申报材料纸质版(一式两份),以两部门名义正式行文报至省工业和信息化厅、省财政厅,电子版申报材料(盖章PDF版及Word版)同步发至指定邮箱。
(三)评审公布。省工业和信息化厅组织专家或第三方专业机构对申报项目进行评审,综合采取材料评审、现场答辩等多种方式,确定符合条件的揭榜项目名单,将评审结果商省财政厅同意后予以公示。
(四)验收评估。省工业和信息化厅将进行动态监督,根据项目实施实际情况,于2026年进行集中验收评估,并对项目实施期内的实际投入资金、建设应用成效等进行核查,公布验收评估结果。
四、有关要求
(一)项目申报单位须对申报材料中涉及的指标、数据和相关证明、附件材料的真实性负责,承担因提供虚假材料造成的后果。
(二)省工业和信息化厅不委托任何单位或个人从事项目申报代理服务工作,申报单位申报书和数据等信息资料仅用于项目评审和过程管理使用。
五、联系方式
省工业和信息化厅:杨洪于 0531-51782640
省财政厅:胡增基 0531-51769745
邮 箱:cytjc@shandong.cn
地 址:济南历下区省府前街1号省工信厅数据产业推进处(邮编250011)
附件:1.山东省2025年度重点行业语料库揭榜挂帅项目申报书.docx
山东省工业和信息化厅 山东省财政厅
2025年9月5日
商务喇叭版权声明:以上内容均转发自互联网,信息形式为公开信息、不含涉密信息、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!