项目与服务
政务AI全链路方案:垂直大模型开发应用、测评与标准规范
客户名称:
深圳市政务服务和数据管理局、深圳市人才工作局、深圳市民生诉求服务中心
客户行业:
政府机关、政务服务、社会治理、公共管理
案例标签:
数字政务、垂直大模型、测评体系、标准化建设
客户背景:
深圳政务与公共服务领域的核心单位,其中,深圳市政务服务和数据管理局作为统筹主体,构建全市政务AI技术底座;深圳市人才工作局以高水平人才高地建设为任务,依托智能模型强化人才服务与品牌传播;深圳市民生诉求服务中心负责全市一体化诉求平台,结合AI技术处理海量市民需求。
客户/行业问题:
1. 应用层面,通用模型与人才服务、民生诉求等垂直场景业务规则适配不足,跨部门数据壁垒导致训练语料质量不高,碎片化部署系统造成服务标准不一,这些潜在风险阻碍政务服务精准化、协同化目标实现。
2. 测评层面,理论研究的测评指标多聚焦实验室静态数据,缺乏贴合政务实战场景的量化标准,且不同厂商模型性能缺乏统一评估基准,影响选型决策与模型迭代优化的科学性。
3. 标准层面,算法接口、数据格式等基础规范不统一易抬高厂商技术接入适配成本,安全隐私防护等规范缺失存在合规风险,标准更新滞后于技术发展将制约政务AI规模化落地。
解决方案:
1. 研发政务垂直大语言模型技术:以通用大语言模型为底座,深度融入政府职能部门政策公告、便民服务指南等多源政务文本数据;联合开发“阿深”人才资讯大语言模型原型,具备语义理解、智能推理及跨区政策整合能力,可实现政策速配、办事流程智能指引、多轮互动问答等功能,为政府用户与市民提供统一高效的政务信息获取渠道。
2. 构建政务大模型多维度测评体系:针对政务垂直领域大模型应用的新兴特性,设计目标层、准则层、指标层递阶层次分析评价模型;围绕政策理解准确率、内容安全性、交互友好度等核心维度,细化形成可量化的测评指标,并针对民生诉求分拨处理、智能打标、安全审核等典型场景,制定差异化测评方案;通过该体系可精准诊断大模型政务服务效果,科学评比不同模型的优劣差异,为政府部门选型决策、企业技术优化迭代提供指导。
3. 编制政务通用人工智能标准规范:支撑统一算法管理系统、公共算法库与模型库建设,创新构建接入、运行、管理全流程政务算法标准化体系;接入环节明确算法镜像接入、容器微服务运行的技术规范,统一接口参数、数据格式标准;运行环节整合安全隐私、服务质量与响应时效规范,形成监测、预警、处置闭环;管理环节融合算法效果评估、可解释性、决策公正性标准,确保算法决策透明公平。
落地成效:
1. 政务AI应用方面,人才资讯大模型“阿深”紧扣深圳双招双引部署,亮相招才引智活动、全球创新人才论坛等高规格场景,获深圳晚报、网易、腾讯等多家媒体报道,放大深圳引才品牌影响力;
2. 政务AI测评方面,针对民生诉求大模型构建全流程测评体系,助力首批7个成熟场景落地,经测评校准通过后,相关大模型成功面向实际业务开放调用,测评方案为模型筑牢性能与适配根基,获深圳市民生诉求服务中心的感谢信;
3. 政务AI标准规范方面,从接口、数据、安全等维度制定统一标准,涵盖视频分析、文字识别等百余类算法,支撑主流厂商AI算法上架管理,被深圳市政务通用人工智能算法管理系统采纳,推动政务AI规范化落地。