今年疫情的突然暴发,将此前广泛应用到商业场景的通用新一代信息技术,快速深入到社会治理的方方面面。在国内战“疫”中,盘活数据之后的数字政府应用让人们耳目一新,然而疫情期间也暴露了数字治理方面的一些短板,比如政府各业务部门数据融通不足、技术赋能不够、场景融合不强等。
究其原因,核心是传统技术企业在结合数字政府业务中知识积累不足,缺乏行业化落地能力。可以预见,通用的技术会越来越难以解决具体问题,由此会逐渐具备行业属性,数据智能技术行业化是解决这些“疑难杂症”的必然路径。
首先,数据处理技术与行业相结合。要想掌握行业核心数据知识,就要解决多源异构的跨领域数据治理问题,将公安、民政、教育、住建等不同来源的数据汇聚拉通,形成统一的指标体系、统一标签体系、统一ID,并引入行业专家,将其几十年的业务经验沉淀为显性化的算法和模型,在不同应用场景出现时,就可以形成不同的概念模型框架对外提供服务。
同时,还要构建政务行业关键的数据库,对不同行业、不同部门、不同领域的政务数据进行治理,转换成标准数据后构成基础库、主题库、专题库、知识库及案例库。未来所有的这些数据库都将遵循政务相关的国标、省标或者行业标准,最后通过政务数据资产管理系统、标签管理系统及共享服务系统,进行各种各样的管理及应用。
其次,人工智能技术与行业相结合。数字政府领域存在大量图片、音频等非结构化的数据,数据融合涉及多种技术进行处理,而传统数据库和大数据技术天然地用来处理结构化数据,涉及文本、图片、音频、视频等,就需要运用语音识别、机器视觉、自然语言处理等技术,从这些多模态的数据里抽出语义标签,再通过知识图谱技术将这些语义信息融合构建在一起,并转化为知识,进行知识分析、知识问答与知识挖掘,最终支持决策。
目前,人脸识别、语音识别等人工智能技术日渐成熟,但仍停留在感知层面,如果没有业务知识背景,很难实现智能化。就如已经逐步行业化落地的知识图谱技术,其天然的优势是显示直观,可以梳理数据脉络,看到数据之间的关系,但不同行业数据模式不同,业务需求也具有差异化,只有结合行业知识与规则的应急行业知识图谱、环保行业知识图谱、法律行业知识图谱等,才可以保证知识库的质量与规模、可扩张性和推理能力,从而更好地进行知识服务。
可以看出,脱离了政务业务的系统,只能是一个技术平台。如果不能理解政府的业务和与业务有关的各种数据的含义,就难以高效地发挥数据价值。只有结合政务场景,构建结合业务的数据模型,系统才能更好地支持应用。
笔者认为,在技术与业务碰撞中,将会诞生出越来越多的新业态、新应用和新模式。尤其是在这次疫情之后,将会看到数据智能在整个的社会治理、政府决策中发挥越来越多、越来越大的作用。除了技术层面,数据智能的行业化落地,需要在以下三方面进行突破:
一是需求驱动。技术行业化渗透过程中,必须走得足够深,根据具体业务场景需求,探索数据智能技术在行业中能做什么,基于不同领域的组合、内外部业务环节的分化、融合,最终形成新的技术服务模式,特别是在这个过程中,也会完成技术自身的变革和演进。对比来说,此前拿着通用技术找场景的模式已经不适用。
二是可感知的应用。当数据智能技术逐渐运用到各领域之中,非专业人士也需要能够应用数据智能辅助决策,通过语音交互而不是写代码的方式,未来人机交互会变得更加自然。比如疫情期间,每个城市的应急中心都设有一个指挥中心,政府决策者可以基于可视化大屏实时了解防疫物资、救护车位置等情况,通过智能交互方式进行点线面布阵。
三是联合创新。在实践中,有必要打通上下游合作可能性,基于国家、各省和行业规范制定一系列的数据标准,再基于这之上构建数据模型,形成面向各个行业的“大脑”,继而帮助政府更加科学地制定相关的政策,逐步实现智慧交通、智慧医疗、智慧教育等,打造更完善的智慧城市。
因此,数据智能需要行业厚度,甚至重塑数据价值链。数据技术服务不仅需要结合特定行业的知识和标准,还要让人们能更好地看到数据、跟数据对话、跟数据进行交互。把业务、数据、模型、交互及技术融合在一起,才能发现规律、发现问题,真的创造价值。