当前位置:

新闻动态

刘雅琴等 | 基于“一张表”平台推动面向高校教师的数据治理实践

“十二五”至“十三五”期间,我国高校基本迈入信息化时代,并随着各类信息系统的建设与使用,逐步实现了业务及数据的信息化管理[1]。由于各业务系统的建设初衷在于满足各业务部门的管理需要,同时各业务部门的业务方向又不尽相同,如管理需求不同、信息化建设水平不同等,导致其数据仍然存在存储分散、标准不一、结构异化、质量不高等问题,难以统一管理和有效应用,更无法发挥其价值。数据是教育治理现代化的基础,通过数据治理使数据标准可用、准确统一、共享互通,是数据服务于高校管理和发展的前提。有学者认为,数据治理对于提高教育质量、决策科学性、管理效率至关重要,数据治理的有效应用能使高校管理变得更加智慧和敏捷[2]。而教师作为高校教学、科研的主力军,是数据的主要产生者。作为数据的主体,教师不应缺位于数据治理。教师的参与及反馈,可有效推动数据治理进程、保证数据治理效果。近几年来,许多高校相继建成校级数据中心,在系统级数据共享方面积极实践,已形成数据共享交换技术基础。而在此基础上如何推动以高校教师为主体的数据治理实践,是目前亟待探索和解决的问题,也是本研究重点探讨的问题。

一 数据治理与高校数据治理对象

1 数据治理的定义

目前,针对“数据治理”这一概念,不同机构、不同学者提出了不同释义。例如,国际数据管理协会认为,数据治理是对数据资产行使管理与控制权,包括计划、监控、执行,在其数据管理体系中,无论是在业务层面还是技术层面,数据治理都属于核心功能[3];教育研究数据中心认为,数据治理是指围绕数据如何获取、使用、存储、分享、保护的决策组织过程[4]。另外,Weber等[5]认为,数据治理是为了鼓励恰当的数据使用行为而指定的决策权及责任框架;Malik[6]认为,数据治理是指为了完成业务目标,人们对数据的管理政策、规则、权限、结构、信息使用等进行处理的一系列行为集合;而张世明等[7]认为,数据治理是从使用零散数据变为使用统一主数据、从具有较少组织或没有组织与流程治理到组织范围内的综合数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程。综合上述概念及相关的实践经验,本研究认为数据治理是通过管理与技术手段,对高校数据进行一系列规范处理行为的集合,包括完善制度、建立体系、理清标准、肃清源头、同步共享、规范应用、保障安全,从而保证数据的准确性、一致性、全面性、安全性,使数据能发挥其应有的价值。

2 高校数据治理对象分析

面向高校教师的数据治理,治理对象主要为教师数据。高校职能一般包括人才培养、科学研究和社会服务等,教师作为高校的重要人力资源,是上述活动的主要履行者。教师在履行上述职能及常规工作过程中产出的相关数据,即为教师数据[8]——是高校数据治理的重要组成部分。教师数据既是高校重要的数据资产,也是高校发展状况的具体表征。通过调研分析学校管理部门及二级学院对教师数据的需求并对其进行归纳、整理,本研究将教师数据的具体内容细分为教学、科研、人事、公益四大类,每大类下细分出多个数据小类,数据小类下又包含多个数据项,而数据项为教师数据的最小集合单元,如表1所示。

表1  教师数据分类及其子项(部分)

二 教师数据治理思路

随着数字化时代的到来,数据的重要性日益凸显,数据治理成为实现数据价值及推动数字化发展不可避免的一环。国外机构和学者对数据治理的研究起步较早,提出了不少有借鉴价值的体系框架,如Khatri等[9]提出决策域模型、Seiner[10]提出五层框架模型、Thomas G[11]提出数据治理框架等,这些框架在理论层面对数据治理思想、体系等进行了研究总结,为后续对数据治理的进一步探索提供了有价值的参考。国内不少专家、学者也在已有研究成果的基础上,基于我国高校校情与数据现状,对高校数据治理从不同角度进行了深入分析:①在运行机制上,吴刚[12]提出高校数据治理是由运行制度、运行主体、运行程序共同组成的有机整体,应建立自上而下的执行机制、自下而上的采集机制、多元协同的互动运行机制;彭雪涛[13]分析了美国高校数据治理,提出我国高校应从顶层设计规划数据治理、由权责体系落实数据治理、用信息技术保障数据治理、以分析应用推进数据治理。②在治理框架上,董晓辉[14]基于权变理论,借鉴成熟框架,提出了以获取数据价值和管控数据风险为目标,以基础平台为技术支撑,以标准、组织结构和政策为制度保障的高校教育大数据治理框架。③在数据质量上,徐峰[15]提出了数据的深入应用、数据的共享应用、数据的跨域应用三种提高数据质量的实践路径。综合来看,在技术层面进行教师数据治理之前,需要根据实际情况来设计数据治理的运行机制。因此,针对高校教师数据治理,各高校需要根据本校的校情对其实践路径进行梳理与重构。

综合上述分析,本研究认为教师数据治理实践需要从数据、人、体系三个维度考虑,具体到每个维度包含若干关键要素,这些关键要素共同构成推动高校教师数据治理的实践路径(如图1所示),具体分析如下:

图1  推动高校教师数据治理实践路径

①人是治理者,回答“谁治理”的问题。在数据治理中,涉及的人包括数据产生者、数据采集者、数据管理者、数据使用者。落实到具体环境中,教师数据是教师在各项工作及活动中产生的数据,产生者即为教师本人;采集者是数据的保存方(如人事处等业务部门),故治理工具或治理平台可从采集者那里获取相关数据并加工处理,使其成为有效的教师数据;管理者对数据进行管理和维护,最后提供至使用者使用。

②数据是治理对象,回答“治理什么”的问题。从技术实践角度来看,需要研究并建立数据模型,梳理确定数据来源,实现数据共享,并以此为基础对数据处理、数据质量、数据应用进行研究与实践。

③体系是治理环境,回答“如何治理”的问题,包括组织结构、管理政策、标准规范及安全防护,是技术得以实现的体系支撑。教师数据治理实践需从人、数据、体系这三个维度出发,综合考虑其关键要素,并基于高校已有技术框架及其实际应用情况,建立一套适用于自身校情的、可运行的技术服务平台。

三 面向高校教师的数据治理平台:

“一张表”平台

随着信息技术的发展,师生对信息化的需求日益强烈,为了对学校管理及发展提供强有力的信息化支撑,《华中科技大学“十三五”信息化发展规划》提出了包括“办事一张表”在内的“十个一”工程建设内容。“一张表”工程是“办事一张表”的重要建设项目,包括数据共享与交换平台、“一张表”平台等内容,主要解决师生反映强烈的学校各类数据分散、不准确、不一致、师生反复填表等突出问题。

1 平台功能框架

“一张表”平台功能框架如图2所示。平台数据与功能面向四级用户:①教师。平台为教师提供个人数据仓库,教师仅需登录平台即可查询与本人有关的教学、科研等各类数据,并对数据进行核对、反馈与纠错。②团队。教师团队在平台上进行团队管理,跟踪团队研究成果,分析团队现状及发展趋势。③学院。学院在平台上对本院数据进行管理、维护,并对教师反馈与纠错数据进行审核;学院对本院数据具有管理与认定权,保证了数据的权威性与准确性;历年数据可查询、可追溯,减轻了学院管理负担。④学校。平台即时统计数据概况,为学校提供全校数据总览与数据分析,并辅助决策支持。除了提供一系列数据管理功能,“一张表”平台还为各类用户提供基于数据的计算及应用服务,包括教师年度核对、经费分配、业绩计算、数据报表、数据总览、统计分析等功能。

图2  “一张表”平台功能框架

2 平台功能特点

“一张表”平台具有的特点:①数据建设全面。平台贴合教师与学院需求,围绕教师日常工作与成果,结合业务部门及学院管理需要建设数据项。数据建设涵盖教学、科研、人事、公益四个方面,包括74项数据项、2000余字段信息(截至2021年5月),实现了教师基础数据的全覆盖。②数据自动汇集。平台从校级数据中心同步各类业务数据,并对各类业务数据进行集成与处理,将业务数据转化为可供教师使用的数据。在此基础上,平台提供数据查询与可视化展现等服务,教师仅需登录平台,即可查询个人教学、科研、论文等相关数据。③数据集中维护。教师与学院均能在平台进行一站式数据维护,平台提供单条录入、批量导入、填报审核等多种数据入库方式,同时为教师提供反馈与报错机制,实现数据在线审核、审核立即生效、报错自动纠错,最终实现教师数据的统一采集与管理。④数据应用丰富。在数据建设的基础上,还提供多项数据应用功能,包括经费分配、业绩计算等应用;对于基于数据的业务,教师不再需要线下处理计算并提交各类纸质文档,而是在线上即可办理提交,减少了数据反复填报的情况,提高了工作效率。

四 “一张表”平台对教师

数据治理的推动机制

目前关于高校数据治理的研究,主要是对治理框架、运行机制、管理体系等理论方面的分析,而数据治理要想在实际业务环境中有效实施,还需在技术开发及其应用等实践层面进行更多探索。作为面向高校教师的数据治理平台,华中科技大学“一张表”平台通过建立有效的应用机制,紧密结合实际业务,让教师深度参与数据治理过程,使数据治理在高校现行体制下能够有效落地实施。

1 数据同步:解决数据共享问题

由于管理需要,高校内各业务部门均建设了相关管理信息系统以管理本部门负责的业务,如人事处建设了人事管理系统、科学技术发展院建设了科研系统等。在这些业务管理过程中所产生的数据已被自动存储于各业务系统中,数据质量较高且相对规范,可作为权威数据共享至“一张表”平台。数据共享采用数据同步技术实现,而数据同步是把不同来源、格式、标准的数据通过工具进行采集和标准化,根据同步频率不同,可分为定时同步与实时同步。数据同步流程如图3所示,“一张表”平台从校级数据中心通过数据同步方式,将权威数据以标准形式共享至“一张表”平台,解决权威数据源的共享与采集问题;数据共享至“一张表”平台后,先将数据先存入缓冲数据库,再对数据进行处理,最后同步至正式数据库,提供给“一张表”平台使用。

图3  数据同步流程

2 数据处理:解决数据跨域问题

校级数据中心获取的各类数据,原本是存在于各业务系统中,在功能上服务于各业务部门。通过校级数据中心汇聚到“一张表”平台后,由于服务对象与使用领域发生了改变,数据无法直接使用,因此需要将数据先存入缓冲数据库,对数据进行处理。数据处理过程包括整理与清洗、转换、分发三个环节:①整理与清洗是指将缓冲数据库中的数据进行分类,并按照规则条件清理不规范、不符合使用要求的数据,使数据达到可用状态;②由于数据从业务系统获取,产生自业务流程,服务于业务部门,数据虽然可用,但无法直接供教师使用,因此数据经整理与清洗后还需再进行数据转换,包括结构转换、类型转换、数据合并、数据填充等系列处理,将数据转变为可供教师使用的数据,以达到数据的跨域流转与使用;③最后进行数据分发处理,确定数据归属并分发至学院与教师个人使用。

3 数据采集:解决数据来源问题

数据同步与数据处理有效实现了有源数据的采集,但业务部门未通过信息化管理的数据无法通过共享方式采集,此类数据可称为“无源数据”。无源数据通常以非结构化的方式由学院或教师个人存档,因此“一张表”平台建立了无源数据的采集机制,如统一数据格式与数据标准、对教师和学院开放填报、制定数据管理流程等,以实现无源数据的规范化采集。通过上述分析可知,数据来源可归为三类:①有源数据,通过数据中心的数据共享采集;②学院存档的无源数据,通过学院录入或导入采集;③教师个人存档的无源数据,通过教师填报采集。“一张表”平台为各类来源数据提供采集渠道,最终实现数据的全面汇集。

4 数据管理:解决数据监管问题

数据采集到“一张表”平台后,需建立管理策略与流程,以确保数据的有效性。“一张表”平台依据“谁录入谁修改,谁产生谁负责”的原则对数据进行管理:①对于从校级数据中心采集的数据,须在源头业务系统中进行管理,平台对该类数据不做维护或变更;②对于学院录入或导入的数据由学院进行维护;③对于教师填报的数据,须由学院进行审核,审核通过的数据作为有效数据入库,学院无权变更教师数据,若数据有疑议则做退回处理,由填报数据的教师本人修改后,再提交学院审核。上述根据数据来源分类管理的方式确定了数据的唯一管理源,有效保证了数据在后续维护过程中的一致性和合法性。

5 数据反馈:解决数据质量问题

对教师而言,“一张表”平台是个人数据中心,平台将教师的相关数据汇集到一起,供教师使用。以往数据散落在各处,服务于各类业务,大部分数据未向教师开放,数据质量无法验证。“一张表”平台汇集数据后,教师可进行查询与核对,并对有疑议的数据进行反馈,既可以补充数据,也可以纠错数据。其中,对于有源数据,教师反馈后,信息提交到学院相应科室核查(如教务科、科研科等),核查属实后由该科室在数据来源业务系统中修正数据;而对于无源数据,教师反馈后,提交到学院相应科室审核,审核通过后,数据立即按教师反馈自动修正。平台通过教师核对反馈机制,保障了数据质量;同时,通过坚持“数据一个源”原则,两类数据反馈采取不同的处理方式,保证数据的一致性,真正实现了面向教师的数据治理。

6 数据控制:解决管理权限问题

在数据权限上,“一张表”平台从以下四个层面进行控制:①数据来源层面,有源数据由数据生产部门负责,无源数据由录入者维护;②教师个人层面,每条数据均有归属人属性,代表该条数据的负责人——若数据由教师填报,则由其归属人维护,相关参与者可查询但不可编辑数据;③学院层面,每条数据均有归属学院属性,代表该条数据的负责学院——若数据由学院录入或导入,则由其归属学院维护,每个学院数据池存放归属于本学院的数据,而对归属于其他学院的数据无任何权限;④数据归口层面,每个数据项定义学院归口科室,由归口科室进行管理,每个科室有权管理权限内的数据项,但无权查看其它数据项。数据权限控制如图4所示,数据控制从横向数据归口到学院各科室,到纵向数据归属到教师、学院及数据生产部门,对数据进行管理权限划分,为数据安全提供了有力保障。

图4  数据权限控制

五 “一张表”平台对

教师数据治理流程的重构

华中科技大学“一张表”平台于2017年投入开发,2017年底在计算机学院试用,2018年底正式上线,现已陆续在17个学院应用,在扩大使用范围的同时逐步摸索出了一套适用于高校的教师数据治理方案。在“一张表”平台,重构的教师数据治理流程分为数据定义及建立、数据预处理、数据治理及应用三个阶段(如图5所示),支撑数据全生命周期的管理与服务。

图5  教师数据治理流程

①数据定义及建立阶段:首先,需要建立数据模型与数据标准。其中,数据模型建立包括数据定义、数据结构、数据类型及元数据的建立。数据模型建立需结合实际情况进行综合研判,并经过多轮走访调研,挖掘业务部门及学院的管理需求和应用需求,再进行统筹规划,统一建立。数据模型建立回答了“治理什么数据”的关键问题,是数据治理的基础,后续工作均以数据模型为框架开展。数据标准以校级数据中心数据标准为主、学院自定义数据标准为辅,其中的校级数据中心数据标准包括数据标准、代码标准、编码标准,参照相关的国家标准、教育部标准、行业标准及学校标准建立;对于未被数据中心标准覆盖的特殊数据,则由学院自定义数据标准。数据模型建立后,需要摸清各类数据归属的业务管理部门及其数据建设情况,以判断这些数据属于有源数据还是无源数据。对于有源数据,需确定数据来源并明确权责部门,确保在数据治理及应用阶段有源可查,切实做到数据“谁产生、谁负责”。

②数据预处理阶段:整合相关资源并处理数据,为下一阶段数据治理及应用做准备。首先建立组织结构,组织包括数据来源单位和数据使用单位。其中,数据使用单位主要为学院及其内部组织机构,包括行政科室、系所、团队、课题组等。随后,将数据提取为数据项,并将数据项在业务管理层面进行分类(如表1所示),之后划至归口科室,确定学院层面的管理权属。最后,进行数据共享及数据处理,将有源数据从数据中心同步至“一张表”平台,并在此过程中进行数据整理与清洗、转换、分发等系列处理,将有效数据传输到平台上供教师使用。

③数据治理及应用阶段:先由学院准备数据,然后学院各科室根据权属范围将其管理范围内的已有数据以数据项为单位,按照统一模板中的规范格式整理入库。入库过程采用自动检测技术,根据数据模型自动检测入库数据是否满足系统要求,保证入库数据规范、有效。学院数据入库后,平台即可提供教师核对反馈。为了便于教师操作,平台每年都会以学院为单位发布导航式的年度数据核对服务。通过此服务,教师能够集中核对个人的本年度数据,这种核对方式既方便快捷也便于学院管理。教师核对个人数据并反馈修正信息,反馈信息自动提交到相应的归口科室,由归口科室进行数据审核。除数据核对服务外,“一张表”平台还会根据教师及学院需求,提供更多的数据创新应用服务,包括经费二次分配、基于数据的业绩计算、数据报表等。数据创新应用服务不仅让数据越用越准,而且能根据实际业务反馈,及时修正校准数据模型,让数据治理真正面向教师、服务教师。

六 “一张表”平台的数据治理成效

1 对数据资产的完善

在数据建设上,“一张表”平台围绕教师教学、科研等活动,理清数据资产,各类数据均以标准形式存储入库,并按标准进行数据维护与管理,保证数据的规范性。在建设的74项数据项中,业务部门通过共享方式提供数据的数据项有16项,其余58项数据均为无源数据。这些无源数据没有业务系统管理,也未进行规范的信息化存储,需要使用时只能重复填报,更无法共享、重复利用。针对这些无源数据,“一张表”平台通过学院录入及教师填报方式,统一采集数据8万余条。平台采集学校暂无业务系统管理且未共享至校级数据中心的数据并进行统筹管理,进一步提高了数据的全面性,在完善学校数据资产的同时,也能与其他业务部门共享数据,解决了数据的重复采集、填报等问题。

2 对难点数据的治理

论文、专利等科研成果数据的采集、治理,是数据治理的难点。这类数据多产生于校外,未经过学院业务部门办理,难以采集。即使在外部机构采集到数据,也难以根据采集到的原始数据将成果准确关联到校内单位及其作者,且成果评价信息动态变化,无法直接获取。为解决成果数据治理问题,“一张表”平台与高校图书馆合作,通过与图书馆机构知识库的共享互通,每项成果经学院、教师本人核对,再由图书馆校正,目前的数据能准确反映成果的基本信息、发表情况、作者教师及其角色、署名学院、分区、高被引等信息,为后续分析及其应用提供了数据基础。

3 对数据质量的提升

在数据管理上,教师通过数据核对及填报服务,对个人的各类数据逐一核对、查漏补缺,并对存在疑议的数据进行反馈报错。在管理机制上,平台遵循“谁录入谁修改,谁产生谁负责”的原则,坚持数据审核、源头修改、多处共享。通过教师核对、学院审核、源头修改,数据的准确性、权威性、一致性得以保证。“一张表”平台自2018年底上线以来,已陆续在17个学院进行应用,截至2021年9月已服务3900余位教师,存储、管理26万条数据,教师个人核对、反馈报错数据1500余条,学院核实、校正数据1200余条(其中,业务部门来源数据校正800余条),整体数据质量得到了进一步提升。

七 结语

数据治理一直是信息化时代高校面临的一个难题。数据不全面、存储分散、标准不统一、质量不高等问题,使数据难以得到有效利用,无法发挥其价值服务于教师与高校。“一张表”平台从数据的产生者——教师切入,对教师数据治理进行了深入的研究和探索,发现平台的应用已初见成效。平台将教师定位为数据治理的重要一环,将数据最终回归于教师个人,而教师的深度参与大幅提高了数据的准确性、增强了数据的活力。对于学院来说,作为数据管理者,学院对数据生命周期进行监管与维护,实现了学院数据沉淀,优化了学院管理流程,提高了学院管理效率。此外,平台通过创新管理机制,提供技术支撑,采集治理数据,治理数据再以共享形式或应用形式服务于教师及学校单位,由此实现数据治理的良性循环。

数据来源:https://mp.weixin.qq.com/s/0Hr1yPlgGnZSRmO7-NWYbw