天极传媒:
天极网
比特网
IT专家网
52PK游戏网
极客修
全国分站

北京上海广州深港南京福建沈阳成都杭州西安长春重庆大庆合肥惠州青岛郑州泰州厦门淄博天津无锡哈尔滨

产品
  • 网页
  • 产品
  • 图片
  • 报价
  • 下载
全高清投影机 净化器 4K电视曲面电视小家电滚筒洗衣机
您现在的位置: 天极网 > 云计算>访谈>普元王轩:想成功实现数字化转型

普元王轩:想成功实现数字化转型 先把数据治理做好

天极网云计算频道 2018. 07. 26 作者:骨傲天 责编:万佳

责任编辑

本文导航
1做大数据治理 企业面临的三大问题2天极网与王轩的对话实录<<返回分页阅读
1做大数据治理 企业面临的三大问题

  初次见面,他身材高大,声音洪亮,说话语速很快,逻辑清晰。他是王轩!

  王轩不仅是普元信息软件产品部副总,负责公司大数据产品部,而且还是中国大数据产业生态联盟专家委员会专家委员、国际数据管理协会(DAMA)的会员。从中国人民银行到普元信息,多年的工作经验让他在大数据治理方面颇有心得。

  在普元信息,他已经工作8年,一直负责公司大数据产品线,做大数据治理方面的事。

  7月24日,天极网记者对王轩进行了专访,从个人职业发展、数据治理到欧盟“GDPR”,谈了很多。

  今天,我们已经进入数据时代,数据被称为互联网时代的“石油”。对企业来说,它们逐渐了解数据所蕴含的价值,对数据的重视程度越来越高。于是乎,大家开始纷纷做数据治理。

  在王轩看来,长期以来,大家一直忽略一个问题:数据跟原来的应用一样,它是需要被管理的。“我们做大数据,特别像10年前,企业开始建应用系统模式。实际上,那时企业应用系统很乱,就是做应用,用应用,并且有的应用好使,有的不好使,整天出问题。现在就是那个时候的缩影。”

  做大数据治理 企业面临的最大问题

  真正的问题是,大家做大数据发现,今天你有需求,明天我有需求,而这个数据没人管,数据质量也存在很多问题。耗费极大心血做一个数据平台,发现结果分析不对。

  他说,“我们能做什么呢?我们帮助客户把你的数据管理好,帮助客户的用户能使用好你的数据,把这件事做好就是我们现在的核心。”

  在国内,数据治理近几年开始兴起,受到越来越多企业的关注。虽然一些大型企业在信息化和自动化方面做得很好,但是在数据治理上仍然面临很多问题和困难。

  王轩认为,企业进行数据治理面临着三大问题,最大的是组织架构问题。

  “就是有没有一个组织架构来支撑,把数据管理好。从组织架构上,你必须得有一个数据管理部,像我们现在的客户东航、国开行等,它都会有这个部门。我觉得这是所有事情的开始,因为这意味着你从公司层面足够重视。我觉得这是客户最大的困难,凡是失败的项目,关键是组织架构不支撑。”他说。

  设置一个数据管理部,这是一个好的开始,后面的事情做起来会更好。

  其次是工具链条的缺失。企业做数据治理,效果往往不好,很多时候依赖人工来做,比如数据准备、数据标准等。

  王轩表示,“我们在做这件事的时候,做了很多自动化的工具,帮助客户自动化地把大数据治理做得更好,减少人工参与。”

  最后一个问题是数据含义不清楚。虽然企业该有的数据都有,但是数据的业务含义是什么,并不清楚,并且数据之间的标准也没有。因此,企业很难把数据利用好。

  先把数据标准建好 警惕投资浪费现象

  同时,他也提醒企业,如果想做大数据治理,首先要把标准做好。否则,匆忙建设各种数据仓库、数据集市,最后发现标准有问题、质量不高,然后再建数据标准,这实际上会出现投资浪费问题。

  对于这个问题,他的看法是:企业可以灵活些,建数据仓库时,同步做数据治理,按照这种并行建设的方式,不仅能看到成果,而且也能让自己的技术变得更好。

  目前,普元有一个自服务大数据治理平台,以元数据为核心,外围是大数据质量、大数据资产化、大数据标准等6个部分。毫无疑问,元数据是核心,而对元数据的管理更是核心的核心。

  “我认为,所有的技术基础就是元数据,所有的资产信息都需要元数据自动化采集,所有数据的变更需要元数据来管理。比如,一个数据从哪来到哪去,都是需要元数据来看的。但是,抛开这些功能,其核心是元数据有一套把资产自动化采集,并且统一管理起来的方式。”他说。

  想做数字化转型 先把数据治理这个基础打好

  在天极网记者看来,今天大多数的企业,去了解大数据治理、做大数据治理,更重要的推动力是企业面临数字化转型的巨大压力。

  在王轩看来,在数字化转型中,大数据治理是一个基础。“现在,企业做数据治理的很多,背景其实很简单,就是要做数字化转型。然而,企业发现数字化转型的基础就是数据要打通,数据不通,标准不一致,质量不高,没法做分析。那怎么办?必须要做数据治理。”他解释说。

  现在,很多企业每年花巨资建数据,做数字化转型,但最后发现“卡脖子”的问题是它的数据质量。

  他以阿里为例,作为一家互联网公司,它们旗下各业务的数据是通的。旗下盒马生鲜,每一个生鲜从链条头到链条尾的整个销售过程,数据自然打通。阿里收购饿了么,只花了一个月的时间,就把饿了么数据接到阿里。这种公司,整个的数字化水平非常高,信息的共享和流通能力很强。

  王轩认为,传统企业做数字化转型的最大问题是信息不共享,不能连通。企业做数据,更重要的是解决应用和应用间的信息共享问题,尤其是大的业务域和业务域之间的信息共享。

  同时,做数据管理的另外一个点是,未来任何企业都有一群人,叫数据科学家。他们负责在业务里分析出新的业务场景,能带来新利润的业务。这群人是强依赖于数据的。

  “这时候,数据治理能为他们提供一个整体的数据工作环境。总体上,数据治理是数字化转型的基础,另外一个是它能提供好的工作环境,让数据科学家能更好地访问数据。”他说。

  写在最后:

  对今天的企业来说,大数据治理这件事要趁早做。一方面,面对日益竞争的激烈环境,企业急需快速进行数字化转型,前提就是先做数据治理。另一方面,以欧盟为代表的监管者,拿着“GDPR”大棒,随时对违规企业进行处罚。这种内外多因素的推动,让数据治理成为企业亟待解决的重大问题。

 

2天极网与王轩的对话实录

 

  附:天极网与王轩的对话

  天极网:

  目前,普元有三大业务线,SOA、云计算和大数据。作为大数据的负责人,我想了解一些基本情况,比如部门有多少人,有多少人从事研发,现在正在做的事情是什么?

  王轩:

  我主要负责产品线,其他的是事业部。我们是研发和事业部分离的体系,事业部会拿着我的产品去卖。我这边的研发有50人左右,如果加上实施团队,整个公司做数据的人有两三百人。

  天极网:

  作为大数据产品部的负责人,你们的主要精力放在哪些方面?

  王轩:

  我现在主要的精力有几方面,第一是看市场,就是客户到底需要什么,以客户为中心。比如,我们主要的客户群体,他对数据治理的要求是哪些;然后,就是对产品进行改进,增加客户需要的功能。还有新的产品系列和规划、研发和其他杂七杂八的事情。

  天极网:

  企业对数据越来越重视,明白数据所蕴含的价值,未来很多企业可能转型成数据驱动型企业。在你看来,相比以前,传统数据工具存在着哪些弱点?

  王轩:

  其实我是这么想的,倒不是说传统数据工具有哪些弱点,而是大家长期以来,一直忽略一个问题:从建设方来说,大家说要做大数据,然后使用数据的人来说,我要用大数据。但是,大家恰恰忽略的一个问题,数据跟原来的应用一样,它是需要被管理的。其实,我们在做应用做了一段时间后,大家发现应用太多,需要把应用管理好,然后就做开发管理、开发管控。

  数据也是一样。在上一个时代,我们做大数据,特别像10年前,企业开始建应用系统模式。实际上,那时企业应用系统很乱,就是做应用,用应用,并且有的应用好使,有的不好使,整天出问题。现在就是那个时候的缩影。

  其实,在大数据方面,大家都要做大数据,发现你今天有需求,我明天有一个需求,然后这个数据没有人管理,这个数据质量也存在很多问题。耗费极大心血做一个数据平台,发现分析结果不对。

  在这个过程中,我觉得我们做什么呢?我们帮助客户把你的数据管理好,帮助客户的用户能使用好你的数据,这件事做好就是我们现在的核心。

  天极网:

  现在很多大多数企业,尤其是大型企业,它们在信息化和自动化方面做得很好。但是,在数据治理,包括数据管理、流程等方面仍然面临问题。今天,企业在进行大数据治理时,它会面临着那些问题和困难?

  王轩:

  我觉得最大的问题是几方面:第一是组织架构的问题,就是是不是有一个组织架构来支撑,把数据管理好。就像原来做应用时,刚开始,光有业务部,光有开发部,后来大家发现有一个叫总体部。我当时在人民银行就是总体部,或者叫架构办。

  有了这个部门后,许多综合管理的事就能做起来,大家也会做的越来越好。在数据方面也是一样。

  首先,从组织架构上,你必须得有一个数据管理部,像我们现在的客户东航、国开行等,它都会有这个部门。我觉得这是所有事情的开始。因为这意味着你从公司层面足够重视,数据这个事情是需要管理。我觉得这是客户最大的困难,凡是失败的项目,关键就是组织架构不支撑。

  数据管理这件事到底谁干?对我们来说,首先要把数据管理这件事搞明白,然后再说这件事怎么干,虽然干起来也很难。但是有一个好的开始,之后干起来会更好。

  第二个是工具方面的问题:工具链条的缺失。现在做数据管理,之前银行也在做数据治理、数据资产,但是往往效果不好。除了组织架构,很多时候都是依赖人工做。比如数据准备、数据标准、数据情况等等,大部分都是人工来干。我们在做这件事的时候,做了很多自动化的工具,帮助客户自动化地把大数据治理做得更好,减少人工参与。我觉得这是现在比较重要的一件事,也是客户面临的一大问题。

  第三个问题就是数据含义不清楚。我是一个骨架结构,数据是存在数据库里,但是这个数据的业务含义是什么,并不清楚,并且数据之间的标准没有。因此,你很难把数据利用好。

  天极网:

  未来,在数据治理方面,利用人工智能等技术,是不是大数据治理工具的一种发展趋势?

  王轩:

  这是一个非常强的趋势。数据治理这件事做不好。从客户看,我有很多业务人员,如果要让业务员帮忙,给我做很多工作,那么这样数据治理会做不好,因为业务人员还有自己的工作。从工具层面,要智能化、要自动化,要别人少干活。我觉得这是一个非常明显的。

  从我来普元后,一直做大数据治理,在这个时间,我发现技术是在不断变化的。虽然我们的产品在自动化方面是国内数一数二的,但是未来在人工智能方面,怎么把自动化和智能化相结合,这应该未来的发展方向。

  天极网:

  你之前提到大数据治理,会从管控型向服务化发展,这种转变的原因是什么?

  王轩:

  这件事想了很久。以前做数据治理,比如你是业务部门,我是这个数据库,然后你是数据提供方,也是数据的应用方;其实我是帮你把数据管理好,你做帮忙的角色,那你要想一个问题:我怎么帮到你。

  但是,反过来,原来很多企业做的都是数据管理部,制定规则、规范,然后强制要求你按我的规则来,这就是管控型,强管控,但这样做的效果非常差。因为业务部门是不会听数据管理部的。从组织架构上说,你很难说,我不是你的领导,我凭什么要听你的?我给你安排工作,你凭什么要按我的规范来,而且你不是减少我的工作量,是增加我的工作量。

  理顺逻辑。我第一点首先要减少工作量,我要对你有规范、有要求。那我减少工作量,就需要自动化、智能化,让业务人员少干活,但还能把事做好。

  第二个方面是,我对你的价值是什么。我的价值实际上是让更好地使用数据,是我给你带来的直接价值,更好地知道你的数据业务含义是什么,然后提高你的数据质量,让你更好地调用别人的数据。

  我把基础打好,把数据分析清楚,然后给大家提供一系列的数据服务。最后,真能把数据管理好。

  所以,这就是从管控向服务化方向发展。

  天极网:

  对一些企业来说,已经在进行大数据治理了,但是各种数据集市、数据仓库的建设也出现新问题。尤其是大型企业业务系统的扩展和数据量的大幅增加,会出现数据一致性问题和业务指标口径不一致。对这个问题,你是如何看的?

  王轩:

  这个还是先做标准。十年前,银行做,很多时候大家都是先建设再治理。先建好,把数据仓库建好,然后标准有问题,质量不高,然后再建数据标准,但实际上这时候你的投资已经是第一期投资,做数据仓库的投资肯定有一部分是浪费的。

  从企业负责人来说,你是做数据治理,还是做数据仓库?从我的角度说,肯定是先做数据仓库。因为数据仓库或数据集市平台做出来,可以马上看见。

  相对来说,数据治理偏管理,是一个貌似很虚的东西。但是,我觉得企业在处理这个问题时,可以更灵活:在做数据仓库时,同步做数据治理,按照这种并行建设的方式,不仅能看到成果,而且也能让自己的技术变得更好。

  天极网:

  如何来理解数据治理?

  王轩:

  这是一个比较虚的,我是做产品出身的,属于实操派。 数据治理,它有很多流派。从咨询流派看,它是一个管理体制的问题。但是从我们角度看,我是要把你每一个数据治理清楚,提高质量。

  天极网:

  我看过你们的大数据治理平台,元数据是核心,对元数据的管理更是成为核心的核心。如何对元数据进行有效的管理?云数据的管理能够为企业管理信息提供哪些帮助?

  王轩:

  从我们来看,我认为所有的基础基础就是元数据,所有的资产信息都是需要元数据自动化采集的。数据资产信息是需要自动化采集的,所有数据的变更需要元数据来管理。比如,一个数据从哪来到哪去,都是需要元数据来看的。

  但是,抛开这些功能,其核心是元数据有一套把资产自动化采集,并且统一管理起来的方式。这个是非常重要的。当有了这个方式后,我们可以做非常多的治理。

  你的核心是数据能很准确,很准确地把所有资产的信息全部都采集过来,包括资产和资产间的流动信息。需要达到字段级的采集,把这些东西都整理好,然后在上面做其他的事。

  现在,对元数据又有了新的职能,比如做知识图谱,其实元数据本身,可以抽象出它的业务含义,做一些业务模型。

  从广义的元数据来看,元数据的定义非常广泛,包括技术元数据、过程元数据和业务元数据。我现在研究最多的就是业务元数据,何为业务元数据?怎么把业务元数据管理好?

  我们最近也在做一件事,就是把一些词汇整理出来。实际上,圈内发现很多词汇含义不统一,比如元数据的含义是什么?业界专家也是说法不同,因此期望在这个组织里,统一声音,不然就觉得这个行业很乱。

  未来这种行业内的标准探讨会持续下去,而且标准制定也是发展趋势。

  天极网:

  普元在元数据管理方面有哪些布局或产品?

  王轩:

  现在,我们的元数据管理是一个单独的产品,未来元数据产品会向数据资产方向发展。因为数据资产的核心也是元数据。从我的理解看,数据资产其实是包含在整个大数据治理的范畴内。我们更多的会看,数据资产该怎么样管理。

  数据资产管理是未来一个明显的趋势。前端时间,我们和东航领导开会,他打了一个特别好的比喻:他说数据就像我们的飞行员,飞行员是个人,他是不能估值的。但是,它长翅膀,假设国航和东航合并,飞行员要单独计算价值。我们有8000飞行员,不能按工资算,他有很高的溢价。

  做数据同样如此,数据虽然现在不能估值,但是采集都是有成本的。对企业来说,如何把数据资产管理好,让数据资产发挥更大的价值。

  对企业来说,这个未来是企业价值的源泉,同时也是企业一块新收入。现在,一些公司购买的数据和输出数据能打:就是我花多少钱买收据,也有人花相应的钱来买我的数据。然后,大家慢慢变成一个数据生态。在这个时候,数据资产就变得很重要!

  对数据资产来说,把质量提高以后,把服务能够提供出去。资产不是说要放在这,而是更好地使用。

  天极网:

  企业如果使用元数据,可以管理哪些数据?普元的元数据管理水平在业界处于什么地位?

  王轩:

  如果采用普元的元数据管理,应该是所有的数据都可以管理,包括规范类数据标准、业务元数据等。市面上基本上,你能见到的所有工具,所有东西里面都可以做自动化采集的。在国内来说,应该属于一流水平。

  天极网:

  在你们的大数据治理平台中,除了核心的元数据,还有主数据、大数据质量、大数据资产化等6个项目。从整体上说,它们之间是一种什么样的关系?如何理解这样的一个平台?

  王轩:

  元数据是核心,包括主数据、数据资产和数据质量等外围的在管理上都有一些调用关系的。但是,彼此又比较独立,每一块都是一个独立的领域。不过,所有的各部分都需要元数据作为基础。

  天极网:

  目前来看,大数据治理的核心是什么?大数据治理的过程是什么样的?

  王轩:

  我自己觉得还是数据资产,或者叫数据的良好关系,或者叫对数据的有效管理。我觉得,大数据治理的核心其实就是对数据的有效管理。

  首先,我们会去给他做整体的咨询,对它数据成熟度做评估;评估完之后,会给他一个整改方案,你应该怎么做;然后会有平台去做落地,再做持续的改进。这就是大概的过程!

  天极网:

  你还是国际数据管理协会(DAMA)的会员。在你看来,在大数据治理方面,国内外有哪些差别?国外有哪些好的经验值得借鉴?

  王轩:

  国外做的时间更长,我们这一代很多做数据治理的人,都是从国外的一本书中学出来的。国内外最大的不同,个人感觉只是国外做得更早一些。但是,国内的数据量以及数据复杂程度等,很有可能国内的整个数据管理行业会超过国外。

  在国内,无论是BAT,还是华为,管理的数据都非常庞大。这样数据管理的复杂度,国外人也是见不到的。就我所知,不管是在华为,还是阿里、腾讯,数据管理部都成为一个标配,有一帮人持续地做这件事。未来3-5年,国内的水平要比国外强。

  但是另一方面,国外的一些公司做得时间早,比如Informatica产品确实做得不错,因为它们对产品的投入很高。并且,产品这东西,它不是靠你的Idea,而是靠真正投入进入,大家组织好干这件事。我觉得Informatica在人工智能方面做得不错,比别的产品做得要好一些,至少从宣传资料上看是这样。

  但是也存在一些问题,比如基于中文含义的打标签不是做得很好。一旦落地到整个中国,全中文的环境是一个很大的挑战。同时,它们对国产数据库的支持,也很一般。

  不过,普元跟国内所有的国产数据库厂商都已经打通,包括阿里、麒麟等厂商,都有接口,可以直接采集。因此,在中国的这块土壤,我觉得我们更有优势。

  天极网:

  很多国内企业在做数字化转型,大数据治理在这种转型过程中的定位和角色是什么?企业应该如何来做大数据治理?

  王轩:

  在数字化转型中,大数据治理更像是一个推动者,或者叫基础。我觉得叫基础更合适,因为这个东西看不见,但是没有这个东西,你的数字化转型还做不了。我听说很多企业,尤其是一些不差钱的大企业,每年花巨资建数据,做数字化转型,但最后发现卡脖子的问题是它的(数据)质量。

  在这个过程中,数据治理其实是一个还很重要的基础。现在,我觉得企业做数据更重要的是解决应用和应用间的信息共享问题,尤其是大的业务域和业务域之间的信息共享。

  现在的互联网公司,或者叫新一代数字化的公司,比如阿里,它们强调它们的数据全是通的,旗下盒马,每一个生鲜从链条头到链条后的整个销售过程。阿里收购饿了么,把饿了么的数据接到阿里,只花了一个月的时间。因此,其整个数字化的水平,是非常高的,也被视为信息的共享和流通能力很强。它整个数据标准、落地数据的流通非常强,没有任何障碍。

  但是反观我们传统的企业,在做数字化转型的时候,大家最大的问题是信息不共享,不能沟通。目前对企业来说,最大的问题可能是数据孤岛。你没办法把数据统一地连起来。

  当然,现在很多企业都在做数据管理,其中有一个点没说,就是任何企业未来一定会有一堆人,这群人叫数据科学家,它们负责干啥?就是负责在业务里分析,分析出新的业务场景,能带来新利润。这群人是强依赖于数据的。这时候,数据治理给他提供的是什么?给他提供一个整体的数据工作环境。

  总体上,一个是数字化转型的基础,另外一个是我的整个数据治理提供好的工作环境,让数据科学家能很快地访问数据。简言之,把基础建好,提供一个好环境,能让大家把数据用好,给用户带来更实在的价值!

  天极网:

  今年5月底,欧盟《GDPR》法案正式实行,这也意味着它们对数据的监管趋严。而你们的很多客户都是大型企业,在海外都有经营。在你们提供的大数据治理方案中,是怎么来实现“合规”的?

  王轩:

  是这样的,数据合规其实是一个咨询过程。当你把所有的咨询成果弄出来后,它会出一个文档,里面会写清楚:有哪些数据,有哪些数据需要注意。然后,现在做法是两块,第一块是我们通过元数据自动化、智能化分析出来。根据要求,哪些是个人隐私数据,需要工具先来分析,分析出一个范围。在这个范围内,让你去找。

  第二个是有能力让你打GDPR的标签。通过我们智能化分析,哪些可能是隐私性的数据。一旦数据被精确确认,打上标签,未来再做管理时,有一整套的元数据管理的方法,固化到系统里。

  当你碰到GDPR涉及的数据,都会有相应的流程启动,比如说我要一个数据,要这个数据服务,点击一个按钮就可以拿走。碰到GDPR涉及的数据,我要单独给数据服务打上标签。

  当用户需要删除这个数据时,而当我给别人提供对外服务,一旦涉及GDPR,一定要小心,因为你这个信息必须得去掉。因为GDPR的信息就是个人隐私信息,从你的企业出去后,这就很危险。对企业来说,一旦出去,这个数据就是失去控制。所以,从个人观点看,有关GDPR的数据最好还是留在企业内,留在企业不要出去。因为出去后,风险太高。

  在GDPR实行之前,欧盟的法律规定数据不能出欧盟。我们当时做了一个华为的项目,华为给西班牙巴塞罗那电信,它们用的是我们的元数据。当时,我们的工程师过去,拿着电脑去,回来时电脑硬盘就留在那了。然后,回来又重新买了电脑硬盘,重新装上。

  从我个人来看,我是觉得GDPR挺好,因为我们现在的数据隐私太泛滥,个人信息到处乱走。

  天极网:

  对国内企业,尤其是出海企业来说,如何应对欧盟“GDPR”法案?

  王轩:

  从我说,还是得从数据管理上下功夫,整体的体系不是像现在这样被动,而是主动应对,主动地去分析自己的数据,是否满足“GDPR”规范。

  对我们来说,有的企业可能还没有出海。我觉得出海之前,企业数据管理的能力得先具备。然后出海后,你就会少罚很多钱,相当于赚钱了。我觉得这个经济价值是很容易衡量的。欧盟“GDPR”规定,最高罚款是年收入的4%,这个是全球年收入。

作者:骨傲天责任编辑:万佳)
请关注天极网天极新媒体 最酷科技资讯
扫码赢大奖
评论
* 网友发言均非本站立场,本站不在评论栏推荐任何网店、经销商,谨防上当受骗!
办公软件IT新闻整机