返回上一页 文章阅读 登录

胡小明:大数据应用十点反省

更新时间:2018-09-03 15:53:07
作者: 胡小明 (进入专栏)  
来推算用户的效益,而这恰恰是非常错误的估计,用户并不是以会计成本来计算数据服务系统的效益,成熟的用户是以机会成本来估算效益的。用户是否要用数据服务首先想的是数据应用在自己工作优先级的顺序,企业和政府都有非常重要的事情要做,一件事情的成本是其耽误的最重要的事情的成本,或许数据应用会有效益,但是如果这种应用耽误了更重要的事情,那么这种应用就是不合算的,因为机会成本超过了预期效益。

  

   在数据服务系统的建设中,我们首先要考虑的事情是用户有没有更重要的工作,大数据应用在工作优先级序列中排在什么位置,对于那些工作焦头烂额的机构肯定有更重要的事情要做,大数据应用不可能是最重要的,做也做不好,只有在那些工作有条不紊的机构大数据应用才会有效益。

  

   3.3 数据服务可持续才会有效益

  

   数据服务应用的成功本质上是一个经济学问题,服务与产品不同,服务的效益需要有可持续性,其效益的获取往往不是一挥而就的,它需要服务一定的时间,才能赚回投入的成本,也即该服务必须达到一定的生命期,积累的效益才是经济上合理的,如果数据服务系统活不到预定的期限,早早夭折,那么数据服务也是不成功的。

  

   3.4 可持续的应用意味着有生命

  

   于是我们看到在数据服务中,服务的可持续性是项目是否成功的又一个重要因素,不可持续的应用在经济上是不合算的,如何使数据服务可持续的问题换句话说则是成功的数据应用服务系统必须要有其生命,我们需要从生命的视角来理解服务系统、设计服务系统。

  

   有生命的系统必须要能够持续地从外部获得资源,要有效益-资源循环的功能,重要的是要能够自我调节、自我完善的能力,能够跟随环境与需求的变化自动进行维护与调整。任何信息系统都不大可能一次成功,都需要磨合、调整与完善,在系统的生命期中,环境与用户需求也会不断变化,系统需要有自动调节维护的能力,这种根据需求变化自动适应的能力就是系统的生命力。

  

   四、数据整合与精细化管理

  

   管理与服务的精细化取决于数据管理的精细化。

  

   数据处理是操作层次的问题,是对数据的直接使用。这个层次是计算机最容易发挥作用的层次,这是对行为记录的操作处理。

  

   4.1 服务业务本质上是数据处理

  

   政府的数据应用可分为两类,一种是用于决策,另一种是数据处理。政府对公众的具体服务基本上都是数据处理业务。数据处理是对服务对象(也称为实体)的相关数据进行加工、改造等处理,并记录处理的结果。数据处理要在原有的数据基础上按照确定的处理原则与实体数据进行加工,数据处理的结果记录下来即成为业务数据。在政府的工作中出于管理与操作分工的方便,对实体的服务业务会由多个业务部门分别处理,这就必然会造成同一实体的数据处理记录会分别存储于相关部门的数据库中,这种记录会在以后的数据处理中被其他部门调用。

  

   4.2 服务业务是精确使用实体数据

  

   服务型业务实际上都是对相关实体数据进行处理,实体数据必须是精准的,不能够有任意性,工作人员为甲服务必须使用甲的数据,而不能使用乙的数据,而且处理的结果是要保存的,业务数据都是数据处理的积累,数据如果不准确将会产生服务纠纷,数据必须是精准的。

  

   业务数据处理经常要由不同的专业部门承担,这会造成同一实体的不同属性数据会分散存储在不同部门的数据库中,这些数据在某些业务服务中需要被调出来作为数据处理的参考数据,这种数据调用也必须是精准的,不得有任何差错。

  

   4.3 业务数据整合提高操作效率

  

   在服务业务的数据处理中,需要调用当事实体的多方面属性的,例如要申请办餐饮业则需要检查是否有卫生合格证明、防火安全证明,而这些数据会分别存于卫生部门和消防部门的数据库中,政府办事时需要把这些数据调出来,调用的效率决定了政府服务的速度,如果通过数据整合的连接能够通过唯一的标识码(如企业机构代码)将相关属性数据迅速调出来,那么就能够大大加快数据处理的效率,,提高服务的效果,为用户节约了时间。

  

   4.4 业务数据整合与数据质量维护

  

   大部分的政府向用户的服务都是对相关实体的数据处理,部门相关实体属性数据调用的速度是影响效率的关键,只要能够对各部门数据存储实现标准化,让通过实体标识符跨部门调用各方面属性数据变得非常流畅,业务数据处理的效率就会大大提高。

  

   在政府服务的数据处理中,数据质量的维护变得十分重要,因为业务处理的数据必须是精准的,否则就会出现处理纠纷,通常业务数据是分散由各部门自行管理的,这种管理模式有助于数据质量的维护,如果为了使用方便将数据在物理上集中管理虽然使用会方便性,但是对数据的质量维护会带来不便,在业务处理中,数据的质量维护太重要了,还是逻辑统一物理分散的模式更好些。

  

   五、研究型工作的数据应用

  

   研究型工作感兴趣的是数据集所包含的信息。

  

   研究型工作不是直接使用数据,它是高于数据层次的工作,在数据层次之上的工作只是数据挖掘,将数据集所包含的信息提取出来。

  

   区分不同层次的思维是重要的,抽象层次的问题要用抽象思维的办法。信息不等于数据,数据是具体的,信息是抽象的,决策是在抽象层次上的。

  

   5.1 研究型应用旨在发现数据中的相关关系

  

   大数据应用最主要的功能就是发现数据中的相关关系。这是大数据分析的优势也是其局限。在没有大数据技术之前,人们经常是一因果关系分析为主的,但是因果分析实际上很困难,许多事情很复杂,很难找出主要原因,而大数据分析跳出对因果关系的依赖,只要相关关系是稳定的就可以有效利用,这就大大扩展了数据分析应用的范围,对于改进工作是十分有利的,因为能够用因果关系讲清楚的关系太少了,不再拘泥与因果关系的完备就能够大大提高改进效率。

  

   5.2 政府用信息决策而非用数据决策

  

   政府决策不是具体的事件处理,而是制定政策,确定处理类似问题的原则,其解决问题的办法必须带有普遍性,因此政府不会针对个案决策,而是针对规律决策,政府是在用信息思考而不是依单个数据来决定政策。决策是给出处理事务的原则,是高于具体业务处理层次的,决策必须使用高于数据层次的加工后的信息,政府是用信息决策,信息是数据中包含的高层次的规律,这是高层与基层处理数据应用的不同之处。

  

   5.3 决策使用数据主要是是数据挖掘

  

   高层决策需要使用的是数据集中包含的信息、规律与知识,因此必须先对数据进行加工处理,这一过程称为数据挖掘,数据挖掘就是通过统计分析等一系列方法去研究数据中所包含的相关关系,然后利用相关关系改进决策。政府高层决策不是直接使用数据,而是先从数据中挖掘出信息再使用。

  

   5.4 为领导层服务的信息系统面对外部竞争

  

   政府与企业的高层领导处理问题需要的是信息,数据只是提取信息的原材料,并非决策离不开的素材,要获取信息可以通过不同的数据,正如不同的科学实验可以发现同样的规律一样。为了获取管理决策的信息,领导者可以广泛地收集数据资源,而不必局限于政府内部信息渠道,从而扩大视野提升信息获取能力,也即政府内部信息系统将会面对来自多方面数据渠道的竞争,政府内部信息系统如果不能发挥自己的优势也会被外部系统所淘汰。

  

   六、大数据应用机会与局限

  

   大数据提供了信息发现的新渠道,但也有其与生俱来的局限。

  

   大数据有机会,也有局限性。数据只是信息表现的一种形式,更多的信息是无法数字化的。即使大数据越来越多,但是数据所能表达的还是信息的小部分。很多信息是通过直感获得的,这种信息感觉是非逻辑的,是天生的。

  

   6.1 大数据获取信息比抽样调查有优势

  

   从大数据中获取信息有其独特的优势,这是因为大数据使用的是全样本,可以做到更精细的分类,发现更多的相关关系。抽样调查曾是人们获取数据的重要方法,但是抽样调查的样本数目有限,不可能支持太细致的分类,无法对小概率的相关关系进行描述,而具有几乎无限样本的大数据处理就可以避免这一问题。大数据分析获取信息的缺点主要是数据资源不容易找,大数据处理需要的环境与技术门槛太高。

  

   6.2 大数据支持了人工智能的发展

  

   大数据技术对信息技术发展最大的贡献是推动了人工智能的发展与应用,人工智能的发展一度进入了困境,以计算机模仿人脑的思路实现人工智能越来越困难,大数据帮助人工智能跳出了这一困难,以机器学习的方法替代了人脑的模拟,使人工智能技术出现了飞跃,如同飞机跳出了对鸟的模仿而改用空气动力学原理实现了航空业的腾飞。大数据的来源主要是传感器,人工智能技术是对自动化数据直接进行处理,利用云计算、物联网、大数据技术实现智能化的服务。

  

   6.3 业务数据的连接提升数据的价值

  

政府官员经常把整合后的数据资源视为大数据,(点击此处阅读下一页)


爱思想关键词小程序
本文责编:川先生
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/112086.html
文章来源:作者授权爱思想发布,转载请注明出处(http://www.aisixiang.com)。
收藏