大数据技术哪些知识比较难掌握(总经理也懂的数字化)(1)

数据,就是可描述的事实

数字化的三个基本特征:联接、数据、智能。第二项要素就是数据,关于数据这个定义就太五花八门了。我终于找到了一个我觉得可以接受,或者我也认为大家作为管理者、作为非IT的人员,可以接受的定义。这个定义非常简单,数据就是可描述的事实。

这样去定义数据,跟我们管理中,“用数据说话”、“我要的是数据”,这个定义稍微有不一样的。从技术上来讲,就是计算机或者电脑,它可以描述,它可以识别,或者它认为可以用的这种事实的描述,那我们就可以认为这就是数据。因为如果你不可以描述的或者不用到的那些,我们想即使有关系,而事实上我们也关系不上,或者我们也用不上,比如说现在对人的心理的不可描述性,当然当有了视频技术,可以抓取一些行为要素而形成的一些心理数据,那么我们说他就是可以描述了。

所以计算机,可描述、可识别、可接受、可应用,一些事实的描述,我们就认为他就是数据,同样的道理,从管理的角度来讲,我们可以描述、可识别的、可接受的,而且可以应用的,这些事实,我们也可以把它描述为数据,他不仅仅是数量或者数字。

大数据&小数据

数据的另外一个相关定义,就是大数据和小数据。这些关于数据的定义,在网络上,在各个领域的定义,是千奇百怪的,关于大数据,我觉得采用IT界或者IT的语言,他们最能够接受的,最常用、最通俗的。

数据有两类,结构化的数据和非结构化的数据,而非结构化数据和结构化的数据加起来就叫大数据。那么什么又是结构化呢?我们在管理上也有,比如说结构化面试、结构化设计,或者结构化的什么,这个概念跟我们管理上的结构化也稍微有不一样。举个例子,我们只要有系统,比如说HR系统、ERP系统、CRM系统、oa系统等,只要在这些系统内存在的,在跑的这些数据我们把它称为结构化数据。而对一些在文本,比如说word文档、PPT文档、视频、照片啊,这些可能计算机还需要通过另外的处理也可以解读,我们把他叫做半结构化的数据。其他的,我们统称为非结构化的数据。

其实在一个组织里,结构化数据是占少数的,非结构化数据是更多的,业界也有一个相对应的通常说法,就是在一个公司里,即使上了再多的系统,结构化数据最多只占30%-40%,甚至更少,而大量的是我们现在还不可以描述的,不可以琢磨的那些数据。

我其实更想用管理的思维去解释这种数据的结构化。举个例子,比如KPI。KPI怎么去定义,这个KPI的算法、计算方法,(“算法”这个概念又跟IT的概念又有很大的冲突),通过怎么样方式采集这些数据的,那么这种如果在统一的一个数据流(KPI的定义公式)里,我们就可以认为他是结构化的数据了。再比如说,生产工人的工资计算,他需要定时报工,加工量、加工品质等,每个月固定日期来结算,这样的一种做法及流程,以及相关的表单,那么在这些过程和表单上走的这些数据,我们也可以认为是被结构化的数据,当然这种情况在IT里面它就属于半结构化。对于业界那些所谓说大数据,是否真的是大数据呢,或者说云计算,其实截止现在还很少用到,而对于一个组织管理来讲,这种被结构化了的数据,小数据能够充分地利用就已经非常不错了。

数字化的关键,是在于你是否会用数据来去管理和决策,所以为了用数据进行管理,数据化的管理,在前端必须把它变成数据,叫业务的数据化,当你有了数据以后,你再对这些数据的应用,辅助决策,或自动化的决策,反作用于业务,这叫数据的业务化。数字化三个基本特征中,最典型的特征是数据,联接和智能都是围绕着数据来建构的。

大数据技术哪些知识比较难掌握(总经理也懂的数字化)(2)

工作流&数据流

我们讲数据化管理,首先要把它放在一个流动的动态过程中。组织的每个任务都是按照时间顺序即一定的流程(我们叫程序和方法),包括用什么人,用什么设备,在什么时间,做完什么事,我们称之为一个工作流。这样看来,工作流,每一个工作流,他都自带着数据流,人、财、物、事、时、数等,而管理的意义就在于在流动的工作和流动的数据里面怎么去运用和使用。这里需要注意的地方,就是一定是在工作流里面产生流动的数据或实时的数据,然后用实时的数据的分析,再返回到工作流上。当然,我们所定义的实时,是有颗粒度的。

这个工作流,我们普遍的理解就是业务流,而不仅仅是HR的工作流,很多做HR咨询项目,或者HR的改善,往往会把他们只是定义为HR部门的管控模式,HR部门的工作流程,这个太局限,太狭小了,我们首先要抓住业务的流程、业务的数据,然后再在这些业务的工作流,实时提取及关注关于人的数据。当有了数据和数据的流动,接下来就如何进行数据分析,这个过程中借助一些技术的手段,那就是智能。

(本文节选自DHR星球计划培训文稿,待续)

,