海口资讯网

海口资讯网

是领先的中文新闻门户网站,也是互联网中文新闻资讯重要的原创内容供应商之一。依托中新社遍布全球的采编网络,每天24小时面向广大网民和网络媒体,快速、准确地提供文字、图片、视频等多样化的资讯服务。在新闻报道方面,中新网动态新闻及时准确,解释性报道角度独特,稿件被国内外网络媒体大量转载。

菜单导航
主页 > 产品运营 > 正文

数字化转型路上,企业管理者必备的数据基础概

作者: 海口资讯网 发布时间: 2021年07月21日 05:48:33

一、数据的发展

疫情的这一年,似乎是所有公司对于数字化转型开始重视的一年。

无数公司在加快数字化转型的速度,而居家、在线、微信生态(小程序、视频号)、抖音快手的加速下沉又为这一转型构建了完善的基础并提供助力。游戏、电商、直播、在线教育等互联网 C 端业务随着用户需求激增而飞速发展,同时还带动了之前并不是太受重视的 SaaS、PaaS等 To B 业务。

在这一系列的变化下,数据的量级、多样性以及分布的平台都发生了不小的变化,而在各家的管理者口中,与数据相关的概念、平台、工具、能力也开始越来越多地被提及。从早些年的 Hadoop 到数据中台,再到 " 数据即能源 ",从DMP到CDP,从公域再到私域,让人感慨快跟不上节奏。

本文笔者将把目前比较常被提及的与数据相关的概念做一个通俗梳理,帮助那些之前没接触过或是刚接触这方面信息,并有打算做些事情的创业者了解:现在在谈论数据的那些场景,大家到底在讲些什么?

二、基础层面

数据库

这个概念几乎业内人都接触过,简单来说,数据库就是按照数据结构来组织、 存储和管理数据的仓库。这个概念已经有六十多年的历史了,可以说后续所有跟数据相关的概念都是从这里衍生出来的。

这里主要介绍的是现在大家经常提到的数据库,分为 SQL 和 NOSQL 两类,很多没有接触过的人就会感到疑惑,其实这两个都是一种简称。

SQL 型数据指的就是我们之前常用和常说的关系型数据库,主要代表有 SQL Serve、Oracle、MySQL 等;而 NoSQL 泛指非关系型数据库,主要代表有 MongoDB、Redis、Hbase,这种数据库具备更好的扩展性,我们经常听说的大数据集群往往就是指的这种。

数字化转型路上,企业管理者必备的数据基础概

SQL 与 NoSQL

不过这里面有个概念要明确,两者并不是完全对立,NOSQL 并不是说不要关系性了,而是指 Not Only SQL。

对于非技术出身的人来说,不需要理解那么精准,只要了解自己的业务的数据是单一、结构化、稳定的还是复杂、多样、变化多的就好了,前者往往针对的是一些场景固定、长期的业务,如银行、纯线上电商等;而后者面对的往往是针对社交、网络平台等与内容相关的场景。

但对于目前的互联网公司来说,业务往往都不那么单一了,所以往往都是选择关系型数据库(如 MYSQL)和 NOSQL 数据库的混合方案来针对不同场景的数据进行支持。

数据仓库和数据集市

1、数据仓库

数据仓库这个概念很多人会跟数据库等同,以为只是说法不同,但其实两者还是有区别的。

数据库更多的是面向事务处理的,我们经常听到技术同学提到说什么什么应用或是系统,把数据写入数据库或是从数据库读取,就是因为往往这是直接的业务逻辑支持。

数据库的表一般会结构复杂,以应对复杂的业务逻辑,同时存在较少的冗余数据,且单次对应更少的数据(经过优化),适用更简单的读写查询,以减少时间,提高业务响应的速度。

而数据仓库往往是面向数据分析的,里面的数据已经经过了一定的清洗和处理,相对结构会简单一些。但由于经过了逻辑对应,因此会存在一定的冗余数据,不过数据仓库可以支持更复杂的查询,单次所要处理的数据量会更大。

之前看到过一种比喻,感觉挺有说服性的,就是数据仓库就好像我们在宜家一楼看到的那个取货的仓库,按照货品、位置分门别类的放好了。对于顾客来说,这种摆放虽然不太适合逛,但很适合快速找到自己要的产品,也便于宜家工作人员进行管理。

2、数据集市

数据集市,也是一个容易被人们和数据仓库混淆的概念。

数据集市其实在某种程度上算是数据仓库的子集,但是它的主题更集中,是面向某个业务部门或是某种角色而单独出来的小型数据仓库。

在这里所有相关的数据会被集中在一起,用更符合该业务或是角色需求的方式进行处理和存储,这里面的数据一般就是来自于数据仓库(当然也可能有部分来自外部,内部再做了整合)。所以可以把数据集市简单理解成展厅,比如书房、卧室,把楼下的货品用某种主题进行重新组合,便于服务对象(顾客,公司里是业务方)进行理解和使用。

因此数据集市的规模往往要小于数据仓库,根据主题需求,可能只放一段时间或是一个方面的数据就够了,并不需要像数据仓库那样存储大量数据。

数据湖和数据河

上面的概念更偏技术,但数据湖和数据河,甚至数据沼泽好像就更多会出现在各家数据产品厂商或是云厂商的宣发资料里了,让人觉得高深莫测。

1、数据湖

本文地址:/cpyy/147990.html

请遵守互联网相关规定,不要发布广告和违法内容