文件列表:
网易数帆:网易数据治理白皮书.pdf |
下载文档 |
资源简介
>
网易作为一家互联网公司,很早就在生产活动中应用数据的分析结果,助力业务的增长。随着业务规模的扩大,如网易云音乐、 网易有道、网易新闻、网易严选等多个业务线的孵化,同时也诞生了大量的集群,内部对于集群统一管理的呼声也日益变 高。2018年以前,网易还没有将数仓的建设提升到组织架构的层面去规划,导致各个业务部门的不同团队都有一些零散的数据 开发和分析人员承载本团队内的数据分析需求,这样的一个组织架构导致的结果就是很多零散分裂的小数仓存在,烟囱式的开发 对业务带来了严重的影响。到了2018年,因业务规模的快速扩大,数据量的急速增长,相应的数据问题终于爆发,例如数据使 用率低、数据经常违反常识、数据成本指数增长导致投入产出比低、数据安全风险日益突出等等,数据治理迫在眉睫。我们将上 述问题进行了归类,总结出了四个数据使用过程中的问题,分别是找不到、看不懂、信不过、管不住。
加载中...
本文档仅能预览20页