大数据项目3

news/2025/2/26 13:36:13

项目目标

将超过30个核心系统数据,实施同步复制,统一集中到大数据平台。

1)将数据实施同步,数据量很大。—数据比较复杂

2)数据复制的实时性、准确性

3)复制数据需要增加标签(操作时间、操作类型、操作人等),便于后端识别数据。

4)如何抽取数据,减轻对生产库的影响。如视图、临时表、dg库等手段。

5)如何更好的适配后端应用,保证数据规格灵活,预留字段充足。

可以考虑建立编码管理,元数据仓库。

6)具备操作控制流管理、数据抽取、数据清洗、数据对比的功能,方便追踪溯源。

第二、项目难点与应对

1)业务系统众多,数据源比较复杂,有sqlserver,mysql,essbase,oracle,sql server。同时数据规则不一。

建议建立数据处理中心、元数据仓库。转换数据格式,并做好扩展性。

2) 数据量庞大,初始化数据的时间开始点很重要。一般财务核算数据保留两年的时间。但是因为业务特殊性,有些数据

需要追溯到10-30 年,甚至更长时间。

3)对数据存储空间、存储机房位置,是否需要专用光缆,是否和其他系统抢占资源等。

4)复制核心业务系统数据不超过10S-20S。实效要求高。准确性也需要,否则无法保证数据准确性。

5)对数据清洗、分摊、补录。提供一个统一手工补录的接口。

第三、解决方案:

1)数据平台复制数据需要支持异构数据库大数据量、实时性、模块化。

可以考虑初始化数据全量同步到hdfs,增量数据同步到kafka。

2)复制数据放在 备份库上。一定要减轻生产库的压力。

3)为了节约网络资源,需要和备份数据库放在同一个机房。、

4)需要建立数据控制流,方便数据校验。 暂定校验数据条数、数据数量合计。

目的是支持后续业务进行数据操作回查,实现数据校验。特别是财务数据,可能需要下钻

抽取凭证级的数据。

5)需要配置多个同步通道。可以快速将数据同步到数据库,并支持增量同步的方式。

需要选取复制效率最高的产品。如可以支持多线程、多并发、特定数据格式、数据压缩技术,

以及快速数据抽取和装载技术。


http://www.niftyadmin.cn/n/437372.html

相关文章

解决vue打包一次部署到不同的服务器的问题

1. 问题描述 在工作的时候,往往碰到同一套vue前端代码程序需要部署到很多的服务器上,每次更改完程序都需要打包部署到各个服务器上,因为每个服务器的访问地址和端口都不一样,如果用的若依自带的框架,需要每次都需要打…

亚马逊sp-api通过api修改价格,标题

最近在对接亚马逊的修改价格这个api,可能是因为习惯不一样吧,实在是踩了太多的坑了,而且全网没找到相关能看的博客,所以一直在坑里,最近差不多做出来了,所以写一个总结,希望其他人再对接的时候不…

深入理解深度学习——Transformer:解码器(Decoder)部分

分类目录:《深入理解深度学习》总目录 相关文章: 注意力机制(Attention Mechanism):基础知识 注意力机制(Attention Mechanism):注意力汇聚与Nadaraya-Watson核回归 注意力机制&…

00后是真的卷不过,工作没两年,跳槽到我们公司起薪17K都快接近我了

在程序员职场上,什么样的人最让人反感呢? 是技术不好的人吗?并不是。技术不好的同事,我们可以帮他。 是技术太强的人吗?也不是。技术很强的同事,可遇不可求,向他学习还来不及呢。 真正让人反感的,是技术平平&…

系统移植 编译uboot和linux源码及驱动配置

写在前面:若是有些命令执行失败,前面添加sudo后再执行 目录 写在前面:若是有些命令执行失败,前面添加sudo后再执行 uboot源码获取和编译: Linux源码获取和编译 关于驱动配置 uboot源码获取和编译: 获…

资深测试总结,性能测试-业务量/吞吐量/存量数据设计关联(详细)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 业务量 是不带时…

矩阵(矩阵快速幂)

矩阵(矩阵快速幂) 矩阵在计算机数学中有比较重要的内容,它可以优化很多推论,在这里我们将简单介绍一下。 矩阵是什么 由 n m n\times m nm个数 a i j ( i 1 , 2 , … , n , j 1 , 2 , … , m ) a_{ij}(i1,2,\dots,n,j1,2,\d…

pdf可以转换为word文档吗?分享这两个方法给大家!

PDF 是一种常见的文件格式,用于可靠地显示和共享文档。然而,当需要编辑或重用 PDF 内容时,将其转换为可编辑的 Word 文档是一个常见的需求。在本文中,我们将介绍两种方法,以帮助您将 PDF 转换为 Word 文档,…