本帖最后由 willning 于 2022-11-22 19:24 编辑
通常情况下,我们可以像操作业务数据一样,将被集成的系统的数据表(如ERP中存货档案等主数据)以“外联表”的形式加入到活字格工程,让活字格可以直连ERP的数据库。但在中大型项目中,这种做法可能会遭遇以下问题:
- 跨网络读取ERP数据库,响应差
- 频繁读取被集成系统的数据库,ERP变慢
- 不能建立跨库的视图或表关联,开发麻烦
如果您使用的是内置库开发,推荐采用“外联表副本”功能,定时将ERP数据同步到本地的SQLite库,帮助文档如下:
帮助文档:创建外联表副本
不过,和其他内置库的表一样,外联表副本无法创建索引、性能较慢而且不支持负载均衡集群部署。是否有办法将ERP数据定时同步到外联的业务数据库?
这时我们可以拿出阿里DataWorks的开源版,DataX(官方文档),轻松搞定跨数据源的定时同步。首先,datax是一个使用python开发的数据同步工具,可以运行在Windows上和Linux上。作为一个拿到12k+ star的明星项目,资源相当丰富,网上有很多教程和示例,大家可以随时搜索。
下面我准备了两个示例,向大家演示一下使用datax做全量同步和增强同步。准备好了吗?走起!
安装
Windows
- 从官方下载并安装Python3的最新版,勾选“将python添加到Path”
- 从官方下载并安装java 1.8版本(jre8),将 C:\Program Files\Java\jre1.8.0_351\bin; 加入到系统的Path中
- 从官方下载最新版datax(2210版),解压缩到硬盘如 E:\TOOLS\datax
- 将附件中的 hello.json 文件下载并保存到 E:\TOOLS\datax\job 下
hello.json
(717 Bytes, 下载次数: 251)
|
|