使用tableau做数据分析,数据源除了正式的数据库,往往更多的直接调用从各种平台download下来的Excel文件,或者是同事之间相互传递的表格,那表格经过一系列加工以后,就可以上传到tableau服务器,作为正式的数据来源,以便供给到更多的业务小伙伴来做进一步分析了。
那么问题来了——Excel数据经常是一段时间一个版本的,比如去年的#棉花#产量报表,今年的#棉花#报表,各种季度月底表等,我们如何能够保证这些数据及时更新或追加呢?下面分享一点我的小建议——
最佳方案:
前提条件:你们的网络环境允许服务器在局域网内连接你本地PC数据库
1、写好Python脚本,提取数据,入库;
2、tableau链接自己的数据库,提取数据,发布,在tableau服务端做一个定时刷新计划;
3、本地用任务计划定时激活Python脚本,比tableau刷新时间早一点就好;
第二方案:
没有具体实施过,思路如下:
1、tableau连接Excel数据,导出为.hyper文件
2、写脚本通过命令行,触发.hyper文件刷新,详见文档
3、整个帮助文档的操作流程较为复杂(我当时测试也未能通过)
帮助文档路径如下(平台不让挂链接,熟悉官方网站的朋友可以直接顺腾摸瓜找到)
第三方案:新版tableau prep任务流
使用较新版本(2020.3以上)的tableau服务器,利用prep客户端链接并处理数据源后,发布到服务器,据说,新版本是可以保持自动更新的。当然这里有一个前提条件,你的tableau服务器,在网络环境层面,是被允许链接到你本地的PC数据文件的。
注:这个方案我也没使用过,因为公司服务器环境不让轻易调整,所以我们的tableau服务端一直停留在2019.2没能升级。
第四方案:暂时没想到有,路过大神可以帮忙支点招~~~