本项目涉及实时数据仓库搭建相关,是实习期间和几位大神朋友一起协作完成的课题,在此感谢几位大佬@鑫锋@葛老师@丁哥的帮助
一图胜千言,如图是所使用的大数据组件,离线数仓的搭建涉及Kafka、Flume、Sqoop、Hive,实时路线包含Kafka、SparkStreaming、Kudu,最终的展示由Impala查询Hive和Kudu上相关数据,作OLAP分析,分析结果由Tableau展示
离线数据采集
数据仓库数据分层和维度建模的设计
实时消息处理
Downloads, Dependent Repos, Dependent Packages, Total Releases, Latest Releases data powered by Libraries.io.
Copyright 2018-2023 Awesome Open Source. All rights reserved.