flink-china / flink-forward-asia-hackathon-2021

本 GitHub 项目是 Flink Forward Asia Hackathon (2021) 的投票专用项目。
121 stars 19 forks source link

[参赛项目] filling - 可托拉拽图形化大数据处理工具, 支持流批一体的大数据中台方案 #10

Open zihjiang opened 2 years ago

zihjiang commented 2 years ago

项目简述

Filling, 如其名, 致力于填充你的各种存储, 是一个非常易用,高性能、支持实时流式和离线批处理的海量数据处理产品,架构于 Apache Flink之上。 为什么我们需要 Filling 我们在使用 Flink 时发现了很多不便捷之处, 通过我们的努力让Filling的使用更简单,更高效,并将业界和我们使用Flink的优质经验固化到Filling中,明显减少学习成本,加快分布式数据处理能力在生产环境落地。 除了大大简化分布式数据处理难度外,Filling尽所能为您解决可能遇到的问题:

背景

大数据发展的今天, 随着着Kappa架构越来越热, 早期的sqoop已经满足不了现在的架构, 我们在使用 Flink 时发现了很多不便捷之处, 通过我们的努力让Filling的使用更简单,更高效,并将业界和我们使用Flink的优质经验固化到Filling中,明显减少学习成本,加快分布式数据处理能力在生产环境落地。

目标

Filling,即基于Flink的流式数据处理工具,预期将拥有如下特性:

实施方案

​ 该应用是一个可视化拖拽的在线WEB编排服务,以低代码模式完成数据采集、数据计算、数据处理分析。

​ 应用服务将流式计算中涉及到的几大场景进行综合抽象,完成整体编排流程中的3大类算子,数据源,数据输出、数据处理,通过统一的编排方式来适应于各类数据处理场景;以及未来AI分析。

​ 例如:在数据混合采集场景中,通过Flink数据源算子进行各数据抽取,通过数据处理算子完成各种Join处理,完成采集的跨平台、跨数据源的采集。

长远规划

以流处理作为接入点, 以pravega为中心搭建DataHub, 提供流式数据的发布和订阅的功能,为Kappa和实时场景做基座, 打造流批一体的数据中台

成员介绍

阿里云天池昵称:蒋子函、sailyyang