淘先锋技术网

首页 1 2 3 4 5 6 7

你了解过flink吗

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。此外,Flink的运行时本身也支持迭代算法的执行。

既然大家简单了解了flink是什么之后,今天就给大家分享一波4位资深专家多年大厂经验总结分享出的Flink技术内幕架构设计与实现原理技术文档,希望大家能够喜欢!!

Flink技术内幕架构设计与实现原理为何物?

这是一部从源代码角度出发,通过分析Flink的各个功能模块的实现来剖析Flink的架构设计和实现原理的著作。

它将能指导读者更好地对Flink进行性能调优、可用性保障、效能优化和二次开发。

四位作者都是非常资深的Flink专家,部分作者是Flink源代码的维护者和改造者,本文总结了他们在阿里巴巴、蚂蚁集团、滴滴等企业的大规模Flink实践经验。

限于文章篇幅原因,只能以截图的形式展示出来,有需要的小伙伴可以文末获取↓↓↓

内容概览

全文共11章,主要内容如下:

第1章 阅读Flink源代码前的准备,主要介绍了Flink源代码的获取、编译、调试,以及它的目录结构、设计理念和基本架构。此外,还分析了Flink与Hadoop MapReduce、Spark在设计上的差异。

第2~8章 Flink功能模块源代码和架构解析,从源代码角度分析了Flink的编程模型与API、运行时组件与通信、状态管理与容错、任务提交与执行、Flink网络栈、Flink Connector、部署模式等功能模块的原理。力求让读者深入理解Flink的原理,而不只是跟着本书读一遍Flink源代码。原理和思想是不局限于某一个框架和技术的,了解了Flink的原理和思想,可以将其扩展到其他框架和技术上。

第9~10章 Flink Table、SQL与Flink CEP,编程方式逐渐从原先基于Map-Reduce的任务模式向SQL化演进,SQL意味着标准和效率。这两章重点讲解了StreamTableEnvironment的实现过程、SQL的解析过程、Table Connector以及Flink CEP的内部实现原理。

第11章 Flink监控, 主要讲解了Flink的监控指标、常用系统指标和监控体系的建设,以及常用的定位手段。

作者简介

限于文章篇幅原因,就展示到这里了,有需要的小伙伴可以查看下方名片↓↓↓