Flink通过实现两阶段提交和状态保存来实现端到端的一致性语义。
分为以下几个步骤:
开始事务( beginTransaction ) 创建一个临时文件夹,来写把数据写入到这个文件夹里面
预提交( preCommit ) 将内存中缓存的数据写入文件并关闭
正式提交( commit ) 将之前写完的临时文件放入目标目录下。
这代表着最终的 数据会有一些延迟
丢弃( abort ) 丢弃临时文件 若失败发生在预提交成功后, 正式提交前。 可以根据状态来提交预提交的数据, 也可删除预提交的数据。
千锋教育-做有情怀、有良心、有品质的职业教育机构
Flink通过实现两阶段提交和状态保存来实现端到端的一致性语义。
分为以下几个步骤:
开始事务( beginTransaction ) 创建一个临时文件夹,来写把数据写入到这个文件夹里面
预提交( preCommit ) 将内存中缓存的数据写入文件并关闭
正式提交( commit ) 将之前写完的临时文件放入目标目录下。
这代表着最终的 数据会有一些延迟
丢弃( abort ) 丢弃临时文件 若失败发生在预提交成功后, 正式提交前。 可以根据状态来提交预提交的数据, 也可删除预提交的数据。
上一篇
CEP复杂事件处理下一篇
Hive 排序(重点)
hive外部表是使用external关键字并指定一个hdfs目录创建的表。hive内部表在创建时会在对应hive目录下创建相应的文件夹,外部表则以指定文件夹为...详情>>
2022-09-02 17:21:00
Checkpoint是为runtime准备的,Savepoint 是为用户准备的。Checkpoint 机制的目标在于保证Flink作业意外崩溃重启不影响exactly once 准确性,通...详情>>
2022-09-02 16:59:22
State:指一个具体的Task/Operator的状态。State可以被记录,在失败的情况下数据还可以恢复,Flink中有两种基本类型的State: Keyed State, Op...详情>>
2022-09-02 16:59:19
Flink 内部是基于producer-consumer模型来进行消息传递的,Flink的反压设计也是基于这个模型。Flink 使用了高效有界的分布式阻塞队列,就像 Jav...详情>>
2022-09-02 16:59:16
虽说水位线(Watermark)表明早于它的事件不应该再出现,但是接收到水位线以前的的消息是不可避免的,这就是所谓的迟到事件。实际上迟到事件是乱...详情>>
2022-09-02 16:59:00