flink

Flink技术栈及应用

Flink技术栈及其适用场景.pdf详细描述了Flink的技术栈及其在不同场景中的应用。这对于使用Flink的开发者深入了解其技术特性和应用场景非常有帮助。

flink 2 2024-07-12

Flink在滴滴出行的应用与实践

Flink China Meetup社区线下Meetup·北京站PPT资料分享。余海琳介绍了Flink在滴滴出行中的应用与实践经验。

flink 2 2024-07-12

BeamOR IoT 协议实现

该项目包含 BeamOR IoT 协议的实现代码。

flink 2 2024-07-01

基于 Flink SQL 的 Mongo 到 Hive 数据同步方案

一种利用 Flink SQL 实现 MongoDB 数据同步至 Hive 的方案。该方案利用 Flink 强大的流处理能力和 SQL 的易用性，能够高效、可靠地进行数据迁移。方案优势: 高效性: Flink 的分布式架构和流处理引擎能够处理高吞吐量的数据。易用性: Flink SQL 提供了简洁易懂的语法，降低了数据同步的开发门槛。可靠性: Flink 提供了 Exactly-Once 语义保证，确保数据不丢失不重复。可扩展性: Flink 和 Hive 都具有良好的可扩展性，可以应对不断增长的数据量。方案流程: 数据源配置: 配置 MongoDB 数据源信息，包括连接地址、数据库、集合等。数据目标配置: 配置 Hive 数据目标信息，包括 Hive metastore 地址、数据库、表等。数据转换: 使用 Flink SQL 对 MongoDB 数据进行必要的转换，例如字段映射、类型转换等。数据写入: 将转换后的数据写入 Hive 表中。方案实现: 方案实现可以使用 Flink 提供的 Java API 或 SQL API。其中，SQL API 更加简洁易用，推荐使用。示例代码: -- 创建 MongoDB 数据源 CREATE TABLE source ( id STRING, name STRING, age INT ) WITH ( 'connector' = 'mongodb', 'hostname' = 'localhost', 'port' = '27017', 'database' = 'test', 'collection' = 'users' ); -- 创建 Hive 数据目标 CREATE TABLE sink ( id STRING, name STRING, age INT ) WITH ( 'connector' = 'hive', 'hive.metastore.uris' = 'thrift://localhost:9083', 'database' = 'test', 'table' = 'users' ); -- 数据同步 INSERT INTO sink SELECT * FROM source; 基于 Flink SQL 的 Mongo 到 Hive 数据同步方案具有高效、易用、可靠等优势，能够满足企业级数据同步的需求。

flink 3 2024-07-01

Apache Flink 1.17.1 (Scala 2.12) 二进制发行版

flink-1.17.1-bin-scala_2.12.tgz 是 Apache Flink 1.17.1 版本的二进制发行版，专为 Scala 2.12 用户构建。Apache Flink 是一个开源的流处理框架，用于大规模数据处理和分析。该版本带来了最新的功能和错误修复，增强了性能和稳定性，解压后即可使用。

flink 2 2024-07-01

Apache Flink 架构解析

深入探讨 Apache Flink 的核心架构，并剖析其关键特性，帮助读者全面理解 Flink 的运行机制和优势。 1. 分层架构 Flink 采用分层架构设计，自下而上依次为：部署层: 支持多种部署模式，包括本地、集群、云端等，以适应不同的应用场景。核心层: 包含 Flink 的核心组件，如 JobManager、TaskManager、ResourceManager 等，负责作业的调度、执行和资源管理。 API 层: 提供不同级别的 API，包括 ProcessFunction API、DataStream API 和 SQL API，满足不同用户的编程需求。库层: 提供丰富的扩展库，例如 CEP（复杂事件处理）、Machine Learning（机器学习）等，扩展 Flink 的应用范围。 2. 关键特性高吞吐、低延迟: Flink 采用流式数据处理引擎，能够处理高吞吐量的实时数据流，并保证低延迟。容错机制: Flink 内置强大的容错机制，支持 Exactly-Once 语义，保证数据处理的准确性。状态管理: Flink 提供多种状态管理方案，例如内存状态、RocksDB 状态等，支持大规模状态存储和访问。时间语义: Flink 支持多种时间语义，包括 Event Time、Processing Time 和 Ingestion Time，方便用户处理不同类型的数据流。 3. 应用场景 Flink 广泛应用于实时数据分析、事件驱动应用、数据管道构建等领域。

flink 3 2024-07-01

Apache Flink 技术概览

Apache Flink 是一个用于处理数据流的开源框架。它由 Data Artisans 公司开发，该公司以其在分布式数据处理领域的专业知识而闻名。这本小册子浓缩了 Flink 的精华，为想要快速了解 Flink 核心概念和架构的读者提供了一个优秀的资源。

flink 3 2024-06-30

Data1 Final Annotations

This document likely contains annotations for the 'data1_final' dataset. Specific details about the annotations or the dataset itself are not provided in the filename.

flink 1 2024-06-30

Flink on YARN 环境下 NoClassDefFoundError: com/sun/jersey 异常解决

在 Flink on YARN 环境中，如果遇到 java.lang.NoClassDefFoundError: com/sun/jersey/api/client/config/ClientConfig 异常，通常是由于缺少以下依赖库导致的： flink-hadoop-compatibility_2.12-1.7.1.jar javax.ws.rs-api-2.0.1.jar jersey-common-2.27.jar jersey-core-1.19.4.jar 添加以上依赖到 Flink 的 classpath 中即可解决该问题。

flink 2 2024-06-30

快手万亿级实时OLAP平台架构与应用

详细阐述了快手如何构建和实践万亿级实时OLAP平台，内容涵盖平台架构设计、关键技术实现、性能优化以及实际应用案例分析。

flink 3 2024-06-30