开源大数据生态下的 Flink 应用实践

  • 时间:
  • 浏览:2
  • 来源:5分3D官方_极速5分排列5

Fabian Hueske

Apache Flink PMC,Ververica Co-founder,

Software Engineer

说明:不想须对 Apache Flink 有先验知识。

课程才能满足不同学习需求,无论是入门还是进阶,开发者可根据自身基础选折 课程内容,实现技术与应用能力上的积累与提升。

在过去的几年中,亲戚亲戚我就们 与这种 Flink 用户相互相互合作沟通期间了解到这种将流计算作业从早期 PoC 阶段慢慢过渡到生产过程中最常见的挑战。在此次培训中,亲戚亲戚我就们 将集中精力介绍那先 挑战,时候帮助亲戚亲戚我就们 一并消除它。亲戚亲戚我就们 将提供有一个有用的故障诊断工具集,并介绍类似监控、水印、序列化、请况后端等领域的最佳实践和技巧。在实践课程的间隙中,参与者将有可能性使用新学习到的知识来外理这种异常 Flink 作业表现出来的问题报告 报告 。一并,亲戚亲戚我就们 也将归纳那先 使作业没有 进展或吞吐量没有 达到预期,或作业延迟的常见意味。

YuniKorn 是有一个开源的,轻量级,通用的资源调度器,都都可以 很容易的适配到 K8s。相比原生的 K8s 调度器,YuniKorn 提供了更加丰富的调度特性,比如层级队列、资源公平性保证、强占以及更好的性能,更加适合大规模多租户、长运行以及批外理作业并存的场景下使用。YuniKorn 的调度会考量应用,用户以及队列等各个维度的资源使用请况,提供基于公平性原则的弹性容量配置。在这种议题中,亲戚亲戚我就们 将主要从怎样通过 YuniKorn 来优化 Flink 在 K8s 上的运行,包括性能、多租户、资源公平性等方面的与亲戚亲戚我就们 进行探讨。

(11 月 29 日上午,专场议程)

亲戚亲戚我就们 相信 Apache Flink 不应该仅仅运行在云端,而应该运行在任何必须设备上。本次演讲,亲戚亲戚我就们 将分享百度智能云在边缘设备上运行流式作业的这种探索,介绍怎样将作业的内存消耗降低到 10M 以内,以及怎样实现作业对运行环境的零依赖。会上将重点介绍百度基于 Flink 自研的边缘流式计算框架 Creek,重点内容包括:

Apache Flink 支持 SQL 作为流外理和批外理的统一 API。SQL 都都可以 用于各种各样的场景,时候相比使用 Flink 的底层 API,SQL 将更容易构建和维护。在本次培训中,您将学习到怎样充挂接挥使用 SQL 来编写 Apache Flink 作业的潜力。亲戚亲戚我就们 将研究流式 SQL 的不同案例,包括连接流数据、维表关联、窗口聚合、维护物化视图,以及使用 MATCH RECOGNIZE 子句进行模式匹配(这是 SQL 2016 新提出的标准)。

(11 月 28 日下午,专场议程)

说明:不想须 Apache Flink 的相关知识。

除上述议题外,开源大数据生态专场还有来自戴尔科技集团、英特尔、Stream Native 等重量级嘉宾以及 Apache Member、Apache Flink PMC、Apache Calcite Committer 等带来的更加精彩的分享。完整版议程如下:

王金海,趣头条数据平台负责人

说明:不想须 Apache Flink 的先验知识,时候必须基本的 SQL 知识。

Every ASF project is independently governed and managed by its own community but follows the principles of the ASF, the so-called Apache Way. Knowing the Apache Way is important to fully understand how the community of an ASF project works.

李锐,Apache Hive PMC,Apache Flink Contributor,阿里巴巴技术专家

王刚,阿里巴巴高级开发工程师

▼ 关注 Ververica,Flink 爱你 ▼

培训系列课程为精品小班教学,数量有限,预约满额将关闭入口,有相关培训需求的同学可尽早预约。完整版说明:

Apache Flink PMC 带队,超豪华阵容,阿里巴巴及 Flink 创始团队资深技术专家担任培训讲师,为开发者培训课程制定全面学习体系。

Apache Flink is a project of the Apache Software Foundation (ASF). The ASF is the world's largest open source foundation and the home of more than 3150 individual projects and initiatives.

点击「大会详情」可了解更多培训课程与 Flink Forward Asia 2019 大会议程~

课程主要大纲如下:

Tips:本课程为纯英文授课,一并配有2位中文技术专家支持解答问题报告 报告 。

过去十年,面向整个数字时代的关键技术接踵而至,从被亲戚亲戚我就们 接受,到开始英语 英语 步入应用。大数据与计算作为时代的关键词已被广泛认知,算力的重要性日渐凸显并发展成为企业新的增长点。Apache Flink(以下简称 Flink)以其快速、准确的算力备受关注,怎样将 Flink 更好的与大数据生态技术相结合,充分挖掘数据的潜力,真正发挥数据的价值,是大多数企业面临的问题报告 报告 。

可能性你也好奇 Flink 未来的主要探索方向,怎样利用 Flink 将大数据、算力推到极致,Flink 有那先 新场景、新规划以及最佳实践等话题,来现场吧!相信这群来自一线的技术专家们,总要刷新你对 Apache Flink 的认知。

在大数据领域,Hive 可能性成为数据仓库事实上的标准。为了丰富 Flink 的生态,从 1.9.0 版本开始英语 英语 ,亲戚亲戚我就们 提供了 Flink 与 Hive 集成的能力,让用户都都可以 通过 Flink 来读写 Hive 中的表。在 1.9.0 发布时候,亲戚亲戚我就们 进一步完善了 Flink-Hive 集成的功能,包括支持更全面的数据类型、更好地支持 DDL 以及 Function 等。

杨巍威,Cloudera资深软件工程师

杨弢,阿里巴巴技术专家

11 月 11-14 日,Flink Forward Asia 培训课程门票买一赠一,限时 3 天!点击阅读原文预约培训课程,时候加微信(ID:candy1764)提供一并参加培训的小伙伴名单,活动时间截止 11 月 14 日中午 12:00,数量有限,赠完即止,对培训心动的同学赶紧下手啦!

本课程是对想要学习构建流程序运行的 Java 和 Scala 开发人员进行的关于 Apache Flink 的实践介绍。培训将重点介绍分布式数据流、事件时间和请况等核心概念。练习将使您有可能性了解以上概念在 API 中是怎样被体现的,并了解怎样将那先 概念组合用以外理实际问题报告 报告 。

11 月 28-150 日,Flink Forward Asia 邀请来自阿里巴巴、戴尔科技集团、英特尔、Cloudera、趣头条、百度、Stream Native 等不同方向的技术专家围绕 Apache Flink 核心大数据生态探讨当下大数据的发展趋势与未来动向,并展现相关技术在一线生产场景的优秀实践。

In this talk, I'll briefly explain the Apache Way and how ASF projects organize themselves. I'll take a look back at how the Apache Flink community started and its journey to where it is today.

袁尤军,百度云资深研发工程师

黄家天,百度云物联网部实时计算高级研发工程师

将 Flink 运行在 K8s 很简单,时候当亲戚亲戚我就们 尝试在 K8s 集群上运行大规模 Flink 的任务,并对多租户环境和 SLA 有严苛要求时,各种问题报告 报告 开始英语 英语 显现出来。尤其是在调度层面,亲戚亲戚我就们 发现 Flink 的作业调度减慢,时候资源的分配变得混乱且毫无公平性,时候往往会意味作业饿死,可能性资源浪费。于是亲戚亲戚我就们 开始英语 英语 寻求利用 YuniKorn 来外理在 K8s 上的调度问题报告 报告 。

Finally, I'll give you some guidance and advice that will help you to start contributing to Apache Flink and maybe become a committer at some point in the future.

本课程是针对 Apache Flink 程序运行的部署和操作相关的实践性介绍。目标受众包括负责部署 Flink 程序运行和维护 Flink 集群的开发人员和运维人员。演示将重点介绍 Flink 运行中涉及的核心概念,以及用于部署、升级和监控 Flink 程序运行的主要工具。

点击可了解大会详情,购买参会门票

随着 5G 和 IoT 技术的发展,计算将从现在的云端蔓延到更多这种的地方,其中有一个典型的场景就说 边缘计算。与云端强大的计算集群相比,那先 场景设备的计算能力非常受限。Apache Flink 作为新一代流式计算引擎,可能性广泛应用在诸多顶级互联网公司的云上。但怎样在资源极度受限的边缘设备上运行流式计算引擎,尚无成功案例可循。

趣头条老会 致力于使用大数据分析指导业务发展。目前在实时化领域主要使用 Flink+ClickHouse 外理方案,覆盖场景包括实时数据报表、Adhoc 即时查询、事件分析、漏斗分析、留存分析等精细化运营策略,整体响应 150% 在 1 秒内完成,大大提升了用户实时取数体验,推动业务减慢迭代发展。本次分享主要内容:

在新版本中,亲戚亲戚我就们 都都可以 支持更多的应用场景,并提供更好的易用性。本次演讲将介绍 Flink-Hive 集成的设计架构、项目进展以及后续版本中的新功能。最后,亲戚亲戚我就们 还将演示怎样使用 Flink 与 Hive 进行交互。