SlideShare una empresa de Scribd logo
1 de 19
Descargar para leer sin conexión
Flink 1.16 Preview:
Hive SQL 如何平迁到 Flink SQL
伍翀(云邪)/ Apache Flink PMC & Committer
2022-09-24
Apache Flink meetup 北京站
迁移的动机
01
CONTENT
目录 >>
02
迁移的挑战
03
如何迁移
04
Demo
01 迁移的动机
45
45
为什么 Flink 要做 Hive SQL 迁移?
离线用户
吸引离线数仓用户,打磨批引擎,螺旋迭代
离线业务开发门槛
降低用户使用Flink 开发离线业务的门槛
Hive 生态工具
生态是最高的壁垒,融入离线生态。
流批一体
推动业界,先统一引擎,后统一API。
45
45
Hive SQL 用户为何迁移到 Flink SQL 上?
统一流批引擎
降低维护成本,提升研发效率
OLAP & 联邦查询
基于Flink+HQL快速建设OLAP系统,
借助Flink丰富数据源,实现强大的联邦查询。
HiveSQL 实时化
降低离线作业实时化改造的成本
流批一体数仓
建设流批一体SQL层,
探索流批一体数仓。
02 迁移的挑战
迁移的挑战
兼容
稳定性
性能
HiveServer2 协议兼容
HiveSQL 语法兼容
预测执行 Adaptive Hash Join
Dynamic Partition
Pruning
元数据访问加速
Hive 语法兼容
Hive SQL Flink SQL
Hive Parser Flink Parser
Logical Plan
Physical Plan
Job Graph
Flink RelNode Flink RelNode
Optimization
Translation & CodeGen
Pluggable
Parser
Hive 语法兼容
FLIP-152 & FLINK-26360:Flink1.16 Hive 语法兼容度从 85% 提升至 94.1% (Hive qtest 12K 测试集)
SQLGateway 架构
• 支持多租户
• 兼容 HiveServer2 协议
• Endpoint 插件化
Standalone
Deployment
Runtime Batch & Stream Processor
Server SQL Gateway
Endpoint HiveServer2 REST …
Client
Beeline
Postman
API Flink SQL Hive SQL
SQL Gateway:HiveServer2 兼容
03 如何迁移
HiveSQL 迁移在快手的实践
IDP KwaiBI 双跑平台
Hive Server2 智能路由组件
源自:《Flink 流批一体在快手的进展和规划》—— 2022阿里巴巴开源开放周
04 Demo
Demo1: Hive SQL 如何迁移到 Flink SQL?
Clients
Deployment
Servers HiveServer2
Engines
Flink SQLGateway
Hadoop MapReduce Flink Jobs
Beeline
Hive SQL Flink SQL
Hive JDBC Hive JDBC
无缝迁移
Demo2:如何基于 Flink 快速搭建离线数仓?
DolphinScheduler
ODS
DWD
DWS
ADS
数据源 离线数仓 数据报表
Flink
Flink
Flink Flink
05 未来规划
提升 Batch 稳定性和性能,
追齐主流批计算引擎
数据湖分析,
高效Batch读写湖存储,
提供湖上数据查询/管理语法
(AS OF, UPDATE/DELETE, CALL)
Flink Batch 生态建设,
如 RSS、血缘管理等
02
01 03
未来规划
Thanks
Apache Flink meetup 北京站

Más contenido relacionado

Similar a HiveSQL如何平迁到FlinkSQL

董大偉,Silverlight實務應用範例講座
董大偉,Silverlight實務應用範例講座董大偉,Silverlight實務應用範例講座
董大偉,Silverlight實務應用範例講座Chui-Wen Chiu
 
(宇宏)Talend工具說明
(宇宏)Talend工具說明(宇宏)Talend工具說明
(宇宏)Talend工具說明Sonny Chen
 
ASP.NET MVC 4 新功能介紹(快速上手) -twMVC#4
ASP.NET MVC 4 新功能介紹(快速上手) -twMVC#4ASP.NET MVC 4 新功能介紹(快速上手) -twMVC#4
ASP.NET MVC 4 新功能介紹(快速上手) -twMVC#4twMVC
 
twMVC#04 | ASP.NET MVC 4 新功能介紹(快速上手)
twMVC#04 | ASP.NET MVC 4 新功能介紹(快速上手)twMVC#04 | ASP.NET MVC 4 新功能介紹(快速上手)
twMVC#04 | ASP.NET MVC 4 新功能介紹(快速上手)twMVC
 
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验guiyingshenxia
 
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验colderboy17
 
淘宝Java中间件之路
淘宝Java中间件之路淘宝Java中间件之路
淘宝Java中间件之路mysqlops
 
twMVC#21 | 以實例說明ASP.NET Web API 服務的開發與測試過程
twMVC#21 | 以實例說明ASP.NET Web API 服務的開發與測試過程twMVC#21 | 以實例說明ASP.NET Web API 服務的開發與測試過程
twMVC#21 | 以實例說明ASP.NET Web API 服務的開發與測試過程twMVC
 
200701011
200701011200701011
2007010115045033
 
資策會網工班第八十期Cisco競賽第三組簡報
資策會網工班第八十期Cisco競賽第三組簡報資策會網工班第八十期Cisco競賽第三組簡報
資策會網工班第八十期Cisco競賽第三組簡報d12hd12h
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲Herman Wu
 
Application express overview_cn_final -v2
Application express overview_cn_final -v2Application express overview_cn_final -v2
Application express overview_cn_final -v2TravelSky
 
百度自动化运维中的关系管理
百度自动化运维中的关系管理百度自动化运维中的关系管理
百度自动化运维中的关系管理mysqlops
 
未来网络技术发展探梦 - 开篇
未来网络技术发展探梦 - 开篇未来网络技术发展探梦 - 开篇
未来网络技术发展探梦 - 开篇Yao-Wei Ou
 
企业应用与互联网的融合
企业应用与互联网的融合企业应用与互联网的融合
企业应用与互联网的融合Jacky Chi
 
基于虚拟化平台创建企业私有云
基于虚拟化平台创建企业私有云基于虚拟化平台创建企业私有云
基于虚拟化平台创建企业私有云ITband
 
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境drewz lin
 
91APP: 從 "零" 開始的 DevOps
91APP: 從 "零" 開始的 DevOps91APP: 從 "零" 開始的 DevOps
91APP: 從 "零" 開始的 DevOpsAndrew Wu
 
China PHP Technology Summit 2011 ppt
China PHP Technology Summit 2011 pptChina PHP Technology Summit 2011 ppt
China PHP Technology Summit 2011 pptXinchen Hui
 

Similar a HiveSQL如何平迁到FlinkSQL (20)

董大偉,Silverlight實務應用範例講座
董大偉,Silverlight實務應用範例講座董大偉,Silverlight實務應用範例講座
董大偉,Silverlight實務應用範例講座
 
(宇宏)Talend工具說明
(宇宏)Talend工具說明(宇宏)Talend工具說明
(宇宏)Talend工具說明
 
ASP.NET MVC 4 新功能介紹(快速上手) -twMVC#4
ASP.NET MVC 4 新功能介紹(快速上手) -twMVC#4ASP.NET MVC 4 新功能介紹(快速上手) -twMVC#4
ASP.NET MVC 4 新功能介紹(快速上手) -twMVC#4
 
twMVC#04 | ASP.NET MVC 4 新功能介紹(快速上手)
twMVC#04 | ASP.NET MVC 4 新功能介紹(快速上手)twMVC#04 | ASP.NET MVC 4 新功能介紹(快速上手)
twMVC#04 | ASP.NET MVC 4 新功能介紹(快速上手)
 
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
 
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
 
淘宝Java中间件之路
淘宝Java中间件之路淘宝Java中间件之路
淘宝Java中间件之路
 
twMVC#21 | 以實例說明ASP.NET Web API 服務的開發與測試過程
twMVC#21 | 以實例說明ASP.NET Web API 服務的開發與測試過程twMVC#21 | 以實例說明ASP.NET Web API 服務的開發與測試過程
twMVC#21 | 以實例說明ASP.NET Web API 服務的開發與測試過程
 
200701011
200701011200701011
200701011
 
資策會網工班第八十期Cisco競賽第三組簡報
資策會網工班第八十期Cisco競賽第三組簡報資策會網工班第八十期Cisco競賽第三組簡報
資策會網工班第八十期Cisco競賽第三組簡報
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲
 
Application express overview_cn_final -v2
Application express overview_cn_final -v2Application express overview_cn_final -v2
Application express overview_cn_final -v2
 
百度自动化运维中的关系管理
百度自动化运维中的关系管理百度自动化运维中的关系管理
百度自动化运维中的关系管理
 
AI/ML O-RAN Cloud-Native Automation
AI/ML O-RAN Cloud-Native AutomationAI/ML O-RAN Cloud-Native Automation
AI/ML O-RAN Cloud-Native Automation
 
未来网络技术发展探梦 - 开篇
未来网络技术发展探梦 - 开篇未来网络技术发展探梦 - 开篇
未来网络技术发展探梦 - 开篇
 
企业应用与互联网的融合
企业应用与互联网的融合企业应用与互联网的融合
企业应用与互联网的融合
 
基于虚拟化平台创建企业私有云
基于虚拟化平台创建企业私有云基于虚拟化平台创建企业私有云
基于虚拟化平台创建企业私有云
 
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
 
91APP: 從 "零" 開始的 DevOps
91APP: 從 "零" 開始的 DevOps91APP: 從 "零" 開始的 DevOps
91APP: 從 "零" 開始的 DevOps
 
China PHP Technology Summit 2011 ppt
China PHP Technology Summit 2011 pptChina PHP Technology Summit 2011 ppt
China PHP Technology Summit 2011 ppt
 

HiveSQL如何平迁到FlinkSQL