Big Data Vertica Jin Dan pptx
©
权所有 2014 Hewlett-Packard Development Company,L.P. 本文所含信息如有更改,恕不另行通知。
风驰电掣 — HP Vertica
实现极限速度大数据掘金
金丹
资深架构师
中国惠普
软件业务部大数据平台
惠普机密信息。©
权所有 2014 Hewlett-Packard Development Company,L.P. 本文所含信息如有更改,恕不另行通知。
们进入了大数据的时代
人类
数据
数据量
大数据
机器
数据
技术差距
移动应用
系统日志
数据中心
合规性内容存档
物联网
传感器
社交网络
照 分享
可穿戴 备
业务
数据
数据
时间
功能全面的大数据核心
Haven 大数据平台
核心大数据引
文
搜索
问
数据
探索
内部部署
图像/视频
分析
探索
丰富
快速
分析
分析
地理空间
分析
预测
服务
情绪
分析
处理
基于 Hadoop
的 SQL
等等...
预测性
分析
端部署
市场领先的MPP数据
厂商
Vertica是一个融合大数据和传统数据分析的系
统,能够同时满足企业在数据仓 和高级分析
两方面的需求
“
度”是Vertica的关键词,所 用户都对Vertica
在查询方面的快
响
到满意甚至惊喜
感
客户认为Vertica在节省人力
方面
着非常快
的回
——Gartner 2015
本以及投资收益
满足业务需求的实时分析
•
50x – 1000x 性能提升
•
TBs ~PBs高
•
与
ETL和BI解决方案
轻松整合
扩展性
•
在工业标准x86服务器上具
超 性能
•
快
灵活部署
标准SQL接口
大数据分析
模型
内嵌高可用
无共享MPP
纯列式存储
自动优化设计
高级主动压
缩
服务于各行业的
电信
社交媒体
帮助社交媒体网站实
查询,提供
高 信息
11.5亿
客户访问的行为分析,精准广告投
和广告效率分析
医疗
帮助医疗保险机构进行数据分
析,提供给每个患者病理的深入
分析和医疗解决方案,每 处理
100亿
条记录,跟踪每个患者的医疗数
据,建立患者疗效数据 ,并提
供 学的病理预测与分析,为医
务人员提供治疗建议参考
7
功经验
提供用户行为 网络质量与性能
的深度组合分析,5 节省6338
万美金,投资回 率
657%
4个 收回投资 本,而整体性
能提升97%,提升数据仓 团队
工作效率20%
制
帮助电视媒体实 软性广
告的计量和计费,实
2500
商标/
的视频分析能力
航空
帮助飞机制 商在以亿计事件中,精
准定 故障并快 恢复,全 故障时
间减少
90%
业务
银行
电视媒体
用性大幅提升
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
帮助航空公司改进分析能力,提
高客服质量,
No.1
对飞行数据进行分析,包括客
户忠诚度 保留率
作及维
帮助银行实 信用卡申请交易
管理和风险分析,分析 度提
高
80倍
解决信用卡实时评分问题
府
实 交通
时分析
境
社交媒体的实
2000+
摄像头的实时监
风险事件
,快 定
高
电信行业
全球最大电信
营商之一
核心决策支持
•
•
•
•
•
•
2013
2.8亿
高
•
宽带用户
3.2PB
8
1280亿
营业收入
1.8亿 4G LTE用户
核心决策支持
提供用户行为 网络质量与性能的深度组
合分析
3.2PB裸数据,6倍压缩比
比TD压缩提升140%
5 节省6338万美金
投资回 率657%
4个 收回投资 本
66节点的HP Vertica
只是原 TD扩容 本的2%
而整体性能提升97%
由于Vertica的简单与易用性,提升数据仓 团
队工作效率20%
裸数据容量
© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
医疗健康行业
全球大型医疗服务提供商
健康数据分析
10000家
支持全球医疗机构
45000个
3000个
医生
医院
100亿
9
• 每 处理超过100亿条医疗数据
• 跟踪每个患者的医疗数据,建立患者疗效数据
,并提供 学的病理预测与分析
• 分析 率提升60倍 从20分钟到20
• 提供给每个患者病理的深入分析和医疗解决方
案,通过预测分析为医务人员提供治疗建议参
考,提高服务质量和诊断的准确性
• 追踪及了解医务人员使用系统的实际情况,并就
提升使用效率与医疗流程提出相 建议
• 系统规模 20节点,500+TB数据量,450个实时
并发用户
60倍
条记录/天
分析性能提升
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
金融行业
美国最大银行之一
信用卡风险分析
• 数百个分析师同时使用,峰值并发查询 千个, 级
响
• 15分钟就能完 原来需要2-3天才能完 的分析任务
• 仅系统维 费用,每 就节省数百万美元
• 88节点 x86 Vertica集群,1.5PB原始数据
• 均压缩率 6倍,节省了1PB的裸存储
• 批量加载 度9TB/小时
分析海量数据
5
/1.5PB
1000个
200倍
分析师
性能提升
9TB/小时
加载
10
200万美金
度
每
节省
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
联网行业
全球大型社交媒体公司
企业级数据仓
•
•
•
•
•
提供超过300节点的分析集群
支持10-50PB深度数据的分析
均35TB/小时的数据入
度
每天65万个Job
实 精确的营收分析,用户行为分析和广告效率
分析
度活跃用户人数 11.5亿
25亿
内容分享
照片
35TB/小时
27亿
“赞”
11
3亿
新增数据
© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
国内客户
某
贷款风险与营销分析
联网金融
•
小微贷款风险与营销分析
•
电信数据
•
实时的用户画像与营销信息
•
良好的
扩展性和快
•
基于
本的x86
•
极
•
•
12
金融数据与
性能
性
扩展
一期50TB,10节点
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
联网数据的融合分析
送
分析能力
国内客户
某电信
营商
数据自助服务与营销大数据分析
支持分析人员
10000个业务用户需要实时使用数据分析
•
由业务用户自己通过自助分析工具进行数据统计分析
•
用户通过数据
•
各种营销模式和促销手段的大数据分析
•
客户属性数据的关联分析,包括客户画像查询
户群刷新 标签分析的数据刷新
•
数据量360TB
10000个
3000万
360TB
数据规模
13
•
客户画像
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
开发工具编写脚本完
临时数据提取
标签客
HP Vertica – 极
大数据分析
大量PB级别的客户
超快的分析
度
无共享MPP纯列式存储
轻松配置与管理
全球合作伙伴生态系统
开
性的架构
实时处理您的信息
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
谢谢
©
权所有 2014 Hewlett-Packard Development Company,L.P. 本文所含信息如有更改,恕不另行通知。
权所有 2014 Hewlett-Packard Development Company,L.P. 本文所含信息如有更改,恕不另行通知。
风驰电掣 — HP Vertica
实现极限速度大数据掘金
金丹
资深架构师
中国惠普
软件业务部大数据平台
惠普机密信息。©
权所有 2014 Hewlett-Packard Development Company,L.P. 本文所含信息如有更改,恕不另行通知。
们进入了大数据的时代
人类
数据
数据量
大数据
机器
数据
技术差距
移动应用
系统日志
数据中心
合规性内容存档
物联网
传感器
社交网络
照 分享
可穿戴 备
业务
数据
数据
时间
功能全面的大数据核心
Haven 大数据平台
核心大数据引
文
搜索
问
数据
探索
内部部署
图像/视频
分析
探索
丰富
快速
分析
分析
地理空间
分析
预测
服务
情绪
分析
处理
基于 Hadoop
的 SQL
等等...
预测性
分析
端部署
市场领先的MPP数据
厂商
Vertica是一个融合大数据和传统数据分析的系
统,能够同时满足企业在数据仓 和高级分析
两方面的需求
“
度”是Vertica的关键词,所 用户都对Vertica
在查询方面的快
响
到满意甚至惊喜
感
客户认为Vertica在节省人力
方面
着非常快
的回
——Gartner 2015
本以及投资收益
满足业务需求的实时分析
•
50x – 1000x 性能提升
•
TBs ~PBs高
•
与
ETL和BI解决方案
轻松整合
扩展性
•
在工业标准x86服务器上具
超 性能
•
快
灵活部署
标准SQL接口
大数据分析
模型
内嵌高可用
无共享MPP
纯列式存储
自动优化设计
高级主动压
缩
服务于各行业的
电信
社交媒体
帮助社交媒体网站实
查询,提供
高 信息
11.5亿
客户访问的行为分析,精准广告投
和广告效率分析
医疗
帮助医疗保险机构进行数据分
析,提供给每个患者病理的深入
分析和医疗解决方案,每 处理
100亿
条记录,跟踪每个患者的医疗数
据,建立患者疗效数据 ,并提
供 学的病理预测与分析,为医
务人员提供治疗建议参考
7
功经验
提供用户行为 网络质量与性能
的深度组合分析,5 节省6338
万美金,投资回 率
657%
4个 收回投资 本,而整体性
能提升97%,提升数据仓 团队
工作效率20%
制
帮助电视媒体实 软性广
告的计量和计费,实
2500
商标/
的视频分析能力
航空
帮助飞机制 商在以亿计事件中,精
准定 故障并快 恢复,全 故障时
间减少
90%
业务
银行
电视媒体
用性大幅提升
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
帮助航空公司改进分析能力,提
高客服质量,
No.1
对飞行数据进行分析,包括客
户忠诚度 保留率
作及维
帮助银行实 信用卡申请交易
管理和风险分析,分析 度提
高
80倍
解决信用卡实时评分问题
府
实 交通
时分析
境
社交媒体的实
2000+
摄像头的实时监
风险事件
,快 定
高
电信行业
全球最大电信
营商之一
核心决策支持
•
•
•
•
•
•
2013
2.8亿
高
•
宽带用户
3.2PB
8
1280亿
营业收入
1.8亿 4G LTE用户
核心决策支持
提供用户行为 网络质量与性能的深度组
合分析
3.2PB裸数据,6倍压缩比
比TD压缩提升140%
5 节省6338万美金
投资回 率657%
4个 收回投资 本
66节点的HP Vertica
只是原 TD扩容 本的2%
而整体性能提升97%
由于Vertica的简单与易用性,提升数据仓 团
队工作效率20%
裸数据容量
© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
医疗健康行业
全球大型医疗服务提供商
健康数据分析
10000家
支持全球医疗机构
45000个
3000个
医生
医院
100亿
9
• 每 处理超过100亿条医疗数据
• 跟踪每个患者的医疗数据,建立患者疗效数据
,并提供 学的病理预测与分析
• 分析 率提升60倍 从20分钟到20
• 提供给每个患者病理的深入分析和医疗解决方
案,通过预测分析为医务人员提供治疗建议参
考,提高服务质量和诊断的准确性
• 追踪及了解医务人员使用系统的实际情况,并就
提升使用效率与医疗流程提出相 建议
• 系统规模 20节点,500+TB数据量,450个实时
并发用户
60倍
条记录/天
分析性能提升
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
金融行业
美国最大银行之一
信用卡风险分析
• 数百个分析师同时使用,峰值并发查询 千个, 级
响
• 15分钟就能完 原来需要2-3天才能完 的分析任务
• 仅系统维 费用,每 就节省数百万美元
• 88节点 x86 Vertica集群,1.5PB原始数据
• 均压缩率 6倍,节省了1PB的裸存储
• 批量加载 度9TB/小时
分析海量数据
5
/1.5PB
1000个
200倍
分析师
性能提升
9TB/小时
加载
10
200万美金
度
每
节省
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
联网行业
全球大型社交媒体公司
企业级数据仓
•
•
•
•
•
提供超过300节点的分析集群
支持10-50PB深度数据的分析
均35TB/小时的数据入
度
每天65万个Job
实 精确的营收分析,用户行为分析和广告效率
分析
度活跃用户人数 11.5亿
25亿
内容分享
照片
35TB/小时
27亿
“赞”
11
3亿
新增数据
© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
国内客户
某
贷款风险与营销分析
联网金融
•
小微贷款风险与营销分析
•
电信数据
•
实时的用户画像与营销信息
•
良好的
扩展性和快
•
基于
本的x86
•
极
•
•
12
金融数据与
性能
性
扩展
一期50TB,10节点
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
联网数据的融合分析
送
分析能力
国内客户
某电信
营商
数据自助服务与营销大数据分析
支持分析人员
10000个业务用户需要实时使用数据分析
•
由业务用户自己通过自助分析工具进行数据统计分析
•
用户通过数据
•
各种营销模式和促销手段的大数据分析
•
客户属性数据的关联分析,包括客户画像查询
户群刷新 标签分析的数据刷新
•
数据量360TB
10000个
3000万
360TB
数据规模
13
•
客户画像
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
开发工具编写脚本完
临时数据提取
标签客
HP Vertica – 极
大数据分析
大量PB级别的客户
超快的分析
度
无共享MPP纯列式存储
轻松配置与管理
全球合作伙伴生态系统
开
性的架构
实时处理您的信息
© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
谢谢
©
权所有 2014 Hewlett-Packard Development Company,L.P. 本文所含信息如有更改,恕不另行通知。