Big Data Vertica Jin Dan pptx

©

权所有 2014 Hewlett-Packard Development Company,L.P. 本文所含信息如有更改,恕不另行通知。

风驰电掣 — HP Vertica
实现极限速度大数据掘金
金丹
资深架构师
中国惠普
软件业务部大数据平台

惠普机密信息。©

权所有 2014 Hewlett-Packard Development Company,L.P. 本文所含信息如有更改,恕不另行通知。

们进入了大数据的时代

人类
数据

数据量


大数据

机器
数据

技术差距

移动应用
系统日志
数据中心
合规性内容存档
物联网
传感器
社交网络
照 分享
可穿戴 备

业务
数据


数据

时间

功能全面的大数据核心

Haven 大数据平台
核心大数据引


搜索


数据
探索

内部部署

图像/视频

分析

探索

丰富

快速
分析

分析

地理空间
分析

预测

服务

情绪
分析


处理

基于 Hadoop
的 SQL

等等...

预测性
分析

端部署

市场领先的MPP数据

厂商
Vertica是一个融合大数据和传统数据分析的系
统,能够同时满足企业在数据仓 和高级分析
两方面的需求



度”是Vertica的关键词,所 用户都对Vertica

在查询方面的快



到满意甚至惊喜



客户认为Vertica在节省人力
方面

着非常快

的回

——Gartner 2015


本以及投资收益

满足业务需求的实时分析


50x – 1000x 性能提升



TBs ~PBs高




ETL和BI解决方案
轻松整合

扩展性




在工业标准x86服务器上具
超 性能





灵活部署

标准SQL接口

大数据分析
模型

内嵌高可用

无共享MPP

纯列式存储


自动优化设计

高级主动压


服务于各行业的

电信

社交媒体
帮助社交媒体网站实
查询,提供

高 信息

11.5亿
客户访问的行为分析,精准广告投
和广告效率分析


医疗
帮助医疗保险机构进行数据分
析,提供给每个患者病理的深入
分析和医疗解决方案,每 处理

100亿
条记录,跟踪每个患者的医疗数
据,建立患者疗效数据 ,并提
供 学的病理预测与分析,为医
务人员提供治疗建议参考
7

功经验

提供用户行为 网络质量与性能
的深度组合分析,5 节省6338
万美金,投资回 率

657%
4个 收回投资 本,而整体性

能提升97%,提升数据仓 团队
工作效率20%



帮助电视媒体实 软性广
告的计量和计费,实

2500

商标/

的视频分析能力

航空

帮助飞机制 商在以亿计事件中,精
准定 故障并快 恢复,全 故障时
间减少


90%
业务

银行

电视媒体

用性大幅提升

© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

帮助航空公司改进分析能力,提
高客服质量,

No.1
对飞行数据进行分析,包括客
户忠诚度 保留率
作及维

帮助银行实 信用卡申请交易
管理和风险分析,分析 度提


80倍
解决信用卡实时评分问题


实 交通
时分析



社交媒体的实

2000+
摄像头的实时监
风险事件

,快 定



电信行业

全球最大电信

营商之一

核心决策支持







2013

2.8亿





宽带用户

3.2PB
8

1280亿

营业收入

1.8亿 4G LTE用户

核心决策支持
 提供用户行为 网络质量与性能的深度组
合分析
3.2PB裸数据,6倍压缩比
 比TD压缩提升140%
5 节省6338万美金
投资回 率657%
4个 收回投资 本
66节点的HP Vertica
 只是原 TD扩容 本的2%
 而整体性能提升97%
由于Vertica的简单与易用性,提升数据仓 团
队工作效率20%

裸数据容量

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

医疗健康行业

全球大型医疗服务提供商

健康数据分析

10000家

支持全球医疗机构

45000个

3000个

医生

医院

100亿
9

• 每 处理超过100亿条医疗数据
• 跟踪每个患者的医疗数据,建立患者疗效数据
,并提供 学的病理预测与分析
• 分析 率提升60倍 从20分钟到20
• 提供给每个患者病理的深入分析和医疗解决方
案,通过预测分析为医务人员提供治疗建议参
考,提高服务质量和诊断的准确性
• 追踪及了解医务人员使用系统的实际情况,并就
提升使用效率与医疗流程提出相 建议
• 系统规模 20节点,500+TB数据量,450个实时
并发用户

60倍
条记录/天

分析性能提升

© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

金融行业

美国最大银行之一

信用卡风险分析
• 数百个分析师同时使用,峰值并发查询 千个, 级

• 15分钟就能完 原来需要2-3天才能完 的分析任务
• 仅系统维 费用,每 就节省数百万美元
• 88节点 x86 Vertica集群,1.5PB原始数据
• 均压缩率 6倍,节省了1PB的裸存储
• 批量加载 度9TB/小时

分析海量数据

5

/1.5PB

1000个

200倍

分析师

性能提升

9TB/小时
加载
10

200万美金




节省

© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

联网行业

全球大型社交媒体公司

企业级数据仓






提供超过300节点的分析集群
支持10-50PB深度数据的分析
均35TB/小时的数据入

每天65万个Job
实 精确的营收分析,用户行为分析和广告效率
分析

度活跃用户人数 11.5亿

25亿

内容分享

照片

35TB/小时

27亿
“赞”
11

3亿

新增数据

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

国内客户



贷款风险与营销分析

联网金融


小微贷款风险与营销分析



电信数据



实时的用户画像与营销信息



良好的

扩展性和快



基于

本的x86








12

金融数据与

性能


扩展

一期50TB,10节点

© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

联网数据的融合分析


分析能力

国内客户

某电信

营商

数据自助服务与营销大数据分析

支持分析人员

10000个业务用户需要实时使用数据分析



由业务用户自己通过自助分析工具进行数据统计分析



用户通过数据



各种营销模式和促销手段的大数据分析



客户属性数据的关联分析,包括客户画像查询
户群刷新 标签分析的数据刷新



数据量360TB

10000个
3000万

360TB
数据规模
13



客户画像

© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

开发工具编写脚本完

临时数据提取

标签客

HP Vertica – 极

大数据分析
大量PB级别的客户
超快的分析



无共享MPP纯列式存储
轻松配置与管理
全球合作伙伴生态系统


性的架构

实时处理您的信息

© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

谢谢

©

权所有 2014 Hewlett-Packard Development Company,L.P. 本文所含信息如有更改,恕不另行通知。