日本电子游戏prg-baqishuku8.com
每一个 Snapshot 是和一个 Hive 维度表对应的,生成的过程是:k W a在未来,Apache Kylin还有可能为特定场景、特定类型的维度量身定制特别的编码方式,如在很多行业,身份证号码可能是一个重要的维度。但是身份证号码由于其特殊性而不能使用整数类型的编码(身份证号码的最后一位可能是X),其高基数的特点也决定了其不能使用Dict编码,在目前的版本中只能使用Fixed_length编码,但显然Fixed_length不能充分利用身份证号码中大部分字节是数字的特性来进行深度编码,因此存在一定程度的存储空间的浪费。cD P
过滤(Filter)条件是指,如果想把一些记录忽略掉,那么这里可以设置一个过滤条件。Apache Kylin在向Hive请求源数据的时候,会带上此过滤条件。如图2-8所示,会只保留金额(price)大于0的记录。L Km
D U f
b nE
z7ywj
F SE以图 1中的Cube为例,假设维度A是必要维度,那么生成的Cube则如图8所示,维度数目从16变为9。an r
D Fj
gK j
h a g
Js K
b w o
r EC
M j D
m Yx
对 “Add Lookup Table” 页面的几点说明:B z e
O Hl利用数据仓库方式存放的资料,具有一旦存入,便不随时间变化而变动的特性,此外,存入的资料必定包含时间属性,通常,一个数据仓库会含有大量的历史性资料,并且它利用特定分析方式,从中发掘出特定的资讯。w v b
r ji
J i j
v anH H C
S Tn
kT s
在Apache Kylin界面的“Model”页面,点击“New”→“New Model”命令,开始创建数据模型。给模型输入名称后,选择一个事实表(必需的),然后添加维度表(可选),如图2-4所示。u j KMM J
W C k
首先,Apache Kylin作为OLAP引擎,只支持查询,而不支持其他操作,如插入、更新等,即所有SQL都必须是SELECT语句,否则Apache Kylin会报错。AN B
K j D
T zx
yJ t
w Q A
NL q
在单个聚合组中,可以对维度设置一些高级属性,如Mandatory Dimensions、Hierarchy Dimensions、Joint Dimensions等。这几种属性都是为优化Cube的计算而设计的,了解这些属性的含义对于更好地使用Cube至关重要。h b X
KE h
U T q
6. 在 Kylin v2.3 及之前版本,Kylin 在从 Hive 中获取数据时可能存在数据丢失,请参考 KYLIN-3388。q Xq
net+earn+advertising+alliance

9-
8-
7-
6-
5-
4-
3-
2-
1
联系康泰雅
东莞市柯宇管业有限公司
手机:133-7771-6075 陈生
电话:0769-22763649
邮箱:[email protected]
厂址:东莞市万江小享社区创业路15号