快捷搜索:  as  2018  FtCWSyGV  С˵  test  xxx  Ψһ  w3viyKQx

澳门新葡新京是真的吗_龟发之家论坛



(一)基础观点:

1.多维数据集:多维数据集是联机阐发处置惩罚 (OLAP) 中的主要工具,是一项可对数据仓库中的数据进行快速造访的技巧。多维数据集是一个数据澳门新葡新京是真的吗聚拢,平日从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维布局。

2.维度:是多维数据集的布局性特点。它们是事实数据表顶用来描述数据的分类的有组织层次布局(级别)。这些分类和级别描述了一些相似的成员聚拢,用户将基于这些成员聚拢进行阐发。

3.度量值:在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且平日为数字。此外,度量值是所阐发的多维数据集的中间值。即,度量值是终极用户浏览多维数据集时重点查看的数字数据。您所选择的度量值取决于终极用户所哀求的信息类型。一些常见的度量值有 sales、cost、expenditures 和 production count 等。

4.元数据:不合 OLAP 组件中的数据和利用法度榜样的布局模型。元数据描述 OLTP 数据库中的表、数据仓库和数据集市中的多维数据集这类工具,还记录哪些利用法度榜样引用不合的记录块。

5.级别:级别是维度层次布局的一个元素。级别描述了数据的层次布局,从数据的最高(汇总程度最大年夜)级别直到最低(最具体)级别。

6.数据掘客:数据掘客使您得以定义包孕分组和猜测规则的模型,以便利用于关系数据库或多维 OLAP 数据集中的数据。之后,这些猜测模型便可用于自动履行繁杂的数据阐发,以找出赞助识别新时机并选择有得胜把握的时机的趋势。

7.多维 OLAP (MOLAP):MOLAP 存储模式使得分区的聚合和其源数据的复本以多维布局存储澳门新葡新京是真的吗在阐发办事器谋略机上。根据分区聚合的百分比和设计,MOLAP 存储模式为达到最快查询相应光阴供给了潜在可能性。总而言之,MOLAP 加倍得当于频繁应用的多维数据集中的分区和对快速查询相应的必要。

8.关系 OLAP (ROLAP):ROLAP 存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。然则,可为分区数据应用 ROLAP 存储模式,而不在关系数据库中创建聚合。

9.混杂 OLAP (HOLAP):HOLAP 存储模式结合了 MOLAP 和 ROLAP 二者的特点。

10.粒度:数据汇总的层次或深度。

11.聚合|凑集:聚合是预先谋略好的数据汇总,因为在问题提出之前已经筹备了谜底,聚合可以改进查询相应光阴。

12.切块:由多个维的多个成员限制的分区数据,称为一个切块。

13.切片:由一个维的一个成员限制的分区数据,称为一个切片。

14.数据钻取:终极用户从老例多维数据集、虚拟多维数据集或链接多维数据集中选择单个单元,并从该单元的源数据中检索结果集以得到更具体的信息,这个操作历程便是数据钻取。

15.数据掘客模型:数据掘客使您得以定义包孕分组和猜测规则的模型,以便利用于关系数据库或多维 OLAP 数据集中的数据。之后,这些猜测模型便可用于自动履行繁杂的澳门新葡新京是真的吗数据阐发,以找出赞助识别新时机并选择有得胜把握的时机的趋势。

(二)实例构建历程与阐发

1.现在以一个对照简单的实例来阐发和探究MS SQL SERVER 数据仓库的构建历程。实际上数据仓的构建是相称繁杂的,他结合了数据仓库的前端技巧和很强的营业要求。在这儿只因此一个简单的实例来阐明他大年夜致的构建流程。

2.构建数据仓库模型,他包括两部分,一是要斟酌原本的数据源能够供给哪些有用的数据,也便是颠末数据的筛选之后能够为数据仓库所用。二是要看公司营业层必要什么样的阐发结果。这要和公司的高档决策层慎密共同,完全懂得他的营业需求,由于数据仓库的应用者主如果公司的高档决策者。

在这一阶段要做好很多前期的事情,由于你的原始数据库中的数据大概和你的正要建立的数据仓库的需求大概有很大年夜的进出,布局完全是两马事。你若何才能将你的原始数据提掏出来,作为数据仓库的有用数据呢,你的原始数据库中存储的是零散的事务数据,而你的数据仓库中要的是颠末转化和提炼过的统计数据,比如说,你的原始数据库中存储是日天的所有存款和取款记录,而你的数据仓库并不关心你的每笔记录的数据,而是盼望在最短的光阴内,以最快的速率统计出这个月的所有存款和取款的总数量,假如这种查询放在原本的数据库上来做的话,也就掉去了数据仓库的意义,超大年夜规模的数据使你无法查询下去,这时刻你就要将对这个查询故意义的数据转化到数据仓库,这便是数据洗濯,即ETL。实现数据洗濯有很多的澳门新葡新京是真的吗措施,也有很多的细节问题,比如,数据类型的匹配,数据款式的转换,异地数据表数据集中到一路时有主键重复,以及你若何按期,按时的将数据加工到数据仓库中来等等。在我的示例中没有严格的颠末着一步,由于我没有规范的原始数据库,也没有规范的营业需求。我只是运用星型模型和雪花模型做了几个范例的数据仓库表。其表关系如下:

窗口中FACT为事实表,TIME,ADDRESS,DETAIL分手为光阴维,地址维,具体地址维,DETAIL又是ADDRESS的子维。他们又构成雪花模型。此中都有部分数据。

3现在,数据仓库已经建立成功,下一步便是在OLAP办事器上建立元数据数据库。这个数据库和我们曩昔所说的数据库不合,他是寄放元数据的数据库,比如我们下一步要创建的多维数据集、角色、数据源、共享维度和掘客模型等。然后必要和早期在 ODBC 数据源治理器中建立的数据源连接,使其与数据仓库连接上。

我创建了数据库MMM和数据源TEST,如下:

这些事情做好了之后,就可以用数据仓库中的维表来建立共享维度,现在以光阴维和地址维为例。其创建历程一样。

依此点下一步即可创建光阴维(TIME),下面用ADDRESS和DETAIL建立雪花模型共享维度

点下一步即可创建DETAIL维。创建完成之后都要进行处置惩罚才能生效

维度创建好了之后就该创建多维数据集了。多维数据集是一种基于维表和事实表的数据集,以他来对数据仓库进行快速的造访。我们的多维数据集布局如下:

DETAIL(SREET)

DETAIL(MARK)

ADDRESS(PROVINCE,CITY)

TIME(YEAR,DAY)

多维数据集STUDY的创建历程如下:

点下一步即可创建成功(STUDY),处置惩罚如下:

紧接着我门就应该创建掘客模型

完成后处置惩罚如下:

到现在一个简单的数据仓库架构已经建立成功,我们使用前端阐发对象来对建立的数据仓库做查询,看能否实现我们的简单的营业要求,先以EXCEL作为查询对象澳门新葡新京是真的吗:

我们除了用EXCEL,ENGLISH QUERY 等现成对象做查询外,还可以用MDX函数直接对OLAP做查询

到现在为止,一个简单的数据仓库已经创建成功,可以实现一些简单的营业查询。这个实例主如果阐发数据仓库的创建历程以及进一步加深对数据仓库的熟识和懂得,进一步理解此中的基础观点。

您可能还会对下面的文章感兴趣: