快捷搜索:  as  2018  FtCWSyGV  С˵  test  xxx  Ψһ  w3viyKQx

澳门24小时娱乐在线:SQL SERVER BI入门教程1、安装与基础概念



SQL SERVER BI 入门

或许有很多同砚和我一样,只是据说过BI这个词汇,但假如事情不涉及到数据统计阐发或数据掘客,很难打仗这方面的常识。我曩昔不停憧憬能在这方面有所历练,碰巧近来公司必要做数据统计和阐发的事情,这份事情我主动提出来做,荣幸之至。写这篇文章也是对我近来事情的总结。

下载并安装

我事情选用的SqlServer 2008 R2,因为在自己电脑上写博客,以是我这里考试测验应用2012版本,顺便也能看看哪里不合。 下载地址是http://www.microsoft.com/en-us/download/details.aspx?id=29066假如你的系统是中文的则选择中文版。

安装时选择功能模块如下:[配图1]

请留意右下角的Prerequisites for selected features的提示内容,必要4.0,着实还必要3.5。

基础观点先容

数据阐发主要包孕如下内容:

原始数据库

原始数据库主如果用于一些数据上报的数据存储,它包孕的是最原始的信息,比如一个用户在什么光阴造访了什么页面或点击了哪些按钮。澳门24小时娱乐在线这些数据可以经由过程js、as、或后端代码进行上报。

这种日志性的数据上报一样平常量异常大年夜,一天可能就孕育发生几亿条数据,之前我在一家广告公司呆过,广告的量大年夜的惊人,由于广告都是在各大年夜门户展现的,以是页面的PV便是广告的条数,用户的相关操作还会稀有据孕育发生,天天十来G的数据量都不成问题,以是原始数据库表的设计要留意几点:

1、不能有索引(除了主键),也不必要索引,由于相关的阐发统计都在数据仓库里进行。

2、主键必须是有序的主键,假如是GUID之类的,就无法包管顺序,在这数据插入时会调剂数据存储的物理顺序,这是异常可怕的工作,影响速率。

3、假如数据异常大年夜,要斟酌采纳分区或分库存储。

4、假如瞬间插入的太多半据库压力大年夜,则必要斟酌增添一个缓存层来缓解压力,这便必要编写办事对缓存层数据进行收拾插入到数据库的事情。这样也的毛病是万一缓存办事挂掉落,有可能会稀有据损掉的环境,可以选用会持久化的缓存办事。总之,这些是必要权衡的。

数据仓库数据库

数据仓库数据库,是必须的,所有的统计阐发都必要以此为根基。数据仓库的表分为两种:维度表(dimension)和事实表(fact)。

1. 维度表

维度很轻易理解。例如,我们想知道天天有若干用户应用了产品,那么“天天”便是一个维度,由于我们必要安装“天”来查询有若干用户。同样,年、月、周、季度、地区等都是我们最常见的维度。

2. 事实表

事实表的理解可能会隐隐一些。一样平常可以理解为我们要对哪种数据做统计,这种数据事实孕育发生了哪些记录。比如每个用户每一个操作,这是一个事实。那么我们对用户的操作行径做统计的时就必要行径的事实表。

3. 事实表和维度表的关系

假如我们应用光阴维度对用户行径做统计,那么事实表必须要有一个光阴字段。而光阴字段的存储着实是光阴维度表的主键ID,而不是真正的光阴,如图:[配图2]

留意,我的事实表FactUserAction(用户操作行径事实)的OperateDate是int类型,和维度表DimDate建立了关系,而且DimDate把日期拆成了年月日三个字段,由于统计可能必要对年和月进行统计,以是这么设计;他们之间有一个层次关系,我们后面会讲。原始表的设计如图

细心的同伙可能会发明,事实表的UserAction也是一个int,是的,着实这也是一个查询维度,只是我们暂时只拿光阴做例子。

4. 若何设计事实表和维度表

事实表和维度的设计主如果运维和产品职员澳门24小时娱乐在线的需求而抉择的。法度榜样员必能由于开拓的繁杂而回绝他们的需求。当然,也不能无理的需求。这篇文章就以光阴维度的需求做解说吧,这个一样平常也是必须的需求。

5. 事实表和维度表的数据添补

这一项对我们法度榜样员来讲是最为简单的,由于我们可以开拓一个办事,准时从原始数据库把数据按照仓库的设计重组,并插入。SQLSERVER BI也供给了现有的对象,这种对象称之为ETL(Extraction-Transfor澳门24小时娱乐在线mation-Loading数据提取、转换和加载),在SQLSERVERBI里叫SSIS(SqlServer Integration Service)。

图片里三个方块是从一个表里读出数据,然后经由过程一个列的转换,着末把转换后的列澳门24小时娱乐在线映射到目标库的表里,我这里做的是把CreateTime字段转换成Year Month 和 Day,然后插入到DimDate表

应用ETL要比自己写导入法度榜样更能方便的和Analysis Services交互。比如导入法度榜样后履行唯独表,比如各类数据源的集成,异常方便。不过我没有做深入钻研。暂时就不写这一块了,有兴趣的同伙可以逐步摸索下。

本日就先写这么多,由于我为了截图,安装SQ澳门24小时娱乐在线LServer费了好大年夜劲,.NET Framework 3.5老是安装时下载掉败。我的系统是windows8,必要零丁安装3.5才行。

大年夜家先懂得这些观点,不太明白的观点,可以先百科一下。下节写关于Analysis services的应用。

转自:http://blog.csdn.net/maddemon/article/details/8094360

您可能还会对下面的文章感兴趣: