笔记:商业智能的相关概念
?写在最前:本文的内容大部分来自于百度百科,部分来自于一些其它BI书籍
一切,从零开始。 学习BI前必须懂得的几个概念。
各个概念的从属关系,可以参照下面的简图?
1、什么是BI(商业智能)
2、数据仓库,联机分析处理,数据挖掘
3、OLAP与OLTP????
?
?? 联机事务处理OLTP(On-Line Transaction Processing)?
???联机分析处理OLAP(On-Line Analytical Processing)?
? ?注:重点了解OLAP的相关概念
4、钻取,切片,切块
??? OLAP的基本多维分析操作有钻取(roll up和drill down)、切片(slice)和切块(dice)、以及旋转(pivot)、drill across、drill through等。
??? 钻取是改变维的层次,变换分析的粒度。它包括向上钻取(roll up)和向下钻取(drill down)。roll up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而drill down则相反,它从汇总数据深入到细节数据进行观察或增加新维。
??? 切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个,则是切块。 旋转是变换维的方向,即在表格中重新安排维的放置(例如行列互换)。
5、ROLAP、MOLAP、HOLAP?
????OLAP有多种实现方法,根据存储数据的方式不同可以分为ROLAP、MOLAP、HOLAP。
??? ROLAP表示基于关系数据库的OLAP实现(Relational OLAP)。以关系数据库为核心,以关系型结构进行多维数据的表示和存储。ROLAP将多维数据库的多维结构划分为两类表:一类是事实表,用来存储数据和维关键字;另一类是维表,即对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息。维表和事实表通过主关键字和外关键字联系在一起,形成了“星型模式”。对于层次复杂的维,为避免冗余数据占用过大的存储空间,可以使用多个表来描述,这种星型模式的扩展称为“雪花模式”。
??? MOLAP表示基于多维数据组织的OLAP实现(Multidimensional OLAP)。以多维数据组织方式为核心,也就是说,MOLAP使用多维数组存储数据。多维数据在存储中将形成“立方块(Cube)”的结构,在MOLAP中对“立方块”的“旋转”、“切块”、“切片”是产生多维数据报表的主要技术。
??? HOLAP表示基于混合数据组织的OLAP实现(?型的。这种方式具有更好的灵活性。)
??? 还有其他的一些实现OLAP的方法,如提供一个专用的SQL Server,对某些存储模式(如星型、雪片型)提供对SQL查询的特殊支持。
6、ETL (抽取、转换、装载)
??? 抽取(Extraction)、转换(Transformation)和装载(Load)
?