数据仓库与OLAP多维数据集?

任何人都可以解释什么是数据仓库和OLAP立方体之间的真正区别?

他们是不同的方法相同的事情?

其中一个与其他人相比是否被弃用?

其中之一是否有任何性能问题?

欢迎任何解释

数据仓库是一种数据库,其devise使得分析数据变得更加容易(通常来自多个来源的数据)。 它通常由事实表和维度表组成,并且通常是聚合表。

OLAP是一可以在数据集上执行的操作 ,如旋转,切片,切块,钻孔。 例如,可以使用Excel数据透视表执行OLAP操作。

你可以有一个数据仓库,根本不使用OLAP(你只需运行报表)。

您也可以对数据仓库以外的其他项执行OLAP操作,例如平面文件。

OLAP服务器是一种便于OLAP操作的服务器软件,例如caching和查询重写。 OLAP操作通常以MDX表示,而您的OLAP服务器可能会将MDX转换为数据库的常规SQL。 或者它可能会违背自己的二进制文件格式。

他们是不同的方法相同的事情?

不,数据仓库是以易于分析的格式存储数据的地方,OLAP是分析数据的方法。

其中一个与其他人相比是否被弃用?

不,他们互相恭维,因为数据仓库使得使用OLAP分析数据变得容易,并且OLAP可以使分析数据仓库更加有用。

其中之一是否有任何性能问题?

是。 数据仓库是为了存储大量的数据,因此需要花费时间进行查询。 性能可以通过使用索引,caching以及预先汇总一些数据来提高。

另见: https : //dba.stackexchange.com/questions/45655/what-are-measures-and-dimensions-in-cubes

†而不是使交易更容易/更完整

数据仓库包含您希望运行报告和分析等的数据

立方体通过将数据分组到定义的维度来组织这些数据。 你可以有多个维度(在Excel中考虑一个超级数据透视表)。

例如,在您的数据仓库中,您拥有所有的销售,但是运行复杂的SQL查询可能非常耗时。 因此,从数据仓库中创build一个索引和预先计算数据的多维数据集。 在您的立方体中,您可以拥有所有预先计算的维度:按月,按周,按销售员,按客户,按地理区域,按产品颜色等等的销售额。然后,可以在您的立方体上运行OLAP查询以获得总计, (月,销售员,地区)或(颜色,地区)或(销售员,月)的最大销售额。 由于所有的数据都是预先计算和索引的,查询速度非常快。

他们是不同的方法相同的事情?

不,数据仓库是以易于分析的格式存储数据的地方,OLAP是分析数据的方法。

不,他们真的做同样的事情! OLAP比DWH更加预先计算。 OLAP就像DWH中的集合