聚合示例

Solve china dataset issues with shared expertise and innovation.
Post Reply
roseline371274
Posts: 943
Joined: Mon Dec 23, 2024 8:17 am

聚合示例

Post by roseline371274 »

如果我们将示例中的所有收据行加载到 Power BI 中,则我们需要 所有商店一年的365*100*5000*10= 1,825,000,000
(18 亿)行数据。按商店天数计算的相同总数可得出:365*100= 36,500 行。差异达 50,000 倍。

始终问自己是否具有正确的聚合级别来回答业务问题,而无需导入不必要的行。


聚合表示例
数据聚合的示例。在此示例中,表格从 12 行减少到 3 行(因子 4)。



限制数据历史记录
除了选择正确的聚合级别之外,考虑要保留多少历史数据也很重要。您想要保留的历史记录越多,所需的行就越多。现在加载的所有历史数据对于回答结构性业务问题来说真的是必要的吗?将历史数据的年数减半可以使模型 阿根廷号码数据 的规模减半。还请仔细考虑您所应用的 缓慢变化维度 (SCD) 的类型 。这也会对数据仓库的性能产生重大影响。



限制列数
Power BI 中的表按列存储,存储空间取决于列的内容。您可以做些什么来减少数据集中列的存储空间?

删除未使用的列
是否存在包含您不会用来回答业务问题的信息的列?那么我们建议不要进口它们。如果这样做,它们将占用不必要的存储空间,从而不必要地减慢您的数据集速度。

基数和数据字典
有时将数据从 1 列拆分为 2 列实际上是一个好主意。这是基数的结果。 Power BI 中的基数表示一列中有多少个唯一值。如果一列只有两个可能的值(例如‘是’或‘否’),那么基数就是二。基数越高,需要存储的不同值就越多。
Post Reply