Quantcast
Channel: 数据仓库 »数据仓库
Browsing latest articles
Browse All 5 View Live

Data Map

最初是因为想起当年的python啄木鸟社区首页,他们用思维导图做的首页非常清晰,而wiki也有很多有价值的条目,不知为什么现在那个首页不见了。我想仿照它,整理一套关于数据的wiki条目,并以思维导图作为入口,于是,前阵子买了datafan.org这个域名,今天把首页初稿做了。...

View Article



Image may be NSFW.
Clik here to view.

关系模型 vs 维度模型

个人感觉这些建模理论(或者说为最佳实践更加合适)往往是一种理想化的情况,生搬硬套往往无法解决实际问题,以下的比较也因此较为笼统,总结下来仅供学习参考。 —————————————————————————- 关系模型 以遵循第三范式(3NF)为基础的关系模型,从ER图的“观感”上来说,较为松散、零碎,物理表数量多,而数据冗余程度低。由于数据分布于众多的表中,这些数据可以更为灵活地被应用,功能性较强...

View Article

关系模型 vs 维度模型(续)

上周在做总结的时候,就在想“什么情况该用什么模型”。刚刚看了一篇文章(链接:http://jillner.blogspot.com/2010/09/dimensional-or-3nf-model.html 需翻墙),又回想了一下之前看到的,实际上,问题会转化为“要用数据仓库做什么”,简言之,如果确要构建企业级数据仓库(Enterprise Data...

View Article

眼见为实——谈谈用于公共领域的BI

这两天接触到CIW的概念,即Crime Information Warehouse,字面意思就是关于犯罪信息的数据仓库。这概念源自IBM为某警局做的数据仓库项目。详情可参考此链接中的PPT。CIW集成了各个政府机关关于犯罪记录的数据,并在其上构建了相应的BI、GIS、DM功能。 通过数据集成与转换,使得办案人员有single version of...

View Article

BI与GIS

最近的项目是需要将GIS系统与BI系统进行整合,要学的东西比较多,就拖了好久没有更新。现在把最近的一些想法记录下来。 DW是关于时间,GIS是关于空间 这是刚刚接触GIS的时候就产生的感觉。众所周知DW(data warehouse)中保留了海量历史数据,而“历史”一词注定了其时间属性,当然,这并不代表其不包含空间信息,但其粒度通常较粗略(如只精确到城市),描述方式也很笼统...

View Article

Browsing latest articles
Browse All 5 View Live


Latest Images