数据仓库与企业智能化
2008-05-20 17:51:33
来源:星星生活

数据仓库和企业智能化及应用这两个概念经常混用。前者强调数据的整合与存储,而后者则主要集中在数据的表现与展示.一般来说,常用的数据仓库解决方案至少应涵盖三大部分:创建数据模型(Data Modeling),数据整合与存储(ETL)以及数据表现与展示(BI)。

创建数据模型:在数据库和数据仓库领域,常用的三大数据模型有关系型(ERD),多维关系型(DMR)和多维数据模型。

关系型数据模型在ERP产品中得到了完美的应用,特点是减少数据的冗余,保证数据以最快的速度写入数据库,缺点是数据从数据库读出慢(查询速度慢),不适合作为企业的报表系统。

数据整合与存储:简而言之,数据整合就是人们常提及的ETL,ETL将数据源从不同的系统中抽取(大多数为ERP,CRM,SCM和IBM主机等),经过复杂的转换和计算,按照既定的规则,标准和流程,经过不同的阶段,将数据传输到数据库或其它存储介质中,数据整合过程涉及到许多复杂的数据库问题,诸如:数据增量提取,存储设计,表分区,索引创建和删除,性能优化,备份与恢复等等。ETL一般要占到整个项目的60-70%的精力。当用户所要的数据已全部传输到最终数据库后,就进入数据的表现与展示阶段。

数据表现与展示:不管数据模型建立的多么周密,数据整合的多么完美,若不将数据以多姿多彩的方式展现出来,用户体会不到数据仓库和企业智能化的美妙之处。数据的表现与展示有多种多样的方式。

数据仓库和企业智能化的魅力在于它的灵活性,但又都遵循基本的行业标准。虽然各软件巨头都有各自独特的解决方案,但企业很少有独用一家的。根据多年的实践,在Oracle数据平台上,用Informatica 作为ETL的开发工具,借助Cognos BI工具来展示数据可能是最为通用的组合了。

青山理工学院于5月25日(周日)上午10点举办SQL 数据库管理班,下午2点举办数据仓库最新技术专题讨论会。5月24日(周六)上午10点举办软件测试(QA)全能班,欢迎参加。详情请电: 905-415-9989/416-921-8886。网站:www.mitcedu.com 地点:50 Acadia Ave., Suite 120, Markham, ON L3R 0B3 (Warden & Steeles西北角,大统华西侧,免费停车。周末进门code: 120)(本文由青山理工学院供稿)

收藏

发表评论