MyException - 我的异常网
当前位置:我的异常网» 数据仓库 » 列表
  • 数据仓库简介-构成
    数据仓库简介---组成    数据仓库的组成部分有:针对数据源的分析、数据的迁移、数据的存储结构、元数据管理等。 数据源分析:业务系统的源数据通常来自企业的内部信息和外部信息。内部信息指来自企业的生产数据和历史归档数据;而企业的生产数据有可能来自于不同的业务系统,如何将这些业务数据进行标准
    网友分享于:2015-08-26 14:41:55
  • 数据仓库简介-数据集市
    数据仓库简介---数据集市 一、数据集市定义     数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。 独立型数据集市:数据来自于操作型数据库,是为了满足特殊用户而建立的
    网友分享于:2015-05-19 20:39:03
  • 推荐数据挖掘入门教本《数据挖掘与机器学习 WEKA应用技术与实践》
    推荐数据挖掘入门教材《数据挖掘与机器学习 WEKA应用技术与实践》该书由于去年刚出比较新,所以很难在网上下载到电子书,本人很幸运找到了前两章的电子版,而第二章又是本书的关键,所以建议大家先看看第二章,如果觉的写的好,可以再买书,或寻求电子版的全书,
    网友分享于:2015-05-19 20:39:03
  • 数据仓库课题(8)-维度属性选择之维护历史是否应该保留
    数据仓库专题(8)-维度属性选择之维护历史是否应该保留 一、背景   数据仓库建模过程中,针对事务型事实表设计,经常会遇到维度属性选择的问题,比如客户维度,在操作型系统中,为了跟踪客户状态的变化,往往会附加客户记录的四个属性:    &nb
    网友分享于:2015-05-14 22:20:26
  • 斯坦福数据挖掘(1)
    斯坦福数据挖掘(一)斯坦福大学的ppt。
    网友分享于:2015-05-13 22:51:19
  • 每天定时导入hive数据仓库的自动化脚本
    每日定时导入hive数据仓库的自动化脚本[Author]: kwu  每日定时导入hive数据仓库的自动化脚本 创建shell脚本,创建临时表,装载数据,转换到正式的分区表中: #!/bin/sh # upload logs to hdfs yesterday=`date --date='1
    网友分享于:2015-05-11 22:56:11
  • 机器学习与数据挖掘-logistic回归及手写识别范例的实现
    机器学习与数据挖掘-logistic回归及手写识别实例的实现本文主要介绍logistic回归相关知识点和一个手写识别的例子实现 一、logistic回归介绍: logistic回归算法很简单,这里简单介绍一下: 1、和线性回归做一个简单的对比 下图就是一个简单的线性回归实例,简单一点就是
    网友分享于:2015-05-11 06:20:08
  • 数据挖掘报刊、论坛、博客、数据集
    数据挖掘期刊、论坛、博客、数据集在数据挖掘:概念、模型、方法和算法这本书中,作者推荐了一些国外的期刊,论坛,博客,数据集,现在把可以进入网页的分享到csdn博客上。 一、数据挖掘期刊 1、Data Mining and Knowledge Discovery http://www
    网友分享于:2015-05-05 23:09:42
  • 数据挖掘之决策树算法ID3算法的有关原理
    数据挖掘之决策树算法ID3算法的相关原理ID3决策树:针对属性选择问题,是决策树算法中最为典型和最具影响力的决策树算法。 ID3决策树算法使用信息增益度作为选择测试属性。 其中p(ai) 表示ai 发生的概率。 假设有n个互不相容的事件a1,a2,a3,….,an,它们中有且仅有一
    网友分享于:2015-05-04 22:46:40
  • 数据仓库课题(6)-数据仓库、主题域、主题概念与定义
    数据仓库专题(6)-数据仓库、主题域、主题概念与定义一、数据仓库       关于数据仓库概念的标准定义业内认可度比较高的,是由数据仓库之父比尔·恩门(Bill Inmon)在1991年出版的“Building
    网友分享于:2015-04-28 03:01:09
  • 数据挖掘算法之关联规则开掘(一)apriori算法
    数据挖掘算法之关联规则挖掘(一)apriori算法关联规则挖掘算法在生活中的应用处处可见,几乎在各个电子商务网站上都可以看到其应用 举个简单的例子 如当当网,在你浏览一本书的时候,可以在页面中看到一些套餐推荐,本书+有关系的书1+有关系
    网友分享于:2015-04-25 22:04:18
  • 数据挖掘算法之关联规则开掘(二)FPGrowth算法
    数据挖掘算法之关联规则挖掘(二)FPGrowth算法之前介绍的apriori算法中因为存在许多的缺陷,例如进行大量的全表扫描和计算量巨大的自然连接,所以现在几乎已经不再使用 在mahout的算法库中使用的是PFP算法,该算法是FPGrowth算法
    网友分享于:2015-04-25 22:04:18
  • 急kettle 运行一段时间,报数据库连接异常
    急kettle 运行一段时间,报数据库连接错误Unexpected error rolling back the database connection.    org.pentaho.di.core.e
    网友分享于:2015-04-22 21:50:21
  • 数据仓库专题(5)-怎么构建主题域模型原则之站在巨人的肩上(一)IBM-FSDM主题域模型划分
    数据仓库专题(5)-如何构建主题域模型原则之站在巨人的肩上(一)IBM-FSDM主题域模型划分 一、前言       如何构建主题域模型原则是构建企业级数据仓库重要的议题,最好的路径就是参照成熟的体系。IBM金融数据模型数据存储模型FSDM,
    网友分享于:2015-04-22 21:50:21
  • 数据挖掘算法小结
    数据挖掘算法总结一、关联规则挖掘 1、 Apriori算法 (1)Apriori算法原理 Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该
    网友分享于:2015-04-21 23:09:54
  • 数据仓库专题(5)-怎么构建主题域模型原则之站在巨人的肩上(二)NCR FS-LDM主题域模型划分
    数据仓库专题(5)-如何构建主题域模型原则之站在巨人的肩上(二)NCR FS-LDM主题域模型划分一、前言       分布式数据仓库模型的架构设计,受分布式技术的影响,很多有自己特色的地方,但是在概念模型和逻辑模型设计方面,还是有
    网友分享于:2015-04-21 23:09:54
  • 数据仓库课题(4)-分布式数据仓库事实表设计思考-讨论精华
    数据仓库专题(4)-分布式数据仓库事实表设计思考---讨论精华 一、前言   上一篇分享博文《数据仓库专题(3)--分布式数据仓库事实表设计思考》后,陆续有各位兄弟参加大讨论,提出了各种问题,关于分布式环境下,维表和事实表设计,进行了比较深
    网友分享于:2015-04-21 23:09:54
  • 数据仓库课题(1)-数据仓库生命周期模型
    数据仓库专题(1)-数据仓库生命周期模型 一、前言   工作内容的变更,导致重新回到数据仓库模型的架构和设计,于是花点时间比较系统的回顾数据仓库建模和系统建设的知识体系,记录下来,作为笔记吧。 二、模型   无论数据仓库技术如何变化,从RDBMS到No
    网友分享于:2015-04-21 02:28:07
  • 数据仓库课题(2)-Kimball维度建模四步骤
    数据仓库专题(2)-Kimball维度建模四步骤 一、前言   四步过程维度建模由Kimball提出,可以做为业务梳理、数据梳理后进行多维数据模型设计的指导流程,但是不能作为数据仓库系统建设的指导流程。本文就相关流程及核心问题进行解读。 二、数据仓库建设流程   以下流程是根据业
    网友分享于:2015-04-21 02:28:07
  • 数据仓库课题(3)-分布式数据仓库事实表设计思考
    数据仓库专题(3)-分布式数据仓库事实表设计思考一、前言   最近在设计数据仓库的数据逻辑模型,考虑到海量数据存储在分布式数据仓库中的技术架构模式,需要针对传统的面相关系型数据仓库的数据存储模型进行技术改造。设计出一套真正适合分布式数据仓库的数据存储模型。 二、事实表设计基础 &
    网友分享于:2015-04-21 02:28:07
程序员都该阅读的书
程序员都该阅读的书
程序员应该关注的一些事儿
程序员应该关注的一些事儿
为啥Android手机总会越用越慢?
为啥Android手机总会越用越慢?
老程序员的下场
老程序员的下场
要嫁就嫁程序猿—钱多话少死的早
要嫁就嫁程序猿—钱多话少死的早
我是如何打败拖延症的
我是如何打败拖延症的
老美怎么看待阿里赴美上市
老美怎么看待阿里赴美上市
为什么程序员都是夜猫子
为什么程序员都是夜猫子
我跳槽是因为他们的显示器更大
我跳槽是因为他们的显示器更大
 程序员的样子
程序员的样子
Java程序员必看电影
Java程序员必看电影
那些性感的让人尖叫的程序员
那些性感的让人尖叫的程序员
鲜为人知的编程真相
鲜为人知的编程真相
每天工作4小时的程序员
每天工作4小时的程序员
程序员眼里IE浏览器是什么样的
程序员眼里IE浏览器是什么样的
不懂技术不要对懂技术的人说这很容易实现
不懂技术不要对懂技术的人说这很容易实现
初级 vs 高级开发者 哪个性价比更高?
初级 vs 高级开发者 哪个性价比更高?
写给自己也写给你 自己到底该何去何从
写给自己也写给你 自己到底该何去何从
60个开发者不容错过的免费资源库
60个开发者不容错过的免费资源库
科技史上最臭名昭著的13大罪犯
科技史上最臭名昭著的13大罪犯
当下全球最炙手可热的八位少年创业者
当下全球最炙手可热的八位少年创业者
十大编程算法助程序员走上高手之路
十大编程算法助程序员走上高手之路
我的丈夫是个程序员
我的丈夫是个程序员
2013年美国开发者薪资调查报告
2013年美国开发者薪资调查报告
聊聊HTTPS和SSL/TLS协议
聊聊HTTPS和SSL/TLS协议
如何区分一个程序员是“老手“还是“新手“?
如何区分一个程序员是“老手“还是“新手“?
“肮脏的”IT工作排行榜
“肮脏的”IT工作排行榜
程序员的鄙视链
程序员的鄙视链
2013年中国软件开发者薪资调查报告
2013年中国软件开发者薪资调查报告
5款最佳正则表达式编辑调试器
5款最佳正则表达式编辑调试器
10个帮程序员减压放松的网站
10个帮程序员减压放松的网站
程序猿的崛起——Growth Hacker
程序猿的崛起——Growth Hacker
一个程序员的时间管理
一个程序员的时间管理
程序员和编码员之间的区别
程序员和编码员之间的区别
10个调试和排错的小建议
10个调试和排错的小建议
程序员的一天:一寸光阴一寸金
程序员的一天:一寸光阴一寸金
漫画:程序员的工作
漫画:程序员的工作
看13位CEO、创始人和高管如何提高工作效率
看13位CEO、创始人和高管如何提高工作效率
亲爱的项目经理,我恨你
亲爱的项目经理,我恨你
Web开发者需具备的8个好习惯
Web开发者需具备的8个好习惯
总结2014中国互联网十大段子
总结2014中国互联网十大段子
中美印日四国程序员比较
中美印日四国程序员比较
程序员最害怕的5件事 你中招了吗?
程序员最害怕的5件事 你中招了吗?
Java 与 .NET 的平台发展之争
Java 与 .NET 的平台发展之争
做程序猿的老婆应该注意的一些事情
做程序猿的老婆应该注意的一些事情
什么才是优秀的用户界面设计
什么才是优秀的用户界面设计
程序员周末都喜欢做什么?
程序员周末都喜欢做什么?
程序员必看的十大电影
程序员必看的十大电影
那些争议最大的编程观点
那些争议最大的编程观点
软件开发程序错误异常ExceptionCopyright © 2009-2015 MyException 版权所有