MyException - 我的异常网
当前位置:我的异常网» 数据仓库 » 列表
  • 数据仓库建设-数据建模
    数据仓库建设---数据建模     首先我们先查看三个问题:①什么是数据模型;②为什么需要数据模型;③如何创建数据模型; 一、什么是数据模型     数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事
    网友分享于:2015-05-28 22:30:06
  • 机器学习与数据挖掘-K最比邻(KNN)算法的实现(java和python版)
    机器学习与数据挖掘-K最近邻(KNN)算法的实现(java和python版)KNN算法基础思想前面文章可以参考,这里主要讲解java和python的两种简单实现,也主要是理解简单的思想。 http://blog.csdn.net/u011067360/article/d
    网友分享于:2015-05-25 20:52:57
  • 数据仓库简介-构成
    数据仓库简介---组成    数据仓库的组成部分有:针对数据源的分析、数据的迁移、数据的存储结构、元数据管理等。 数据源分析:业务系统的源数据通常来自企业的内部信息和外部信息。内部信息指来自企业的生产数据和历史归档数据;而企业的生产数据有可能来自于不同的业务系统,如何将这些业务数据进行标准
    网友分享于:2015-08-26 14:41:55
  • 数据仓库简介-数据集市
    数据仓库简介---数据集市 一、数据集市定义     数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。 独立型数据集市:数据来自于操作型数据库,是为了满足特殊用户而建立的
    网友分享于:2015-05-19 20:39:03
  • 推荐数据挖掘入门教本《数据挖掘与机器学习 WEKA应用技术与实践》
    推荐数据挖掘入门教材《数据挖掘与机器学习 WEKA应用技术与实践》该书由于去年刚出比较新,所以很难在网上下载到电子书,本人很幸运找到了前两章的电子版,而第二章又是本书的关键,所以建议大家先看看第二章,如果觉的写的好,可以再买书,或寻求电子版的全书,
    网友分享于:2015-05-19 20:39:03
  • 数据仓库课题(8)-维度属性选择之维护历史是否应该保留
    数据仓库专题(8)-维度属性选择之维护历史是否应该保留 一、背景   数据仓库建模过程中,针对事务型事实表设计,经常会遇到维度属性选择的问题,比如客户维度,在操作型系统中,为了跟踪客户状态的变化,往往会附加客户记录的四个属性:    &nb
    网友分享于:2015-05-14 22:20:26
  • 斯坦福数据挖掘(1)
    斯坦福数据挖掘(一)斯坦福大学的ppt。
    网友分享于:2015-05-13 22:51:19
  • 每天定时导入hive数据仓库的自动化脚本
    每日定时导入hive数据仓库的自动化脚本[Author]: kwu  每日定时导入hive数据仓库的自动化脚本 创建shell脚本,创建临时表,装载数据,转换到正式的分区表中: #!/bin/sh # upload logs to hdfs yesterday=`date --date='1
    网友分享于:2015-05-11 22:56:11
  • 机器学习与数据挖掘-logistic回归及手写识别范例的实现
    机器学习与数据挖掘-logistic回归及手写识别实例的实现本文主要介绍logistic回归相关知识点和一个手写识别的例子实现 一、logistic回归介绍: logistic回归算法很简单,这里简单介绍一下: 1、和线性回归做一个简单的对比 下图就是一个简单的线性回归实例,简单一点就是
    网友分享于:2015-05-11 06:20:08
  • 数据挖掘报刊、论坛、博客、数据集
    数据挖掘期刊、论坛、博客、数据集在数据挖掘:概念、模型、方法和算法这本书中,作者推荐了一些国外的期刊,论坛,博客,数据集,现在把可以进入网页的分享到csdn博客上。 一、数据挖掘期刊 1、Data Mining and Knowledge Discovery http://www
    网友分享于:2015-05-05 23:09:42
  • 数据挖掘之决策树算法ID3算法的有关原理
    数据挖掘之决策树算法ID3算法的相关原理ID3决策树:针对属性选择问题,是决策树算法中最为典型和最具影响力的决策树算法。 ID3决策树算法使用信息增益度作为选择测试属性。 其中p(ai) 表示ai 发生的概率。 假设有n个互不相容的事件a1,a2,a3,….,an,它们中有且仅有一
    网友分享于:2015-05-04 22:46:40
  • 数据仓库课题(6)-数据仓库、主题域、主题概念与定义
    数据仓库专题(6)-数据仓库、主题域、主题概念与定义一、数据仓库       关于数据仓库概念的标准定义业内认可度比较高的,是由数据仓库之父比尔·恩门(Bill Inmon)在1991年出版的“Building
    网友分享于:2015-04-28 03:01:09
  • 数据挖掘算法之关联规则开掘(一)apriori算法
    数据挖掘算法之关联规则挖掘(一)apriori算法关联规则挖掘算法在生活中的应用处处可见,几乎在各个电子商务网站上都可以看到其应用 举个简单的例子 如当当网,在你浏览一本书的时候,可以在页面中看到一些套餐推荐,本书+有关系的书1+有关系
    网友分享于:2015-04-25 22:04:18
  • 数据挖掘算法之关联规则开掘(二)FPGrowth算法
    数据挖掘算法之关联规则挖掘(二)FPGrowth算法之前介绍的apriori算法中因为存在许多的缺陷,例如进行大量的全表扫描和计算量巨大的自然连接,所以现在几乎已经不再使用 在mahout的算法库中使用的是PFP算法,该算法是FPGrowth算法
    网友分享于:2015-04-25 22:04:18
  • 急kettle 运行一段时间,报数据库连接异常
    急kettle 运行一段时间,报数据库连接错误Unexpected error rolling back the database connection.    org.pentaho.di.core.e
    网友分享于:2015-04-22 21:50:21
  • 数据仓库专题(5)-怎么构建主题域模型原则之站在巨人的肩上(一)IBM-FSDM主题域模型划分
    数据仓库专题(5)-如何构建主题域模型原则之站在巨人的肩上(一)IBM-FSDM主题域模型划分 一、前言       如何构建主题域模型原则是构建企业级数据仓库重要的议题,最好的路径就是参照成熟的体系。IBM金融数据模型数据存储模型FSDM,
    网友分享于:2015-04-22 21:50:21
  • 数据挖掘算法小结
    数据挖掘算法总结一、关联规则挖掘 1、 Apriori算法 (1)Apriori算法原理 Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该
    网友分享于:2015-04-21 23:09:54
  • 数据仓库专题(5)-怎么构建主题域模型原则之站在巨人的肩上(二)NCR FS-LDM主题域模型划分
    数据仓库专题(5)-如何构建主题域模型原则之站在巨人的肩上(二)NCR FS-LDM主题域模型划分一、前言       分布式数据仓库模型的架构设计,受分布式技术的影响,很多有自己特色的地方,但是在概念模型和逻辑模型设计方面,还是有
    网友分享于:2015-04-21 23:09:54
  • 数据仓库课题(4)-分布式数据仓库事实表设计思考-讨论精华
    数据仓库专题(4)-分布式数据仓库事实表设计思考---讨论精华 一、前言   上一篇分享博文《数据仓库专题(3)--分布式数据仓库事实表设计思考》后,陆续有各位兄弟参加大讨论,提出了各种问题,关于分布式环境下,维表和事实表设计,进行了比较深
    网友分享于:2015-04-21 23:09:54
  • 数据仓库课题(1)-数据仓库生命周期模型
    数据仓库专题(1)-数据仓库生命周期模型 一、前言   工作内容的变更,导致重新回到数据仓库模型的架构和设计,于是花点时间比较系统的回顾数据仓库建模和系统建设的知识体系,记录下来,作为笔记吧。 二、模型   无论数据仓库技术如何变化,从RDBMS到No
    网友分享于:2015-04-21 02:28:07
做程序猿的老婆应该注意的一些事情
做程序猿的老婆应该注意的一些事情
程序员眼里IE浏览器是什么样的
程序员眼里IE浏览器是什么样的
程序猿的崛起——Growth Hacker
程序猿的崛起——Growth Hacker
团队中“技术大拿”并非越多越好
团队中“技术大拿”并非越多越好
程序员周末都喜欢做什么?
程序员周末都喜欢做什么?
要嫁就嫁程序猿—钱多话少死的早
要嫁就嫁程序猿—钱多话少死的早
程序员和编码员之间的区别
程序员和编码员之间的区别
10个调试和排错的小建议
10个调试和排错的小建议
60个开发者不容错过的免费资源库
60个开发者不容错过的免费资源库
“肮脏的”IT工作排行榜
“肮脏的”IT工作排行榜
程序员最害怕的5件事 你中招了吗?
程序员最害怕的5件事 你中招了吗?
我跳槽是因为他们的显示器更大
我跳槽是因为他们的显示器更大
我是如何打败拖延症的
我是如何打败拖延症的
Google伦敦新总部 犹如星级庄园
Google伦敦新总部 犹如星级庄园
老程序员的下场
老程序员的下场
如何区分一个程序员是“老手“还是“新手“?
如何区分一个程序员是“老手“还是“新手“?
当下全球最炙手可热的八位少年创业者
当下全球最炙手可热的八位少年创业者
 程序员的样子
程序员的样子
程序员应该关注的一些事儿
程序员应该关注的一些事儿
5款最佳正则表达式编辑调试器
5款最佳正则表达式编辑调试器
那些性感的让人尖叫的程序员
那些性感的让人尖叫的程序员
老美怎么看待阿里赴美上市
老美怎么看待阿里赴美上市
“懒”出效率是程序员的美德
“懒”出效率是程序员的美德
那些争议最大的编程观点
那些争议最大的编程观点
如何成为一名黑客
如何成为一名黑客
科技史上最臭名昭著的13大罪犯
科技史上最臭名昭著的13大罪犯
亲爱的项目经理,我恨你
亲爱的项目经理,我恨你
为啥Android手机总会越用越慢?
为啥Android手机总会越用越慢?
旅行,写作,编程
旅行,写作,编程
总结2014中国互联网十大段子
总结2014中国互联网十大段子
程序员都该阅读的书
程序员都该阅读的书
程序员的一天:一寸光阴一寸金
程序员的一天:一寸光阴一寸金
Java 与 .NET 的平台发展之争
Java 与 .NET 的平台发展之争
2013年美国开发者薪资调查报告
2013年美国开发者薪资调查报告
每天工作4小时的程序员
每天工作4小时的程序员
2013年中国软件开发者薪资调查报告
2013年中国软件开发者薪资调查报告
程序员必看的十大电影
程序员必看的十大电影
10个帮程序员减压放松的网站
10个帮程序员减压放松的网站
漫画:程序员的工作
漫画:程序员的工作
聊聊HTTPS和SSL/TLS协议
聊聊HTTPS和SSL/TLS协议
Java程序员必看电影
Java程序员必看电影
为什么程序员都是夜猫子
为什么程序员都是夜猫子
程序员的鄙视链
程序员的鄙视链
初级 vs 高级开发者 哪个性价比更高?
初级 vs 高级开发者 哪个性价比更高?
编程语言是女人
编程语言是女人
Web开发者需具备的8个好习惯
Web开发者需具备的8个好习惯
看13位CEO、创始人和高管如何提高工作效率
看13位CEO、创始人和高管如何提高工作效率
中美印日四国程序员比较
中美印日四国程序员比较
不懂技术不要对懂技术的人说这很容易实现
不懂技术不要对懂技术的人说这很容易实现
软件开发程序错误异常ExceptionCopyright © 2009-2015 MyException 版权所有