Mryqu's Notes


  • 首页

  • 搜索
close

[Hadoop] 使用MRUnit进行MapReduce单元测试

时间: 2014-06-15   |   分类: BigData     |   阅读: 16 字 ~1分钟
MRUnit介绍 MRUnit是一个用于帮助开发者进行HadoopMapReduce作业单元测试的Java库。它是JUnit架构扩展,无需将代码运行在集群上即可在开发环境测试Mapper和Reducer类的功能。MRUnit由Cloudera开发,并在2012年成为Apache基金会顶级项目。 MRUnit使用LocalJobRunner使用样本数据集模拟一次Mapper/Reducer执行过程。通过定义一或多个输入记录,使用LocalJobRunner运行测试代码,判定是否与期望输出相符。如相符,则安静退出;否则,默认抛出异常。 测试代码 本测试代码基于MRUnit指南中示例代码修改而成,使用junit:junit:4.11和org.apache.mrunit:mrunit:1.1.0:hadoop2两个Java库进行编译和测试。 SMSCDR.java SMSCDRMapperReducerTest 执行测试 成功测试演示 失败测试演示 为了演示测试失败情况,我将testReducer方法中期望值改为错误值123。 参考 Apache MRUnit MRUnit Tutorial

数据科学:学习路径和图书

时间: 2014-06-06   |   分类: DataScience     |   阅读: 1 字 ~1分钟
转发网上的两个图片,时时对照学习。

slidify

时间: 2014-06-03   |   分类: DataScience     |   阅读: 23 字 ~1分钟
Slidify是使用RMarkdown创建、定制和发布(用于可重复性研究的)HTML幻灯片的工具包。 Slidify支持多种生成框架和主题: |幻灯片生成框架|主题 |—– |io2012| |html5slides|default, uulm |html5rocks| |deck.js|web2.0, swiss, neon |dzslides| |landslide|default, tango, clean |shower|ribbon |slidy| |slideous| |beamer| |showoff| 生成的幻灯片可以发布到Github、Dropbox和Rpubs上。命令集成了一些底层操作,所以很简单。见http://slidify.org/publish.html 前一段发布一个幻灯片碰到些麻烦,只好采用git命令行这种老方式。操作步骤参考如下链接: https://github.com/ramnathv/slidify/wiki/Publishing

shiny练习

时间: 2014-06-02   |   分类: DataScience     |   阅读: 15 字 ~1分钟
Shiny是RStudio公司开发的新包,有了它,无需web开发就可以用R语言轻松开发交互式web应用。 我参加数据科学专业课学习,使用shiny完成一个作业,虽然初学乍练,也能感觉到开发起来很快速。 参考 shiny tutorialshiny examples Linear Regressions and Linear Models using the Iris Data

[JavaScript] JQuery AJAX在HTTP响应200OK时却调用了errorcallback

时间: 2014-05-25   |   分类: FrontEnd     |   阅读: 173 字 ~1分钟
运行如下代码时,从结果看操作成功,但是总是调用错误处理回调。 myTest = function(server, lib, table, reqParam, reqInfo, successCallback, errorCallback) { var url = "http://localhost/mytest/" + encodeURIComponent(server) + "/libs/" + encodeURIComponent(lib) + "/tables/" + encodeURIComponent(table); if (reqParam!=undefined && reqParam) { url += "?reqParam=" + encodeURIComponent(reqParam); } $.ajax({ cache: false, url: url, type: "PUT", data: JSON.stringify(reqInfo), contentType: "application/json", success: function (data) { if (successCallback!==undefined && successCallback) { successCallback(data); } else { console.log("success:"+JSON.stringify(data)); } }, error: function (xhr, status, error) { if (errorCallback!
阅读全文 »

QuickEdit mode of command prompt

时间: 2014-05-17   |   分类: Tool     |   阅读: 3 字 ~1分钟
从Windows命令行复制内容每次都需要点击Edit菜单中的Mark子菜单项,颇为不便。 原来这个行为可以通过属性对话框中的QuickEdit mode改变:

[Hadoop] 在MapReduce中使用HBase数据

时间: 2014-05-11   |   分类: BigData     |   阅读: 43 字 ~1分钟
对于MapReduce程序来说,除了可以用HDFS文件系统作为输入源和输出目标,同样可以使用HBase作为输入源和输出目标。下面做一个小练习进行学习。 MapReduceOnHBaseDemo.java rebuild.sh #!/bin/bash CLASSPATH=.:$(hbase classpath):$(hadoop classpath) javac -d classes -cp $CLASSPATH *.java jar -cvf YquMapreduceDemo.jar -C classes/ . 测试 执行下列命令运行MapReduce作业: HADOOP_CLASSPATH=$(hbase mapredcp):${HBASE_HOME}/conf hadoop jar YquMapreduceDemo.jar MapReduceOnHBaseDemo -libjars $(hbase mapredcp | tr ':' ',') HBase结果如下: 与普通MapReduce程序的差异 本例中ScoreMapper类继承自抽象类TableMapper。TableMapper是Mapper抽象类的子类,指定输入键类型为ImmutableBytesWritable,输入值类型为Result。因此ScoreMapper类定义仅指定输出键和值类型,而其mapper方法前两个参数为ImmutableBytesWritable和Result类型。 本例中ScoreReducer类继承自抽象类TableReducer。TableReducer是Reduccer抽象类的子类,指定输出值类型为Mutation。因此ScoreReducer定义仅指定输入键和值、输出键的类型。有下图可知,TableReducer输出值类型支持Append、Delete、Increment和Put。 本例中Driver部分通过TableMapReduceUtil类的initTableMapperJob和initTableReducerJob方法合并Hadoop和HBase配置,配置job属性。 参考 HBase and MapReduce

JDBC连接池的testQuery/validationQuery设置

时间: 2014-05-07   |   分类: Service+JavaEE     |   阅读: 105 字 ~1分钟
在《Tomcat中使用Connector/J连接MySQL的超时问题》帖子中想要增加对连接池中连接的测试/验证,防止数据库认为连接已死而Web应用服务器认为连接还有效的问题,Mysql文档中提到Tomcat文档中的例子中用的是validationQuery,但是网上还有很多帖子写的是testQuery,到底用哪一个呢? 原来这跟连接池的实现有关: |连接池实现|该功能属性名 |—– |The Tomcat JDBC Connection Pool|validationQuery |The Apache Commons DBCP Connection Pool|validationQuery |c3p0 - JDBC3 Connection and Statement Pooling|preferredTestQuery | Atomikos:Tomcat Spring ActiveMQ MySQL JMX Integration 分析Atomikos数据连接池源码,弄清testQuery|testQuery 此外,测试/验证连接池连接的SQL语句也因数据库而异: Efficient SQL test query or validation query that will work across all (or most) databases DBCP - validationQuery for different Databases 综合上述两个帖子,汇总结果如下: |数据库|测试/验证查询 |—– |MySQL|SELECT 1 |PostgreSQL|SELECT 1 |Microsoft SQL Server|SELECT 1 |SQLite|SELECT 1 |H2|SELECT 1 |Ingres|SELECT 1 |Oracle|select 1 from dual |DB2|select 1 from sysibm.
阅读全文 »

Tomcat中使用Connector/J连接MySQL的超时问题

时间: 2014-05-05   |   分类: Service+JavaEE   Web Application Server     |   阅读: 238 字 ~2分钟
最近玩的一个Web项目,上一个晚上做一些操作,第二天超时需要再登陆,却总是报密码不正确。需要重启tomcat才能解决。异常如下: Caused by: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: The last packet successfully received from the server was 442,814,107 milliseconds ago. The last packet sent successfully to the server was 442,814,107 milliseconds ago. is longer than the server configured value of 'wait_timeout'. You should consider either expiring and/or testing connection validity before use in your application, increasing the server configured values for client timeouts, or using the Co nnector/J connection property 'autoReconnect=true' to avoid this problem.
阅读全文 »

网络资源(主力书籍)

时间: 2014-05-04   |   阅读: 19 字 ~1分钟
外文书籍 Library Genesis BookZZ 爱挖盘 manybooks 14个值得收藏可免费搜索/下载PDF电子图书(文档)的搜索引擎 图书馆 全球免费开放的电子图书馆 古籍 书格 专利 史上最完整的专利信息数据库网址大全 杂志 http://pdfmagazines.org/ http://www.gqzzw.com/ http://www.pdfzj.com/ http://pdf-giant.com/ http://www.magazine6.com/
43 44 45 46 47 48 49 50 51

Programmer & Architect

662 日志
27 分类
1472 标签
RSS 订阅
GitHub Twitter FB Page
© 2009 - 2023 Mryqu's Notes
Powered by - Hugo v0.120.4
Theme by - NexT
0%