自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

程序员成长史

不定期分享Java、大数据等技术,个人成长、知识变现等

转载 Solrj日期范围查询

在做根据日期来检索的时候普通的格式化会出错,试了好多种只有一种可行

2014-12-30 13:22:14 1918 0

原创 HBase总结(二十)HBase常用shell命令详细说明

进入hbase shell console $HBASE_HOME/bin/hbase shell 如果有kerberos认证,需要事先使用相应的keytab进行一下认证(使用kinit命令),认证成功之后再使用hbase shell进入可以使用whoami命令可查看当前用户 ...

2014-12-23 11:49:24 7332 0

原创 解决maven引用jdk中的tools.jar报Missing artifact的问题

很多框架都会依赖jdk中的tools.jar,但是maven仓库中却没有.     如在eclipse+maven编写mapreduce代码,就会报Missing artifact jdk.toos:jdk.toos:jar:1.6     如何解决这个问题呢,只需要在项目的pom.xml ...

2014-12-22 19:12:58 1845 1

原创 Solr 报错:RemoteSolrException: Expected mime type application/octet-stream but got text/html

1、RemoteSolrException: Expected mime type application/octet-stream but got text/html 现象: SLF4J: Failed to load class "org.slf4j.impl.Sta...

2014-12-22 19:02:59 10394 5

原创 window下部署Solr

主要步骤如下: 1、下载solr-4.7.2.zip;下载地址:http://archive.apache.org/dist/lucene/java/ 2、解压缩solr-4.7.2.zip,解压后目录结构如下: 3、将example/webapps目录下的solr.war复制到tomcat的we...

2014-12-21 14:39:03 2336 0

原创 apache lucene solr 官网历史版本下载地址

lucene的历史版本下载地址: http://archive.apache.org/dist/lucene/java/  solr的历史版本下载地址: http://archive.apache.org/dist/lucene/solr/

2014-12-20 23:13:13 8929 2

原创 布隆过滤器总结(三)Java代码实现

/** * 项目名:SpiderCrawler * 文件名:BloomFilterTest.java * 作者:zhouyh * 时间:2014-8-29 下午02:54:56 * 描述:TODO(用一句话描述该文件做什么) */ package com.utilTest...

2014-12-19 11:24:41 1801 1

原创 布隆过滤器总结(二)原理和例子

布隆过滤器用于字符串去重复,比如网络爬虫抓取时URL去重、邮件提供商反垃圾黑名单Email地址去重。等等。用哈希表也可以用于元素去重,但是占用空间比较大,而且空间使用率只有50%。   布隆过滤器只占哈希表的1/8或1/4的空间复杂度,就能解决同样的问题,但是有一定的误判,而且不能删除已有元素。...

2014-12-19 11:19:55 5070 0

转载 布隆过滤器总结(一)详解

布隆过滤器(Bloom Filter)详解   布隆过滤器[1](Bloom Filter)是由布隆(Burton Howard Bloom)在1970年提出的。它实际上是由一个很长的二进制向量和一系列随机映射函数组成,布隆过滤器可以用于检索一个元素是否在一个集合中。它的优...

2014-12-19 11:11:34 6492 0

转载 Redis初始

一、QuickStart 1、Redis简介:   redis是一个性能非常优秀的内存数据库,通过key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --...

2014-12-16 19:06:21 1108 0

原创 JAVA中的队列

在java5中新增加了java.util.Queue接口,用以支持队列的常见操作。该接口扩展了java.util.Collection接口。 Queue使用时要尽量避免Collection的add()和remove()方法,而是要使用offer()来加入元素,使用poll()来获取并移出元素。它...

2014-12-15 21:46:46 821 0

转载 Hadoop架构和设计要点

一、前提和设计目标 1、硬件错误是常态,而非异常情况,HDFS可能是有成百上千的server组成,任何一个组件都有可能一直失效,因此错误检测和快速、自动的恢复是HDFS的核心架构目标。 2、跑在HDFS上的应用与一般的应用不同,它们主要是以流式读为主,做批量处理;比之关注数据访问的低延...

2014-12-14 16:10:03 1748 0

转载 JDK8 十大新特性

本教程将用带注释的简单代码来描述新特性,你将看不到大片吓人的文字。 一、接口的默认方法 Java 8允许我们给接口添加一个非抽象的方法实现,只需要使用 default关键字即可,这个特征又叫做扩展方法,示例如下: 复制代码 代码如下: interface Formula { ...

2014-12-14 15:24:34 9253 0

转载 HBase总结(十九)数据导入方式

*). Client API实现 借助HBase的Client API来导入, 是最简易学的方式. Configuration config = HBaseConfiguration.create(); // 配置hbase.zookeeper.quorum: 后接zookeeper集...

2014-12-09 21:55:28 16913 0

提示
确定要删除当前文章?
取消 删除