google guava类库介绍 发表于 2015-07-26 | 分类于 java | | 阅读次数 Guava是一个Google开发的基于java的扩展项目,提供了很多有用的工具类,可以让java代码更加优雅,更加简洁 ... 阅读全文 »
java内置的线程池笔记 发表于 2015-07-24 | 分类于 java | | 阅读次数 写这篇博客的时候又刚好想起了当时自己实习的时候遇到的一个问题。1000个爬虫任务使用了多线程的处理方式,比如开5个线程处理这1000个任务 ... 阅读全文 »
Flume几个比较有用的功能和一些坑(用到新功能后会更新文章) 发表于 2015-07-14 | 分类于 flume | | 阅读次数 根据项目的经验,介绍几个flume比较有用的功能... 阅读全文 »
Elasticsearch入门 发表于 2015-07-12 | 分类于 elasticsearch | | 阅读次数 Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,使用RESTful web暴露接口 ... 阅读全文 »
Flume运行过程源码分析 发表于 2015-07-07 | 分类于 flume | | 阅读次数 Flume运行的主类是org.apache.flume.node.Application的main方法 ... 阅读全文 »
Flume Sink组件分析 发表于 2015-06-23 | 分类于 flume | | 阅读次数 Flume内置了很多Sink,比如HDFS Sink, Hive Sink, File Roll Sink, HBase Sink, ElasticSearch Sink等 ... 阅读全文 »
Flume Channel组件分析 发表于 2015-06-22 | 分类于 flume | | 阅读次数 Flume内置了很多Channel,比如Memory Channel, JDBC Channel, Kafka Channel, File Channel等 ... 阅读全文 »
Flume Source组件分析 发表于 2015-06-21 | 分类于 flume | | 阅读次数 Flume内置了很多Source,比如Avro Source,Spooling Directory Source,NetCat Source,Kafka Source等 ... 阅读全文 »
Flume介绍 发表于 2015-06-21 | 分类于 flume | | 阅读次数 Flume是一个分布式的,效率高的用来收集日志数据的开源框架。它的架构是基于流式数据,有3个重要的组件,分别是Source,Channel和Sink 阅读全文 »