flume 参考文档 (三)

系统 1385 0

Flume Source

   

   

1、Flume’s Tiered Event Sources

collectorSource[( port )]

Collector source,监听端口汇聚数据

autoCollectorSource

通过master协调物理节点自动汇聚数据

logicalSource

逻辑source,由master分配端口并监听rpcSink

   

   

 

2、Flume’s Basic Sources

null

 

console

监听用户编辑历史和快捷键输入,只在node_nowatch模式下可用

stdin

监听标准输入,只在node_nowatch模式下可用,每行将作为一个event source

rpcSource( port )

由rpc框架(thrift/avro)监听tcp端口

text(" filename ")

一次性读取一个文本,每行为一个event

tail(" filename "[, startFromEnd =false])

每行为一个event。监听文件尾部的追加行,如果startFromEnd为true,tail将从文件尾读取,如果为false,tail将从文件开始读取全部数据

multitail(" filename "[, file2 [, file3 … ] ])

同上,同时监听多个文件的末尾

tailDir(" dirname "[, fileregex=".*"[, startFromEnd=false[, recurseDepth=0]]])

监听目录中的文件末尾,使用正则去选定需要监听的文件(不包含目录),recurseDepth为递归监听其下子目录的深度

seqfile(" filename ")

监听hdfs的sequencefile,全路径

syslogUdp( port )

监听Udp端口

syslogTcp( port )

监听Tcp端口

syslogTcp1( port )

只监听Tcp端口的一个链接

execPeriodic(" cmdline ", ms )

周期执行指令,监听指令的输出,整个输出都被作为一个event

execStream(" cmdline ")

执行指令,监听指令的输出,输出的每一行被作为一个event

exec(" cmdline "[, aggregate =false[, restart =false[, period =0]]])

执行指令,监听指令的输出,aggregate如果为true,整个输出作为一个event如果为false,则每行作为一个event。如果restart为true,则按period为周期重新运行

synth( msgCount , msgSize )

随即产生字符串event,msgCount为产生数量,msgSize为串长度

synthrndsize( msgCount , minSize , maxSize )

同上,minSize – maxSize

nonlsynth( msgCount , msgSize )

 

asciisynth( msgCount , msgSize )

Ascii码字符

twitter(" username "," pw "[," url "])

尼玛twitter的插件啊

irc(" server ", port , " nick "," chan ")

 

scribe[(+ port )]

Scribe插件

report[(periodMillis)]

生成所有physical node报告为事件源

flume 参考文档 (三)


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论