网站首页 > 文章精选 正文
我把自己以往的文章汇总成为了 Github ,欢迎各位大佬 star
https://github.com/crisxuan/bestJavaer
tail命令能够看到日志的滚动,非常方便。于是xjjdog想,既然我们能够用这个命令,看到所有的日志,那能不能使用tail命令,做日志收集呢?
想象归想象,如果你想要一个快速的实时日志收集工具,那tail确实是个非常棒的工具。它比什么flume、logstatsh,比什么filebeat之类的,快捷的多。事实上,在工具缺乏的旧年代,我就曾经这么干过,而且它工作的很好。
下面是一段使用Java语言书写的代码。我们可以按行读取日志,然后使用自己喜欢的语言,做任何事情。
import java.io.BufferedReader;
import java.io.InputStreamReader;
public class TailReader {
public static void main(String[] args) throws Exception {
ProcessBuilder ps = new ProcessBuilder("tail", "-f", "/tmp/tail0");
//把错误输出也打印
ps.redirectErrorStream(true);
Process process = ps.start();
//持续读取tail的输出
try (BufferedReader in = new BufferedReader(new InputStreamReader(process.getInputStream()))) {
String line;
while ((line = in.readLine()) != null) {
setLogToKafka(line);
//注意这里不要产生异常,否则会打断while循环
}
}
}
//模拟发送到kafka,我们这里只简单的打印出来
static void setLogToKafka(String line) {
System.out.println(line);
}
}
复制代码
主要的思想,就是使用Java的Process启动一个子tail进程,一直监控着文件的输出。然后把标准输出和标准错误流,全部定向到BufferedReader中。接下来,你能做你想要做的任何事。
这有一定的风险,假如tail命令被杀掉了,我们的Java程序就失去了作用。
程序很简单,但xjjdog在这里讨论的却不是这个简单的收集程序,而是tail命令的一些有趣的特性,你可以从中一窥一些日志收集工具对文件的特殊处理。
你知道tail -f和tail -F的区别么?
在回答这个问题之前,我们先回忆一下,Java常用的日志框架,对日志的处理。
<configuration>
<appender name="FILE" class="ch.qos.logback.core.rolling.RollingFileAppender">
<!-- Support multiple-JVM writing to the same log file -->
<prudent>true</prudent>
<rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy">
<fileNamePattern>logFile.%d{yyyy-MM-dd}.log</fileNamePattern>
<maxHistory>30</maxHistory>
<totalSizeCap>3GB</totalSizeCap>
</rollingPolicy>
<encoder>
<pattern>%-4relative [%thread] %-5level %logger{35} - %msg%n</pattern>
</encoder>
</appender>
<root level="DEBUG">
<appender-ref ref="FILE" />
</root>
</configuration>
复制代码
上面的配置,将在每晚凌晨的时候,滚动形成一个新的文件。
那这个滚动,是如何做的呢?我们可以收工模拟这个过程。
mv run.log run.2020-11-02.log
touch run.log
复制代码
测试一下
文件滚动,会生成新的文件,那tail命令还能跟踪到么?
我们来测试一下。
第一步,创建要监控的文件
touch /tmp/tail0
复制代码
第二步,启动我们的Java代码
第三步,生成一个不间断的流
watch -n 1 'echo `date` >> /tmp/tail0 '
复制代码
上面的命令每隔1秒钟,往我们的文件中打印一下当前的日期,可以看到Java端已经收到了这些数据。
第四步,模拟文件滚动
mv /tmp/tail0 /tmp/tail.bak
touch /tmp/tail0
复制代码
此时,我们可以看到,Java端此时已经接受不到数据了。
Why?
为了看到这是为什么,我们使用两个命令来看一下进程的一些状态。
首先,使用ps命令,查看当前的tail进程。
ps -ef|grep tail
501 21374 21373 0 1:51PM ?? 0:00.01 tail -f /tmp/tail0
复制代码
这正是我们的命令。
我们使用lsof命令去查看这个进程所关联的文件。
lsof -p 21374 | awk '{print $4 "\t" $9}'
FD NAME
cwd /tmp/
txt /usr/bin/tail
txt /usr/lib/dyld
3r /private/tmp/tail.bak
复制代码
我们看到tail进程所监控的文件,其实是tail.bak文件,已经和tail命令没什么关系了。
我们尝试像tail.bak输入一点内容。
echo "haha: xjjdog, i am from tail.bak" >> /tmp/tail.bak
复制代码
此时如我们所愿,Java进程有反应了,正常输出了这句话。
怎么办?
就如同我们问题中问的一样,把tail -f换成tail -F就可以了。
tail -f的意思是,根据文件描述符进行追踪。
tail -F的意思是,根据文件名进行追踪,它会有重试的动作。
所以,我们的日志收集程序,毫无疑问是根据日志名称追踪的,应该把f改成F。
End
既然知道了这些小区别,我们就对日常工作中遇到的一些灵异问题有了解释。
大家都知道rm命令,能够删除一个文件。如果有这个文件,正在被其他进程所使用,那这些文件你看起来像是删掉了,但它的内容却不释放。
lsof | grep deleted
复制代码
上面这个命令,能够看到这些失控的文件。一般你kill掉相应的进程,这些句柄也就释放了。但你删除这些文件的本意,就是为了避免重启应用,这可真让人纠结。
cat /dev/null > logpath
复制代码
所以我们在删除文件的时候,一般不会使用rm,而应该使用重定向符号。将万物皆空的/dev/null,发向它们。
作者:小姐姐味道
链接:
https://juejin.im/post/6891437856196460552
你好,我是 cxuan,一枚技术人。我一共写了六本 PDF
《Java 核心技术总结》
《HTTP 核心总结》
《程序员必知的基础知识》
《操作系统核心总结》
《Java 核心基础 2.0》
《Java 面试题总结》
现在我把百度链接给大家放出来了,大家可以点击下方的链接领取
链接: https://pan.baidu.com/s/1mYAeS9hIhdMFh2rF3FDk0A 密码: p9rs
猜你喜欢
- 2025-07-08 几种缓存更新的设计方法,值得一看
- 2025-07-08 知乎问题:如何应对桀骜不驯的优秀应届生?
- 2025-07-08 大数据Kafka技术解析(大数据为什么使用kafka)
- 2025-07-08 如何应对桀骜不驯的优秀人才?(如何对付桀骜不驯的人)
- 2025-07-08 大数据和云计算学习知识点和配套视频
- 2025-07-08 一封天才应届生的求职信!不服管教被CEO哄抢!上司反遭围攻
- 2025-07-08 大数据程序员面试都有哪些常见面试题
- 2025-07-08 知因智慧大数据面试题,真实面试分享
- 2025-07-08 Kafka 最新面试题(10道-附答案)(kafuka面试)
- 最近发表
-
- 五分钟轻松熟悉一个k8s Operator应用制作
- iLogtail 使用入门 - K8S 环境日志采集到 SLS
- k8s之配置CNI网络(k8s 网络配置)
- Linux系统K8S集群架构及常用操作命令之K9S安装及使用
- Centos 安装部署Kubernetes(K8s)(k8s环境搭建 centos)
- 集群外部署Prometheus+Grafana监控K8S解析
- k8s安装UI管理工具Kuboard安装(k8s安装步骤)
- k8s中使用Helm安装生产级别redis集群
- K8s集群(K8s集群添加新节点更新步骤)
- Kubernetes (k8s) 基本命令速查(k8s kubernetes教程)
- 标签列表
-
- newcoder (56)
- 字符串的长度是指 (45)
- drawcontours()参数说明 (60)
- unsignedshortint (59)
- postman并发请求 (47)
- python列表删除 (50)
- 左程云什么水平 (56)
- 计算机网络的拓扑结构是指() (45)
- 编程题 (64)
- postgresql默认端口 (66)
- 数据库的概念模型独立于 (48)
- 产生系统死锁的原因可能是由于 (51)
- 数据库中只存放视图的 (62)
- 在vi中退出不保存的命令是 (53)
- 哪个命令可以将普通用户转换成超级用户 (49)
- noscript标签的作用 (48)
- 联合利华网申 (49)
- swagger和postman (46)
- 结构化程序设计主要强调 (53)
- 172.1 (57)
- apipostwebsocket (47)
- 唯品会后台 (61)
- 简历助手 (56)
- offshow (61)
- mysql数据库面试题 (57)