LoongCollector

1804
下载
LoongCollector 是阿里云可观测性团队所开源的项目,是一款集卓越性能、超强稳定性和灵活可编程性于一身的数据采集器,专为构建下一代可观测 Pipeline 设计。它继承了 iLogtail 强大的日志采集与处理能力,从原来单一日志场景,逐步扩展为可观测数据采集、本地计算、服务发现的统一体。愿景是:打造业界领先的“统一可观测 Agent”与“端到端可观测”

多行切分



简介

processor_split_log_regex processor插件实现多行日志(例如Java程序日志)的采集。

备注:建议使用正则加速分隔符加速插件中的多行切分功能替代。 单独与非加速插件配合时,该插件必须设置为processor的第一个插件。

版本

Stable

配置参数

参数类型是否必选说明
TypeString插件类型
SplitKeyString切分依据的字段。
SplitRegexString

行首正则,只有匹配上的才认为是多行日志块的行首。

默认为.*,表示每行都进行切分。

PreserveOthersBoolen是否保留其他非SplitKey字段。
NoKeyErrorBoolean无匹配的原始字段时是否报错。如果未添加该参数,则默认使用false,表示不报错。

样例

采集/home/test-log/路径下的multiline.log文件,并按行首正则进行多行切分。

  • 输入
Terminal window
echo -e '[2022-03-03 18:00:00] xxx1\nyyyyy\nzzzzzz\n[2022-03-03 18:00:01] xxx2\nyyyyy\nzzzzzz' >> /home/test-log/multiline.log
  • 采集配置
enable: true
inputs:
- Type: input_file
FilePaths:
- /home/test-log/*.log
processors:
- Type: processor_split_log_regex
SplitRegex: \[\d+-\d+-\d+\s\d+:\d+:\d+]\s.*
SplitKey: content
PreserveOthers: true
flushers:
- Type: flusher_stdout
OnlyStdout: true
  • 输出
{
"__tag__:__path__": "/home/test-log/multiline.log",
"content": "[2022-03-03 18:00:00] xxx1\nyyyyy\nzzzzzz\n",
"__time__": "1657367638"
}
{
"__tag__:__path__": "/home/test-log/multiline.log",
"content": "[2022-03-03 18:00:01] xxx2\nyyyyy\nzzzzzz",
"__time__": "1657367638"
}

observability.cn Authors 2024 | Documentation Distributed under CC-BY-4.0
Copyright © 2017-2024, Alibaba. All rights reserved. Alibaba has registered trademarks and uses trademarks.
浙ICP备2021005855号-32