Google采用开源标准OpenTelemetry构建高吞吐量代理

Google云计算发布新的监控代理Ops Agent,这是采用开放标准OpenTelemetry构建而成,易于安装、管理和配置,将会打破Cloud Logging和Cloud Monitoring两服务,还有操作系统之间的界线。Google提到,这个新代理会取代旧有的日志记录和监控代理。

Ops Agent现在是Google推荐使用的代理,能最大程度向后兼容,具有显著提升的日志记录吞吐量,可以避免内存不足错误,并防止资料丢失,官方提到,Ops Agent在日志和指标提供简单的YAML配置,因此日志记录和监控工具间将拥有更高的一致性,并且也在各Linux发布版本和Windows提供一致的功能集。使用新代理,用户只需要下载、安装和维护一个代理,不用像过去一样,需要使用日志记录和监控两个代理。

Ops Agent的另一项特色,则是使用快速发展的OpenTelemetry,OpenTelemetry目前为CNCF旗下的开源项目,中立于任何供应商的技术,受到许多供应商的支持。官方提到,由于企业开始扩展使用云、混合云和多云基础架构,运营者和开发者必需要处理各种代理,其中包含各式协议,以及截取各种指标、日志和关注资料,采用OpenTelemetry的Ops Agent简化了这些工作。

Google也特别使用Fluent Bit来加大吞吐量以及资源使用效率,Fluent Bit是一个开源日志处理器和转发器,能够与OpenTelemetry良好互补,来避免资料丢失和内存不足的错误。官方提到,经内部测试,新的Ops代理支持的吞吐量,比旧日志记录代理高15倍。这是提高底层虚拟机资源效率所获得的资料,但在较小的虚拟机上执行代理,也会更经济有效率。

Ops Agent已经与Google云计算控制台的可观察性工具预先集成,因此在虚拟机安装代理之后,主机指标、程序指标和日志,都会自动路由到Cloud Logging和Cloud Monitoring中,用户不需要执行其他额外的操作。

对于使用开源工具Ansible,来配置管理和自动化组态的用户,可以直接使用Ansible来安装Ops Agent,或是用户也可以使用基础设施即程序代码工具Terraform,利用Terraform模块在虚拟机安装和配置Ops Agent。而有托管解决方案需求的用户,Google提供了一种称为代理政策的机制,来自动化管理Ops Agent安装,目前仍在预览阶段,用户只需要输入一个指令,就可以创建政策来管理新的和现有的虚拟机,在虚拟机上正确地安装Ops Agent。