您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
sls是什么-sls是什么船司
数据,客户,阿里sls是什么-sls是什么船司
发布时间:2019-02-08加入收藏来源:互联网点击:
针对这些不同的客户场景,我们进行了需求的归纳:
第一,数据的准备需要统一的方案:提供数据的统一采集、清洗方案;第二,数据的存储与分析:我们怎么样利用分析与建模的能力,提供不同数据的统一与关联分析能力,得到分析结果,并能够提供多种方式来呈现。这些呈现的分析结果,如何进行汇总,形成一个处理的Action。需要解决的问题
在面对管理“复杂的IT系统”的挑战,我们主要解决三个问题:
工具碎片化:构建可观测数据的分析系统中,我们会遇到工具太碎片化的问题。比如,不同的监控指标、日志数据的采集、存储,需要不同的工具,整个方案的复杂也很高;接入与分析过程面临扩展、能、不统一的问题:这些数据不同流程的链接、可扩展能力、分析能上如何提升,具备秒级大规模、实时的能力;判断与处理分析机器学习能力的应用:面对系统需要监控的对象、分析的数据越来越多的情况下,我们怎么利用一些算法,降低复杂度、减少噪声,解决人工规则无法覆盖的问题,减少整个分析的过程。总结下来,我们设计时,需要解决“系统的构建问题”与“算力+算法的问题”。
系统的构建问题:解决工具碎片化导致的数据接入、流转、分析等系统构建的复杂与孤岛问题;算力+算法的问题:提供大规模、实时、智能化的分析能力。SLS 产品功能大图针对这些设计目的,SLS产品大图架构,主要分为几个部分:
数据管道 - 采集与分发:海量数据的采集、加工、分发管道,也是SLS 最先服务客户的场景。SLS 对接了各类数据源上游系统,包括log、metric、 trace可观测“三大支柱”的开源与云产品数据源、以及开放告警、审计数据源;数据平台-可观测数据存储与分析平台:SLS 提供可观测数据统一存储、关联查询分析能力,解决不同类的可观测数据散落不同的存储分析系统,形成数据孤岛难以关联的问题;ITOM支持横向能力:面对运维场景客户需要,SLS 提供了基于机器学习的AIOps 巡检能力、告警管理中心。AIOps 巡检能力,解决人工阈值规则,无法完全覆盖的问题,通过智能巡检发现隐患。告警管理中心,解决告警风暴降低噪声,并支持对接三方告警,提供告警分派、升级,支持排版表等能力,支撑客户进行告警事件的统一管理;场景应用“Demo”:SLS 支持客户不同方式的集成,从数据管道、数据存储分析平台,或者使用开箱即用的应用模板,如云产品可观测应用模板、开发运维类应用模板(如Trace服务、移动端诊断监控)、日志审计、成本管家等。这里的“Demo”指的是客户是可以参考这些应用模板,包括其中各个报表的SQL 等,基于SLS 的上下游生态开发对接、灵活查询分析能力,二次开发出自己的应用,并将SLS 嵌入到企业自己的日志分析、运维管理等系统中。接下来,我们简单介绍下,这几个部分的能力。
数据管道 - 采集兼容对接各类数据源,并提供海量数据实时采集、加工、分发的能力
兼容对接各类数据源系统
针对于Log、Metric、Trace、三放告警等数据源,SLS提供统一的采集能力,覆盖各种端,兼容各种开源采集协议。其中,2021年,SLS开源了采集 Agent ilogtail。
同时,SLS 服务也提供了全球加速采集的能力,支持客户全球化应用,高效地进行数据采集。
海量采集、加工、流转管道
数据采集后,SLS还提供数据加工、投递消费。
数据加工:客户对数据加工清洗,比如过滤、脱敏、富化等;投递与消费:实时消费订阅,对接Flink 等这种开源的引擎,数据投递到OSS 数据湖等进行进一步分析等。可观测数据平台 - 可观测数据的统一存储与关联分析
统一的可观测存储
SLS 可观测数据平台的设计,其中很重要一点,就是提供统一的“可观测存储”,支持不同类型的可观测数据(Log/Metric/Trace等)统一存储在SLS。客户不再需要针对不同的可观测数据,去建设不同的存储系统,使用不同的方式去查询分析。
高效智能的关联查询分析
SLS 可观测数据平台,支持查询检索、SQL 统计分析、PromQL、AI 算子等能力,提供高能、智能的关联查询分析。
统一分析:通过一套系统,即可支持多种数据的检索、统计分析需要,无需来回切换,效率更高;数据关联:支持多种可观测数据的关联分析,获得更多洞察;高能:实时分析、百亿级记录秒级检索;内置算子:内置各类算子,支持自动聚类等,提升分析效率。ITOM横向支撑 - 智能巡检与告警中心
AIOps智能巡检
我们基于机器学习,提供AIOps 能力,支撑客户构建智能运维系统。SLS 智能巡检,对于Metric、Log等数据都可以进行智能巡检发现隐患,解决人工设置阈值无法覆盖的问题。同时,智能巡检支持反馈优化,通过客户对于巡检结果的点击与处理反馈,模型会自动适配客户的数据与场景。
一站式告警中枢
刚才的讨论中有很多客户也提到,需要解决不同系统产生的告警事件的统一管理与处理问题。2021年,SLS 也发布了一站式的智能告警中心。它是开放的告警中枢,不只是对接SLS 中各类数据产生的告警,也可以对接阿里云上其他系统触发的告警、客户已有系统的告警(比如Zabbix 告警事件等)。
同时,SLS 告警中心提供:
全局监控:多告警源的全局监控;告警降噪:包括去重、抑制、合并等提升处理效率;动态分配:多条件、升级、分派,并结合排班表等,完成告警的动态分配。小结2022年,SLS 的产品更新计划会继续围绕上文提及的几块来发展。SLS 会继续支持客户采用不同的方式来集成SLS ,客户可以使用SLS 或基于SLS 开发构建自己的日志/Metric /Trace 等数据分析平台或运维、运营分析系统。(正文完)
本文到此结束,希望对大家有所帮助呢。
上一篇:夏世忠-硖石中学
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |