AIOps 什么是 AIOps?
AIOps(IT 运维人工智能)是指使用机器学习 (ML) 和生成式 AI (GenAI) 之类的 AI 技术来自动识别和解决常见的 IT 问题或提高运维效率。
在网络领域,AIOps 用于满足当今现代化复杂园区、分支机构和 WFH 网络不断变化的用户和 IoT 需求。AIOps 将管理任务的自动化和网络专家的监督相结合以提高效率。
网络 AIOps 提供的可见性和自动化为 IT 组织提供了加快设计/配置任务以及预测、快速响应甚至防止网络中断所需的洞见。例如,AIOps 洞见可用于端点分析,以保障安全以及掌握相关情况,从而确保本地和云应用正常运行。
- AIOps 如何在企业网络环境中提供洞见?
- 网络 AIOps 有哪些用例?
- HPE 与 AIOps
AIOps 如何在企业网络环境中提供洞见?
AIOps 利用从各个网络和客户端设备收集的遥测数据建立基线,以便自动发现问题、确定根本原因并实时提供优化指导。
AIOps 包括采用以下 AI 技术:
- 分类 AI(包括机器学习)– 能够通过学习获知环境变化并调整适应的算法。它们能够更改或创建新算法,以便更早地发现问题并提出有效的解决方案。
- 生成式 AI (GenAI) – 通常能够根据提示使用生成式模型生成文本、图像、视频或其他数据的 AI。包括大型语言模型 (LLM) 在内的生成式 AI 模型学习输入训练数据的模式和结构,然后生成具有类似特征的新数据。OpenAI ChatGPT 就是使用 LLM 的 GenAI 示例。
通常需要大型网络遥测数据湖来有效地训练 AI 模型并进行调优。
网络 AIOps 有哪些用例?
AIOps 可帮助解决 IT 团队现今面临的诸多常见网络运营挑战。具体包括:
- 确保网络配置合规性 - 静态设备设置无法满足不断变化的业务需求。AIOps 持续不断地监控网络运行情况,并提出建议或自动执行优化更改。
- 满足不断变化的业务需求 – 手动配置服务级别期望 (SLE) 成本高昂且耗时。使用 AIOps,可以根据环境变化自动定义、监控和调整重要的网络阈值。
- 快速解决网络问题 – 大多数 IT 组织主要通过服务台来电发现问题,这样不但成本高昂,而且效率低下。通过 AIOps 提供的前瞻性洞见可及时发现问题,避免波及用户或 IoT 设备,从而减少服务台来电。
- 复现间歇性问题 – 许多 IT 团队花费数小时乃至数天时间来跟踪间歇性问题,因为这些问题很难复现。基于 AIOps 的永续运行、自动化监控通过内置的数据捕获功能,精准定位持久性问题与显而易见的问题。
- 网络愈发复杂 - IT 超过半数的时间都用于故障排除和优化任务。AIOps 通过提供故障原因、根本原因分析和维修建议等关键信息来解决这一挑战。
- 资源和技能欠缺 - 很多 IT 组织长期以来都面临资源欠缺和培训不足问题。AIOps 驱动型洞见,比如采用 GenAI 技术的搜索功能,旨在协助及增强团队知识储备。
HPE 与 AIOps
如今,企业若想高效维护网络,必须全面掌握网络情况并利用自动化技术。有 AIOps 加持,HPE Aruba Networking Central 可为您提供诸多帮助:
- 尽早识别网络、安全和应用性能问题,避免波及用户和业务。
- IT 团队不必再手动处理大量故障排除任务,工作负担大大减轻。
- 在网络发生变化,比如 IoT 设备增加或使用 Zoom 或 Teams 等更多应用时,提供优化建议。
- 采用 GenAI 技术的搜索界面能够快速简洁地解答重要问题并提供配置和故障排除技巧等。
HPE Aruba Networking AIOps 的优势始于出色的 AI。每天,我们从所有垂直市场和地区的小商店、办公室以及大型园区中安装的数万台设备收集数十 TB 的有用数据,以此建立我们的数据湖。得益于对网络和安全技术的深刻理解以及强大的数据科学家团队,我们很快就能提供快速处理或解决问题所需的洞见,所用时间相较于以往大大减少。