阿里云再次突发故障,高可用形同虚设?

作者:IT邦德
中国DBA联盟(ACDU)成员,10余年DBA工作经验,
Oracle、PostgreSQL ACE
CSDN博客专家及B站知名UP主,全网粉丝10万+
擅长主流Oracle、MySQL、PG、高斯及Greenplum备份恢复,
安装迁移,性能优化、故障应急处理
微信:jem_db
QQ交流群:587159446
公众号:IT邦德

文章目录

  • 前言
    • 盘点事故
    • 用户的期待
    • 公共云现状
    • 感想

前言

MySQL9.0创新版本已经正式发布,这次功能确实进化了不少!

盘点事故

北京时间2024年07月02日10:04分,阿里云又挂了!上海可用区N出现网络访问异常,
从发现故障到解决用时31分钟,从发现故障到影响恢复用时38分钟。盘点2024年,已经发生3次故障了,真是让人吐血!

不得不说,阿里云作为国内最大的云服务商,其影响力太大了!这次故障据说是由于光缆断了,这样的故障时长放眼整个互联网也是炸裂般的存在。影响的服务范围看上去”不大“,但要命的核心服务一个都没拉下:对象存储,云服务器,云数据库,K8S,Redis…

这次故障是单可用区故障,所以一些云数据库服务可以进行主备切换,将流量切换到其他可用区。尽管如此,此区受到的影响也很大,有不少网友反映“小红书崩了”,刷新不出推荐内容

同时网友反映,B站App无法使用浏览历史关注等内容,消息界面、更新界面、客服界面均不可用,用户也无法评论和发弹幕,视频评论区和用户(UP主)主页都无法加载…

再次盘点2024年04月08日,腾讯云出现的一场全球性的大故障,用腾讯云官方的说法,崩了74 分钟,波及全球17个区域与数十款服务。

用户的期待

其实用户一直在等待,阿里云给出的事后故障复盘权威报告,可事实是只有恢复之后的报告,这里不得不引入一个知识:服务等级协议Service Level Agreement,简称 “SLA”,一般用来描述服务提供商承诺提供给用户的服务稳定性的指标,如果达不到相应的SLA指标,那么就可能面临相应的违约赔偿。

查阅阿里云服务的SLA文档,目前他们所提供的几十种云服务,大多提供了“4个9”左右的稳定性承诺,即99.99%的稳定性。今天看了下网上大家的第一反应都是这么大的公司怎么还会出这样的问题?又有多少打工人周末加班还碰上公司重大事故责任~

反思这个问题出现其背后的原因是什么?毕竟这么大的公司,应急预案肯定是有的,补救措施肯定也是相对完善,为什么还会造成这么大的后果?而且不久前刚出现过一场全球性的大故障?难道高可用真的形同虚设?

用户为什么这么迫切的期待复盘报告呢?复盘报告详细描述了处理过程、服务影响、问题分析与改进措施,并提供中文简体、繁体、英文三种版本,能让人重新树立阿里工程师可以更好地应对未来故障的信心。对软件系统生产事故复盘报告越保密,开发人员对自己能应对软件系统稳定性故障就越没信心!

其实这份云健康看板是要深刻在用户的心中

解决“IT系统稳定性工作很难被认可”的难题,一个好办法,就是在每次意外事件后,就撰写并公布领导和用户都能看懂的避坑指南。让他们了解稳定性工作所面临的挑战和价值。“ 很多做过稳定性这事的人都知道,做这个事情最麻烦的是很难被认可,做的好,不出问题,不懂的人不知道你做了什么,出了问题的时候觉得你到底做了什么,所以会看到很多公司都是运动式的做稳定性,一阵一阵的。

公共云现状

近几年我国云计算行业的市场规模和渗透率均在持续增长,使得我国公有云市场进入了一个新的发展阶段。除此之外,在5G商用以及AI等技术发展的推动下,我国公有云市场规模始终保持高速增长趋势。在公有云市场规模不断扩大的过程中,用户对其需求也随着发生改变。为满足客户的需求,市场产品形式发生了相应的变化。

公有云将继续与大数据、人工智能、物联网等先进技术进行深度融合,提供更丰富的服务。大数据和人工智能的融合将推动公有云成为处理大数据的关键工具,而边缘计算和混合云的兴起则将进一步推动公有云的发展。随着客户需求的个性化、多样化,公有云服务商将提供更多定制化的服务。他们将根据客户的具体需求,提供针对性的解决方案,以满足不同行业、不同场景下的需求。

预计中国到2025年将达到42%,公共云的比例为36%。

感想

公有云更进一步,不再以机位、服务器为单位,而以“服务”为单位,将多台主机资源整合,对外提供各种服务,其实就是一种革命,这里面会产生非常多革新式技术,用户信任、技术声望以及商誉真的对于云服务商太重要了。云计算现在卷的厉害,只有阿里这样的头部才能卷的动!但是如果真的这么多重大故障频发,赔了这么多钱,可能新的一轮裁员即将拉开序幕,互联网从业者又要开始瑟瑟发抖了!

作为一名13年DBA运维的技术人员,跟之前很多互联网上的热议事件是相呼应的,就是一群兢兢业业在干事情的人,不论他的职位是什么、行业是什么,如果不能更“柔善”一点的处理各种工作上、人际上的事物,最终被优化的都是他们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/766118.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

轻松拯救手机数据,数据恢复软件推荐这8款!

在现代生活中,手机已成为我们不可或缺的工具,承载着大量重要的个人和工作数据。然而,意外删除、系统崩溃、设备损坏等情况可能导致数据丢失,给我们带来极大的困扰。幸运的是,随着科技的发展,各种手机数据恢…

文生图功能介绍

Stable Diffusion WebUI(SD WebUI)及文生图功能介绍 一、引言 随着人工智能技术的飞速发展,AI绘画作为一种新兴的艺术形式,逐渐走入人们的视野。Stable Diffusion WebUI(简称SD WebUI)作为AI绘画领域的重…

[附源码]最新springboot线上电商|前后端分离|界面简洁

一. 前言 今天小编给大家带来了一款可学习,可商用的,线上电商的网站源码,支持二开,无加密。代码的后端是SpringBoot技术栈(非jsp),前端是Angular。如果您需要定制需求请找小编。 文章第六小节…

英灵神殿mac能玩吗 英灵神殿对电脑配置要求《英灵神殿》新手攻略查询 PD虚拟机能玩英灵神殿吗

近年来,随着《英灵神殿》(Valheim)游戏的火热,越来越多的玩家被其独特的北欧神话题材和丰富的生存挑战所吸引。然而,对于Mac用户来说,如何在Mac平台上运行这款游戏可能是一个问题。此外,作为一名…

编译原理3-自底向上的语法分析

自底向上分析 ,就是自左至右扫描输入串,自底向上进 行分析;通过反复查找当前句型的 句柄, 并使 用产生式规则 将找到的句柄归约为相应的非终结符 。逐步进行“ 归约 ”,直到至文法的开始符号; 对于规范推导…

【unity实战】在Unity中使用有限状态机制作一个敌人AI

最终效果 文章目录 最终效果前言有限状态机的主要作用和意义素材下载逻辑图敌人动画配置优雅的代码文件目录状态机代码定义敌人不同状态切换创建敌人效果更多的敌人参考源码完结 前言 有限状态机以前的我嗤之以鼻,现在的我逐帧分析。其实之前我就了解过有限状态机&…

day03-主页模块-修改密码

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 1.获取用户资料在Vuex中共享登录成功跳转到主页之后,可以获取用户资料,获取的资料在Vuex中共享,这样用户就可以很方便的获取该信…

Leetcode刷题笔记 | 二叉树基本性质 | 一天的题量 | 5道题目 | 深度优先搜索 | 广度优先搜索 | 递归 | 遍历

🙋大家好!我是毛毛张! 🌈个人首页: 神马都会亿点点的毛毛张 📌本期毛毛张分享的是LeetCode关于二叉树🌲的性质的一些基础题,做这些题目的本质还是遍历二叉树🏃‍➡️的过程&#…

计算机组成原理 | 储存子系统(1)概述

三级储存体系 物理与虚拟存储器 (抽象逻辑模型) 存储器类型 存储器的速度指标

中国民间网络外交组织(CCND)

中国民间网络外交组织Chinese Civil Network Diplomacy简称(CCDN) 是由中国网民建立起来的一个网络外交组织,深度贯彻党的主张和网民意志的统一,为保护中国中华优秀传统文化,民族自信,国家安全,民族利益,社…

昇思MindSpore学习笔记2-04 LLM原理和实践--文本解码原理--以MindNLP为例

摘要: 介绍了昇思MindSpore AI框架采用贪心搜索、集束搜索计算高概率词生成文本的方法、步骤,并为解决重复等问题所作的多种尝试。 这一节完全看不懂,猜测是如何用一定范围的词造句。 一、概念 自回归语言模型 文本序列概率分布 分解为每…

76. UE5 RPG 实现场景阻挡剔除功能

在俯视角游戏中,我们总会碰到一个问题就是,建筑会遮挡住角色的问题。遇到这种问题有多种解决方案,厂商经常使用的一种方案是,如果角色被遮挡,则使用一种纯色或者增加一些菲涅尔的效果来实现 这种效果我之前在unity内实…

SpringBoot 项目整合 MyBatis 框架,附带测试示例

文章目录 一、创建 SpringBoot 项目二、添加 MyBatis 依赖三、项目结构和数据库表结构四、项目代码1、application.yml2、TestController3、TbUser4、TbUserMapper5、TestServiceImpl6、TestService7、TestApplication8、TbUserMapper.xml9、MyBatisTest 五、浏览器测试结果六、…

一文了解什么是车载Tbox

目录 前言一、Tbox是什么呢?二、Tbox架构三、App——TSP——Tbox交互时序图四、汽车混合网关拓扑结构示例五、Tbox功能 前言 强烈建议提前阅读一下这篇文章:车机Tbox介绍 一、Tbox是什么呢? Tbox是汽车上的一个盒子,指的是Telematics BOX&#xff0c…

Michael.W基于Foundry精读Openzeppelin第61期——ERC1967Upgrade.sol

Michael.W基于Foundry精读Openzeppelin第61期——ERC1967Upgrade.sol 0. 版本0.1 ERC1967Upgrade.sol 1. 目标合约2. 代码精读2.1 _getImplementation() internal && _upgradeTo(address newImplementation) internal2.2 _upgradeToAndCall(address newImplementation,…

常见反爬及应对

一,特殊混淆的还原 1.1 还原 AAEncode 与 JJEncode AAEncode是一种JavaScript代码混淆算法,利用它,可以将代码转换成 颜文字 表示的JavaScript代码。 去掉代码最后的 (‘‘),这是函数的自调用,去除后就是函数的声明…

【计算机网络仿真】b站湖科大教书匠思科Packet Tracer——实验13 静态路由配置错误导致的路由环路问题

一、实验目的 1.验证静态路由配置错误导致的路由环路问题; 二、实验要求 1.使用Cisco Packet Tracer仿真平台; 2.观看B站湖科大教书匠仿真实验视频,完成对应实验。 三、实验内容 1.构建网络拓扑; 2.验证路由环路。 四、实验…

探囊取物之多形式登录页面(基于BootStrap4)

基于BootStrap4的登录页面,支持手机验证码登录、账号密码登录、二维码登录、其它统一登录 低配置云服务器,首次加载速度较慢,请耐心等候;演练页面可点击查看源码 预览页面:http://www.daelui.com/#/tigerlair/saas/pr…

【AI提升】如何使用大模型:本机离线和FastAPI服务调用

大模型本身提供的功能,类似于windows中的一个exe小工具,我们可以本机离线调用然后完成具体的功能,但是别的机器需要访问这个exe是不可行的。常见的做法就是用web容器封装起来,提供一个http接口,然后接口在后端调用这个…

electron教程(二)控制应用程序的事件生命周期

1.will-finish-launching 当应用程序完成基础的启动的时候被触发,在 Windows 和 Linux 中, will-finish-launching 事件与 ready 事件是相同的; 在 macOS 中,这个事件相当于 NSApplication 中的 applicationWillFinishLaunching 提示。 app.on(will-fi…