找回密码
 立即注册

QQ登录

只需一步,快速开始

dino 活字格认证

高级会员

97

主题

556

帖子

1957

积分

高级会员

积分
1957

圣诞拼拼乐微信认证勋章活字格认证

dino 活字格认证
高级会员   /  发表于:2021-7-1 09:02  /   查看:13788  /  回复:33
1金币
用户反应活字格系统无法打开




紧急情况下重启服务或网站解决问题。

事后追溯原因,发现这段时间cpu跑满


再看当时造成跑满的进程


活字格服务进程!!!

这个问题经常发生,实际上我反馈此问题也近两三年了,一直有这个问题存在。而且服务器也换过新的,活字版的版本也升级了几个版本了。
阿里云的ECS服务器配置没问题,一年5w+的服务器,配置8 vCPU 32 GiB  50Mbps ,已经相当豪华了。
附件: 您需要 登录 才可以下载或查看,没有帐号?立即注册

最佳答案

查看完整内容

这个情况我也遇到过,不过我当时的并发量是1.5k-1.7k,直接把cpu拉到95%,然后客户端访问延时,但是排队一会儿还是可以登录进系统。具体原因是同一用户占同时提交多个数据和查看反馈结果(大概有15个左右),造成系统近似于崩溃。 改进办法是: 第一:更换数据库为mysql,第二: 优化业务流程,换一种思路实现同样的业务功能。 目前系统稳定运行,没有再次出现类似的情况, ps: 当时,我的服务器是 16v:32G 23兆带宽, 还有, ...

33 个回复

倒序浏览
最佳答案
最佳答案
湖说八道
金牌服务用户   /  发表于:2021-7-1 09:02:23
来自 17#
这个情况我也遇到过,不过我当时的并发量是1.5k-1.7k,直接把cpu拉到95%,然后客户端访问延时,但是排队一会儿还是可以登录进系统。具体原因是同一用户占同时提交多个数据和查看反馈结果(大概有15个左右),造成系统近似于崩溃。
改进办法是: 第一:更换数据库为mysql,第二: 优化业务流程,换一种思路实现同样的业务功能。
目前系统稳定运行,没有再次出现类似的情况,
ps: 当时,我的服务器是 16v:32G 23兆带宽,
还有,看了您的配置,感觉外网带宽过高,实际使用率并不能跑满,不如提高服务器配置,适当降低带宽,要不也是资源闲置。
回复 使用道具 举报
天朝四周处悬赏达人认证 活字格认证
金牌服务用户   /  发表于:2021-7-1 10:24:13
2#
这个配置确实相当豪华了
回复 使用道具 举报
dino活字格认证
高级会员   /  发表于:2021-7-1 10:34:56
3#
天朝四周处 发表于 2021-7-1 10:24
这个配置确实相当豪华了

配好点就是为了排除服务器配置的问题,换句话说就是为了证明是活字格的问题,我太坏了
回复 使用道具 举报
David.Zhong讲师达人认证 悬赏达人认证 活字格认证
论坛元老   /  发表于:2021-7-1 10:35:48
4#
仔细分析了您给的阿里云监控截图,发现ECS同时连接数飙升的同时,CPU开始跑满,建议您着重调查一下ECS同时连接数飙升的原因。
ECS同时连接数,这个指的是客户端向服务器发起请求,并建立了TCP连接。每秒钟服务器链接的总TCP数量,就是并发连接数,并发就是一秒建立的总tcp连接。

给您几个排查的思路:
1.是否是遭受了网络攻击(概率应该不大);
2.这个特定时间段是否有大量并发访问;
3.这段时间的请求是否会进行大量计算,比如循环命令中做了大量查询等。
建议您调查用户在这段时间进行了什么操作?要解决这个问题咱们得先弄清楚原因,才好针对性的给您出一些建议。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 使用道具 举报
dino活字格认证
高级会员   /  发表于:2021-7-1 10:36:38
5#
再提供一个情况,导出功能会使活字格服务进程占用大量的服务器资源。
回复 使用道具 举报
David.Zhong讲师达人认证 悬赏达人认证 活字格认证
论坛元老   /  发表于:2021-7-1 10:50:40
6#
dino 发表于 2021-7-1 10:36
再提供一个情况,导出功能会使活字格服务进程占用大量的服务器资源。

感谢您的反馈,这个情况是已知的。导出的时候会进行大量计算,这个是功能本身做的事情,是没办法更改的。比如说,要算一个特别复杂的方程式,它的计算量再大也是需要这么计算才能出结果。我们已经是优化过的了。您不必担心。针对有大量导出需求的用户,我们是建议专门部署一台服务器来专门做导出这件事情的,这样就不会影响其他功能的正常使用了。
回复 使用道具 举报
dino活字格认证
高级会员   /  发表于:2021-7-1 11:00:00
7#
David.Zhong 发表于 2021-7-1 10:35
仔细分析了您给的阿里云监控截图,发现ECS同时连接数飙升的同时,CPU开始跑满,建议您着重调查一下ECS同时 ...

1. 提交阿里云工单已经检查过了,没问题。
2. 当时就看了并发用户二三十个用户。
3. 大量的计算和大量的数据请求是必须的。
4. 表格加载数据、表格数据提交、导出打印。
回复 使用道具 举报
dino活字格认证
高级会员   /  发表于:2021-7-1 11:00:13
8#
David.Zhong 发表于 2021-7-1 10:50
感谢您的反馈,这个情况是已知的。导出的时候会进行大量计算,这个是功能本身做的事情,是没办法更改的。 ...

这个方案不好
回复 使用道具 举报
David.Zhong讲师达人认证 悬赏达人认证 活字格认证
论坛元老   /  发表于:2021-7-1 12:32:01
9#

这个方案是针对您说的导出这个问题的解决方案,不一定适用于您,是给您分享一下这个信息,有这么一回事。
我们先看我们现在遇到的问题。CPU占满的时候,肯定是大量的计算导致的。您提供了几个点,但是不能确定是哪个操作导致的。所以需要您排查一下。
CPU占满这段时间,用户到底是进行什么操作?这个操作,是指您的业务逻辑,是在执行您的哪个业务。很大概率是您业务逻辑写得有问题,所以会导致大量计算。
希望您提供更多的信息,我们这边才好给您出主意。
还有就是配置问题,您的配置确实很豪华,但是豪华的地方是在带宽为50M上。CPU仍是8核,计算量是一定的,这个配置还是得看是否能支持您的业务逻辑的计算量。
回复 使用道具 举报
1234下一页
您需要登录后才可以回帖 登录 | 立即注册
返回顶部