盘点那些项目中遇到过的“妖怪”服务器

很多时候,很多事情都让人没有办法去理性面对。

Dell R730是过去项目中遇到的常见型号,兼容性好、耐折腾。一次项目中总共两台R730配合vGPU + XenDesktop + PVS + ESXi 6.0使用,实施过程按部就班,最后压力测试验证时发现Target Windows 7桌面基本上有1/3无法正常注册。

于是开始痛苦的排错历程:

1、禁用vGPU,采用常规PVS静态池桌面发布,问题依旧;

2、iDRAC下抓包分析,无异常;升级BIOS后,问题依旧;累计耗费了长达一周的时间;

最后坚持没有采用XenServer底层,决定升级ESXi 6.0到ESXi 6.5,竟然问题解决了!

第二类:一次在Dell刀片服务器上进行项目紧急重构,本想底层XenServer保留(刀片型号与XenServer都是兼容的),奈何发现平台整体速度慢如蜗牛。

于是我用笔记本直连刀箱上联交换机访问XenServer,发现虚拟机Import和Export速度正常(这说明NFS存储正常),测试跨刀片虚拟机之间速度也正常(还尝试过更改存储网为巨型帧无果),就是在整体VDI体验上感觉桌面很慢,体验很差。

最后时间紧急,无法深入排错,迅速转变思路采用ESXi 6.0代替XenServer解决了问题。

第三类:一批曙光服务器,型号不便讲,需要全部安装XenServer,其中有一台服务器安装起来特别慢,但是能安装完成。Reboot之后,XS系统出现NIC界面的时间超级长,加入Pool的时间很长,导致整个Pool无法正常管理,反复几次后,演示给用户看,同时建议用户更换服务器。(实际上我还安装了Windows Server 2012 R2做了测试,结果正常)

这时候曙光问我服务器能否确定哪里有问题?我说没法确定,同一批服务器,其它正常,一台不正常。我也不想深入排查,浪费时间。最后听说还是换了一台服务器,问题解决。