LTE故障处理手册一. 重大故障处理方法 1. 重大故障实时告警列表
2. 重大故障处理步骤 ●【批量基站断站或小区不可用】 ●原因分析 基站批量断点或或批量双模站点TD测GPS出现故障及传输设备故障 ●关注重点 批量基站断站或小区不可用 ●常见处理方法
二.告警预处理告警分类 1. 实时告警分类总表
2. 主要告警分析和常见的处理手段。 1) 【网元链接中断】 ●告警解释: 网元与OMC网管之间的链接中断,一般来讲,为断电或传输问题 ●对系统的影响 对该网元无法控制 ● 告警处理
2) 【29243:小区服务能力下降】 ●告警解释 当基站射频资源或基带资源不能满足当前小区的配置规格时,产生此告警 ●对系统的影响 告警小区提供给客户可用的无线空口资源会减少。 ●告警处理
查询RRU配置通道: 查询基站当前告警信息: 查询驻波: 查询光模块型号,速率: 3)【19240:小区不可用告警】 ●告警解释 当基站检测到小区不能提供业务时,产生此告警。 ●对系统的影响 告警小区不能提供业务。 ●告警处理
查询小区是否可用: 查看RRU是否有告警: 查询光路是否OK: 查询GPS是否可用: 查看是否有License告警: 4) 【29207: 基站控制面传输中断告警】(注:由于网元断链,网管无法对基站控制) ● 告警解释 当基站所有SCTP链路状态都异常时,产生此告警。 ● 对系统的影响 基站所有承载S1Interface、X2Interface的SCTP链路(链路个数不少于2条)状态都异常,导致基站所有S1接口、X2接口无法建立成功,小区无法激活,用户无法入网。 ●告警处理
5)【26233:BBU IR光接口性能恶化告警】 ●告警解释 当BBU的IR端口上的光模块的接收或发送性能恶化时,产生此告警。 ●对系统影响 1、光模块的收发性能严重恶化,可能导致IR链路承载的业务质量严重下降,或导致下级射频单元业务中断。 2、光模块的收发性能轻微恶化,可能导致射频单元该IR链路承载的业务质量出现轻微恶化。 ●告警处理
查询RRU收发光: 6)【26260:系统时钟不可用告警】 ●告警解释 当基站使用本地晶振的时间超过其可保持的时限时,产生此告警。 ●对系统影响 基站业务处理会出现各种异常,如切换失败、掉话等,严重时基站不能提供业务。 ●告警处理
查询GPS情况: 查询GPS问题是否是有单板故障问题引起: ●提示 eNodeB大部分取得时钟为对端(及TD测),现网大部分为GPS,当前时钟状态为不可用时,可判断GPS问题,需上站检查GPS。 ●关于License的下发遵守的规则: TD: LTE: 典型案例 1、光模块速率问题导致小区服务能力下降告警 现象描述: 某局站点开通后出现小区服务能力下降告警,查询基站CELL ,VSWR 等均正常,也无任何告警。现场RRU类型3152-e,基带板LBBPd,且3152-e开单流 1*20M小区。 可能原因: 1、射频单元发射通道故障,比如驻波,现场所接RRU物理通道和数据配置不一致。 2、单板硬件故障,软件运行异常等。 3、小区CPRI 带宽资源不足,光模块速率不匹配。 处理过程: 1. 网管查询 CELL 建立成功,VSWR均为1.2左右,低于门限值,没有驻波。RRU开单流 物理通道和数据配置一致。,排除原因1. 2. 远程下点复位告警单板,单板运行正常后告警仍然不消除,近端插拔单板也不行,且没有单板硬件故障告警和单板软件运行异常告警,排除原因2. 3. 通过命令DSP CPRILBR 查询每个RRUCHAIN 的协商速率均为2.5G,重新协商STR CPRILBRNEG 后 仍为2.5G,之后通过 DSP SFP 查询发现 BBU侧和RRU侧光模块均为2.5G,到底问题基本定位,联系室分厂家全部更换6.14G 光模块后重新协商CPRI速率,均为最大能力4.9G,告警也随之消除。 总结建议 3152-e 开1*20M 小区所需CPRI速率为4.9G,而2.5G 满足不了此要求,进而就上报了小区服务能力下降告警。 2、数据配置问题导致小区服务能力下降 现象描述 TDS/L双模站点“xxxx”,TDL侧3个小区上报“小区服务能力下降告警”,但是查询RRU驻波、收发光功率都正常,无其它相关告警,需要排查产生该告警的原因。 ENODEB版本:DBS3900V100R005C00SPC310 NODEB版本 :DNB6200V400R007C00SPC500 告警信息 小区服务能力下降告警,告警ID= 29243,定位信息:本地小区标识=1, 小区当前使用发射通道数=1, 小区当前使用接收通道数=1, 具体问题=小区射频资源, 小区名称=盛平村FE1 原因分析 通常小区服务能力下降告警都是由于站点硬件故障导致的,例如RRU驻波告警、RRU到BBU之间收发光异常、光模块速率过低等,但是查询该站点并不存在上述情况,怀疑跟数据配置有关。 处理过程 1 查询RRU驻波、收发光功率、光模块速率都正常,也不存在其它异常告警,初步排除硬件故障原因; 2 怀疑跟数据配置有关,查询RRU和扇区配置发现该站点为8T8R的宏站配置,而且RRU的8个PATH也都正确关联进去,如下所示(详见附件)—— LST RRU: 查询RRU/RFU配置信息 ------------------- 柜号 框号 槽号 管理状态 RRU拓扑位置 RRU链/环编号 RRU在链中的插入位置 RRU类型 RRU工作制式 接收通道个数 发射通道个数 0 60 0 解闭塞 主链环 1 0 MRRU TDS_TDL 8 8 LST SECTOR: 查询扇区配置信息 ---------------- 扇区号 扇区名称 地理坐标数据格式 秒格式天线经度(秒) 秒格式天线纬度(秒) 经度(1e-6度) 纬度(1e-6度) 天线模式 1 sector_1 度格式 NULL NULL 11425002 2273022 八发八收 3 怀疑RRU硬件可能是RRU3152-fa,不支持上述8T8R的配置,查询RRU硬件信息发现确实如此(见下),将相关配置数据修改为RRU3152-fa支持的场景后,告警恢复。 //查询单板制造信息 DSP BRDMFRINFO:CN=0,SRN=60,SN=0; ---------------- 单板类型 = WD1MTRU4FADH 条码 = 210231935610C6000572 描述 = TD-TECH RRU3152-FADC,WD1MTRU4FADH,TD-SCDMA 1880-1910MHz&2010-2025MHz 2 path 思考与总结 1、 本案例中RRU配置为8发8收,实际物理硬件为RRU3152-fa,只支持2发2收,但没有上报“单板类型和配置不匹配告警”,而是从检测RRU的实际能力出发,上报“小区服务能力不足告警”,这一点需要注意。此外,告警信息中提示“小区当前使用发射通道数=1, 小区当前使用接收通道数=1”,而不是2个通道数 , 应该与小区实际生效时检测到只有1个可用通道有关。 问题回溯后发现,现场负责硬件安装的督导与后台负责数据制作的督导之间没有及时有效沟通,后台想当然地根据宏站LTE站点8发8收的模板制作数据,后续项目组在开站流程上予以梳理规避,特别是对于RRU3152使用在宏站、室分的场景,要求必须核实。 3、双模站点因TDS载波扩容后超过产品规格导致LTE小区服务能力下降的问题处理 现象描述 多个双模站点LTE侧上报小区服务能力下降告警,无其它相关告警,需要排查产生该告警的原因。 告警信息 LTE站点只有小区服务能力下降告警 原因分析
处理过程 1、DSP VSWR 查询驻波值均不超过1.3,通过扫频测试驻波值也正常,DSP SFP 查询光模块速率均为 9.8G,由于当前软件版本不支持 9.8G光速率,所以数据配置仍为 6.1G,目前局点该场景很多,并无问题,排除原因1。 2、仔细检查数据配置的各种关键参数(扇区模式、天线收发模式、RRU链环配置等)均无发现问题,对比其它类似场景站点的数据配置,也未发现问题,且都是一个CME模板做出来的,排除LTE数据配置问题。 该站点TDS属于新建站点,LTE在TDS基础上升级,之前开通时并无问题,对比之前的TDS数据配置,发现TDS侧多配置载频,之前载频配置为S2/2/2,当前载频配置为S4/5/8,LTE侧第三小区上报小区服务能力下降告警,且该小区TDS侧载频配置较多,怀疑是TDS侧载波扩容导致的告警;通过查看相关资料知道,双模组网场景下,3168的规格如下: 思考与总结 该双模站点之前已经开通过且并无问题,后来TDS载波扩容的时候增加载频数量超过了硬件的支持能力,此时TDS并不会上报告警,且载频均能正常建立,从检测RRU的实际能力出发,LTE上报小区服务能力下降告警。 4、双模站点GPS共用设置问题处理建议 现象描述: 某LTE站点开通,LTE与TDS共用GPS,现场TDS站点可用,LTE站点提示时钟资源不可用告警 告警信息: 小区时钟资源不可用 原因分析: 1、 LTE时钟资源设置问题。 2、 TDS侧GPS链路为激活。 处理过程: 1. 在TDS侧DSP GPS查看GPS是否可用。查看小区状态可用且跟踪GPS卫星数目符合搜星要求。 2. 在LTE端LST GPS查询是否配置GPS。因为双模站点规定GPS最后放置在7槽位主控板上,LTE原则上不用配置GPS。 3. 发现LTE 基站侧已配置GPS数据,将其删除。添加PeerClk时钟编号 4. 设置参考时钟源工作模式为手动;制定参考源为对端时钟 建议与总结: 细心检查数据,查看是不是有什么别的脚本添加错误 5、LTE双模基站改造时由于TDS的WMPT主控版本与LTE不匹配导致TDS网元连接中断问题 现象描述: TDS-LTE双模基站改造完成后,加电,发现TDS基站OMC网管上报“网元连接中断”告警,eNodeB脱管,OMC无法进行管理,无论复位、插拔、更换WMPT单板后TDS均无法恢复正常。 告警信息: TDS基站OMC网管上报“网元连接中断”告警。 原因分析: 对基站进行双模改造,新增UMPT、LBBP,更换UEPUc、FANc,并通过分路传输进行通信。在加电后,发现TDS站点图标一直退服,可能原因: 处理过程: 1、协调传输专业确认传输数据及光缆状态正常,排查传输原因导致的TD断站。 建议与总结: 当TDS基站的主控单板WMPT单板的版本为V400R006C00SPC500时,如果的LTE主控单板UMPT、LBBPd单板如果已经安装完成并加电,会导致TDS的WMPT异常,网元连接无法正常建立。 |
|