LTE产品常见告警故障处理指导手册
1. SCTP偶联断(198092230)
1.1.1 告警原因
1. 本端或对端偶联参数配置错误;
2. 传输链路故障。
1.1.2 处理措施
1. 在告警管理系统中,检查告警详细信息中的附加文本字段,查看SCTP偶联号,如图2‑1所示。
图2‑1 查看SCTP偶联号
2. 在动态管理系统中,运行“查询SCTP”命令,根据SCTP偶联号查询对应偶联的运行状态,确认SCTP偶联已断,如图2‑2所示。
图2‑2 运行“查询SCTP”命令
3. 在配置管理系统中,检查SCTP偶联参数配置,确保SCTP偶联的远端地址、远端端口号与对端的本端地址、本端端口号一致,如图2‑3所示。若告警恢复,则结束处理,否则执行下一步。
图2‑3 检查SCTP偶联参数配置
4. 在诊断测试系统中,进入[IP通道测试]界面,然后在『目的IP』中输入对端IP地址(即图2‑3中的远端地址),进行ping测试,判断本端(eNodeB)到对端(MME/SGW/邻接eNodeB)的传输地址是否可达,如图2‑4所示。
图2‑4 判断本端到对端的传输地址是否可达
5. 在配置管理系统中,排查基站至对端的静态路由是否配置正确,包括:目的IP地址、下一跳IP地址等,如图2‑5所示。若告警恢复,则结束处理,否则执行下一步。
更新:检查网元IP与IP传输配置中IP层配置IP地址是否一致,检查IP层配置中的网关和掩码是否和IPRAN规划配置一致。如果不一致,修改后同步再进行下一步。
图2‑5 检查静态路由是否配置正确
6. 在配置管理系统中,排查SCTP链路所在的IP层参数是否配置正确,包括:VLAN ID、IP地址、网关IP等参数,如图2‑6所示。
图2‑6 排查SCTP链路所在的IP层参数是否配置正确
7. 如果上述配置数据不正确,修改参数,同步配置数据到基站。检查告警是否清除,如果告警仍未消除,联系传输人员排查传输链路问题。若告警得以消除,则结束处理,否则寻求更高一级的设备维护支持。
更新:尝试进行整表同步。
2. S1断链告警(198094420)
1.1.1 告警原因
1. SCTP偶联断。
2. S1AP建立失败(协商失败或基站无小区)。
1.1.2 处理措施
1. 检查告警详细信息中的附加文本字段,是否SCTP偶联断,如图2‑7所示。如果不是,执行步骤2。如果是,参照“SCTP偶联断”告警的处理措施进行排查。如果告警消除,结束告警处理,否则执行步骤2。
图2‑7 检查是否SCTP偶联断
2. 检查告警详细信息中的附加文本字段,是否S1AP建立失败。如果是,在配置管理系统中检查基站是否配置小区,S1配置参数是否有效。
(1) 检查MCC、MNC是否配置正确,如图 2‑8所示。必须按照运营商提供的数据规划来配置MCC、MNC,由于EPC可能同时和不同E-UTRAN系统对接,因此eNodeB侧配置的MCC、MNC必须在EPC侧也配置了,否则会导致S1AP层信令交互失败、S1断链(此时SCTP链路是通的)。
图2‑8 检查MCC、MNC是否配置正确
(2) 检查TAC是否配置正确,如图 2‑9所示;并与核心网侧人员确认EPC是否已相应配置了基站的TAC参数。若eNodeB侧和EPC侧配置的TAC参数不一致,则会导致S1断链。
图2‑9 检查TAC是否配置正确
(3) 检查eNodeB标识(eNBID)是否配置正确,如图 2‑10所示。若整网存在eNodeB标识(eNBID)冲突的情况,则会导致S1链路闪断。
图2‑10 检查eNodeBID是否配置正确
(4) 联系核心网侧人员检查EPC是否对接入的最大eNodeB数量做了限制。EPC 31 48354 31 15264 0 0 3574 0 0:00:13 0:00:04 0:00:09 3573侧有个参数『全局最大动态eNodeB数』,它为EPC侧规划参数,默认值不同版本而不同,需要根据网络规模合理规划和配置。该参数控制能够和其对接的最大eNodeB的数量;如果当前和EPC对接成功的(S1链路正常)的eNodeB数量已经达到该参数设置值,那么新增eNodeB是不能和EPC建立SCTP链路并成功对接的。
3. 如果上述配置数据不正确,修改参数,同步配置数据到基站。检查告警是否清除,如果告警消除,结束告警处理,否则寻求更高一级的设备维护支持。
3. X2断链告警(198094421)
1.1.1 告警原因
1. SCTP偶联断。
2. X2 AP建立失败(协商失败或基站无小区)。
1.1.2 处理措施
1. 检查告警详细信息中的附加文本字段,是否SCTP偶联断,如图2‑7所示。如果不是,执行步骤2。如果是,参照“SCTP偶联断”告警的处理措施进行排查。如果告警消除,结束告警处理,否则执行步骤2。
2. 检查告警详细信息中的附加文本字段,是否X2 AP建立失败。如果是,在配置管理系统中检查基站是否配置小区,X2配置参数是否有效。
(1) 对于我司基站,可直接在统一网管中检查邻接eNodeB是否配置了至本端的X2 SCTP,如图 2‑11所示。
图2‑11 检查邻接eNodeB是否配置了至本端的X2 SCTP
(2) 对于异厂家基站,需要联系异厂家人员检查是否配置了至我司基站的X2 SCTP。
3. 如果配置数据不正确,修改参数,同步配置数据到基站。检查告警是否清除,如果告警消除,结束告警处理,否则寻求更高一级的设备维护支持。
4. 小区退出服务(198094419)
1.1.1 告警原因
1. 小区被关断。
2. S1链路故障。
3. 小区所使用的主控板、基带板或RRU故障。
4. 小区配置失败。
5. 时钟失锁。
1.1.2 处理措施
1. 进入动态管理,查询小区状态。
图 2‑12 查询小区状态
2. 查询运行版本是否正确,必要情况下和其他运行正常的基站进行版本对比。
图 2‑13 查询运行版本是否正确
3. 检查告警详细信息中的附加文本字段是否为“小区关断”。
图 2‑14 检查告警详细信息
(1) 如果不是,执行步骤4。
(2) 如果是,则可以根据系统配置决定是否在动态管理中解除小区关断。查看告警是否消除。如果告警消除,结束告警处理,否则执行步骤4。
图 2‑15 解除小区关断
4. 查询S1链路状态,如果S1链路断,先根据S1链路断故障排查指导进行排查,解决S1链路断的问题。
图 2‑16 查询S1链路状态
5. 查看告警管理中告警监控是否有时钟失锁相关告警。如果没有,执行步骤6。如果有,按照这些告警的处理方法处理。查看告警是否消除,如果告警消除,结束告警处理,否则执行步骤6。
6. 在告警管理中告警监控中检查小区所使用的主控板、基带板、RRU是否有告警。如果没有,执行步骤7。如果有,按照这些告警的处理方法处理。查看告警是否消除,如果告警消除,结束告警处理,否则执行步骤7。
7. 在配置管理中检查小区参数配置。确保小区参数配置正确,并同步配置数据到eNodeB。查看告警是否消除,如果告警消除,结束告警处理,否则寻求更高一级的设备维护支持。
5. 基站退出服务(198094422)
1.1.1 告警原因
基站无可用LTE小区。LTE小区发生故障或被关断。
1.1.2 处理措施
1. 在动态管理中检查是否有小区被关断。
图 2‑17 检查是否有小区被关断
(1) 如果没有,执行步骤2,如果有,在动态管理中手动解除小区关断,观察是否有小区能恢复为可用小区,如果有,检查告警是否消除。
图 2‑18 解除小区关断
(2) 如果告警消除,结束告警处理,否则执行步骤2。
2. 排查故障小区。参考“小区退出服务”的处理建议进行处理,观察小区是否能恢复为可用小区,检查告警是否清除。如果告警消除,结束告警处理,否则寻求更高一级的设备维护支持。
6. 网元断链告警(198099803)
1.1.1 告警原因
1. 网元到网管的通信链路断
2. 配置数据错误
3. 网管自身故障
4. 基站自身状态不正常
1.1.1 处理措施
1. 首先检查和网管断链基站的范围,是个别基站还是大量基站。
图 2‑19 检查和网管断链基站的范围
如果是大量基站,则重点检查网管自身运行情况,包括排查网管常见功能模块是否运行正常(告警界面能否打开、配置管理界面能否打开和查看配置数据、版本管理界面是否正常等),检查CPU/内存/硬盘等使用情况,使用Ping检查网管到网关通信是否正常。
图 2‑20 检查CPU/内存/硬盘等使用情况
图 2‑21 使用Ping检查网管到网关通信是否正常
2. 检查OMM服务器与网元连接是否正常。在配置管理界面中查到对应的网元地址,从OMM服务器检查是否能ping通该网元。
图 2‑22 查到对应的网元地址
图 2‑23 检查是否能ping通该网元
如果能ping通,需要检查网管运行情况;如果不能ping通,逐级ping 基站的网关、网管的网关等中间节点的设备,如果能ping通中间节点的设备,则说明基站到相应设备传输有问题,或者网元自身运行有问题。
3. 检查配置等相关数据。
(1) 在配置界面上查看该网元的相关状态;如果运维状态处于"未开通",请改为"开通"状态;如果割接状态处于"割接中",请改为"正常"状态;如果该步骤无效,则进行第二步。
图 2‑24 查看该网元的相关状态
(2) 进入动态管理界面,进行"查询链路状态"或"查询人工断链状态"操作;如果链路处于人工断链状态,请进行"人工断链恢复"。
图 2‑25 查询链路状态
(3) 检查网元管理IP、基站IP层数据、OMC通道数据等数据是否正确。
图 2‑26 检查网元管理IP、基站IP层数据、OMC通道数据
4. 到站点用LMT检查基站的运行情况,包括版本是否正确、传输配置是否正确。在LMT上使用Ping命令检查到网关/网管的通信情况。
图 2‑27 用LMT检查基站的运行情况
7. 软件运行异常(198097604)
1.1.1 告警原因
1. 单板软件运行异常:单板软件未正常运行,无法正常上报心跳到主控主板。
2. 产品进程运行异常:产品进程得不到及时调度,或单板产品进程未正常运行,无法正常上报心跳到管理进程。
3. 子单元软件运行异常:单板子单元和主控单元之间通讯链路断,或单板子单元软件未正常运行,无法正常上报心跳到主控单元。
1.1.2 处理措施
1. 查看告警附加文本,确认故障详细信息及位置,根据具体描述进行处理。
2. 单板软件运行异常:
(1) 查看基站告警,检查单板是否存在硬件类型和配置不一致告警,如有则先处理,否则执行下一步。
(2) 查看基站告警,检查单板是否存在参数配置错误告警,如有则先处理,否则执行下一步。
(3) 复位单板,如果告警恢复则结束处理,否则执行下一步。
图 2‑28 复位单板
(4) 硬复位单板,如果告警恢复则结束处理,否则执行下一步;
(5) 寻求更高一级的设备维护支持。
3. 产品进程运行异常:
复位对应产品进程。
图 2‑29 复位对应产品进程
4. 子单元软件运行异常:
复位告警对应单板单板。
5. 查看告警是否消除,如果告警消除,结束告警处理,否则寻求更高一级的设备维护支持。
8. 单板电源关断(198092057)
1.1.1 告警原因
1. 单板过温;
2. 单板过流;
3. OMC发起关断;
4. 软件异常关电。
1.1.2 处理措施
1. 查看告警附加文本,确定单板电源关断原因,根据关断原因分别处理。
2. 管理电源过流、业务电源过流:
(1) 插拔单板,如果告警恢复则结束处理,否则执行下一步;
(2) 将单板改配到其它槽位,等待5分钟,若不再上报告警,则结束处理,否则执行下一步;
(3) 更换单板,若告警恢复则结束处理,否则寻求更高一级的设备维护支持。
3. 过温关断:
(1) 检查是否存在风扇故障告警,如有则先处理,否则执行下一步;
(2) 检查外围环境,如空调是否工作正常、是否有大功率发热设备等,外围环境恢复后,等待10分钟,如果告警恢复则结束处理,否则执行下一步;
(3) 检查设备的进风口以及防尘网是否被堵,去除堵塞物或者清洗防尘网,等待10分钟,如果告警恢复则结束处理,否则寻求更高一级的设备维护支持;
4. 人工关断:
在动态管理中打开对应单板电源。
图 2‑30 打开对应单板电源
5. 智能下电:
节能下电,无需处理。
6. 其它:
插拔单板。
9. 单板通讯链路断(198097060)
1.1.1 告警原因
单板与主控板之间的链路连接故障。
1.1.2 处理措施
1. 拔插单板,如果告警恢复则结束处理,否则执行下一步;
2. 更换槽位(需要在对应槽位做好该单板配置数据),如果恢复则原槽位有故障;
3. 更换单板。
10. 单板温度异常告警(198092213)
1.2.1 告警原因
单板温度过高或过低,超过告警门限。
1.2.2 处理措施
1. 检查插箱风扇是否正常工作;
2. 检查防尘网是否堵塞;
3. 检查环境温度是否正常。
11 进风口温度异常(198092042)
1.1.1 告警原因
1. 过高:
(1) 进风口或者防尘网堵塞;
(2) 外围环境温度过高;
(3) 温度告警门限设置不合理。
2. 过低:
(1) 外围环境温度过低;
(2) 温度告警门限设置不合理。
处理措施
1. 在配置管理中将温度告警门限恢复为默认值,并同步配置数据到网元,等待5分钟,告警恢复则结束处理,否则查看告警附加文本,如果是温度过高,转步骤2,如果温度过低,转步骤4。
图 2‑31 将温度告警门限恢复为默认值
2. 检查外围环境,如空调是否正常工作、热交换器是否故障、是否有大功率发热设备等,外围环境恢复后,等待10分钟,如果告警恢复则结束处理,否则执行下一步。
3. 检查设备的进风口以及防尘网是否堵塞,去除堵塞物或者清洗防尘网,等待10分钟,如果告警恢复则结束处理,否则请寻求更高一级的设备维护支持。
4. 检查外围环境,如空调是否正常工作,加热器是否故障等,外围环境恢复后,等待10分钟,如果告警恢复则结束处理,否则寻求更高一级的设备维护支持。
12 RRU链路断(198097605)
1.1.1 告警原因
1. RRU运行异常;
2. RRU与主控板之间的通讯链路故障。
1.1.2 处理措施
1. 检查是否存在“光口未接收到光信号”、“光模块接收功率异常”、“光口接收帧失锁”告警,如有则依据对应处理指导处理,否则执行下一步;
2. 检查是否存在“版本包故障”告警,如有则先处理,否则执行下一步;
(1) 进入“软件版本管理”,查询对应站点运行版本,判断运行不正确的版本包。
图 2‑32 进入“软件版本管理”
图 2‑33 查询对应站点运行版本
(2) 在“升级任务管理”中新建升级任务,对运行异常的版本进行以下单个或组合处理:
下载:备用包无或者不正确。
预激活:目标版本非激活状态。
激活生效:通过复位单板将激活状态的版本转化成运行版本。
图 2‑34 对运行异常的版本进行处理
3. 检查RRU是否存在“硬件类型和配置不一致”告警,如有则先处理,否则执行下一步;
(1) 告警管理中查看告警。
图 2‑35 查看告警
(2) 配置管理中查看BPL和RRU的类型配置是否同前台实际硬件相符(双击设备)。
图 2‑36 查看BPL和RRU的类型
(3) 若不符删除重新添加正确的类型,查看实物的铭牌识别。
图 2‑37 删除重新添加正确的类型
(4) 修改正确后,在配置管理中进行数据同步。
图 2‑38 进行数据同步
4. 检查RRU是否存在“参数配置错误”告警,如有则先处理,否则执行下一步;
(1) 配置管理中重点检查“光口速率”和“光模块协议类型”,“光口速率”同RRU的硬件类型、实际使用光模块支持的速率、MIMO模式相关联,需要根据实际情况配置正确数值;对于FDD LTE,光模块协议类型使用“PHY CPRI”,对于TDD LTE,光模块协议类型使用“PHY LTE IR”。
图 2‑39 检查“光口速率”和“光模块协议类型”
(2) 修改正确后,在配置管理中进行数据同步。
图 2‑40 进行数据同步
5. 复位RRU,如果告警恢复则结束处理,否则执行下一步;
(1) 打开动态管理,选择对应站点。
图 2‑41 打开动态管理
图 2‑42 选择对应站点
(1) 对相应RRU进行复位。
图 2‑43 对相应RRU进行复位
6. 硬复位RRU,如果告警恢复则结束处理,否则执行下一步。
图 2‑44 硬复位RRU
7. 复位与该RRU连接的上级单板或RRU,如果告警恢复则结束处理,否则执行下一步。
图 2‑45 复位与该RRU连接的上级单板或RRU
8. 寻求更高一级的设备维护支持。
13 光口未接收到光信号(198092290)
1.1.1 告警原因
1. 光纤/电缆损坏;
2. 本端或对端光/电模块或光纤/电缆没插好;
3. 本端或对端设备的光/电模块损坏。
1.1.2 处理措施
1. 确保对端设备工作正常,如果告警恢复则结束处理,否则执行下一步;
(1) 确保RRU已正常上电。
(2) BPL/FS至RRU的光纤收发连接正确。
(3) 对于RRU拉远场景,首先要在RRU侧用光功率计测试BPL/FS至RRU的发射光通道的光信号强度,若强度在-2dBm~-10dBm之间,连接到RRU后,再在BBU侧测试RRU至BPL/FS的发射光通道的光信号强度是否正常。
小心:
为了保护人眼,RRU只有在接收到BBU的发光,并且BBU存在RRU和小区配置数据、BBU存储正确版本的情况下才会发光。
2. 确保光纤长度没有超过光模块支持的最大距离(在诊断测试中诊断光模块支持的最大距离),如果告警恢复则结束处理,否则执行下一步;
(1) 右键打开诊断测试,点击组合测试按钮,在相应BPL/FS中勾选光/点模块诊断。
(2) 在测试结果中可以看到BPL/FS对应光模块支持的最大传输距离以及光模块接受和发射的光功率强度,强度的正常范围一般为-2~-10dBm。
图 2‑46 查看测试结果
(3) 了解工程上实际的光纤长度,若超过光模块支持的传输距离,要求工程队进行BPL/FS和RRU上光模块的更换。
注意:
除了支持的传输距离外,注意光模块支持的最大带宽不小于更换前。考虑到兼容性问题,光模块要使用公司配置发货的,避免引入其他问题。
3. 确保光纤/电缆插好;检查光纤/电缆插头端面是否有污染,若有则清洁光纤/电缆插头。如果告警复则结束处理,否则执行下一步;
4. 排查光纤故障,如果告警复则结束处理,否则执行下一步;
(1) 根据诊断测试中的发送和接收功率,对可能的物理故障点进行光纤插拔。例如BPL1 0端口的TX发射功率为-4dBm,RX接收功率均为-15dBm左右,可能是RRU的光模块TX处或者BPL10端口的RX处光纤未插好。
(2) 采用交叉替换检测的方法确定是否为光纤问题,若故障随光纤变动,则是光纤问题,更换问题光纤。
注意:
因为交叉光纤影响扇区关系,检测后要复原正确的连接关系。
5. 拔插相应光/电模块,如果告警复则结束处理,否则执行下一步;
(1) 根据告警管理中判断故障的BPL/FS端口所在,物理单板最右侧的端口为0。
图 2‑47 判断故障的BPL/FS端口所在
(2) 插拔对应BPL/FS端口的光模块
(3) 插拔对应RRU的光模块
6. 更换相应光/电模块。
(1) 采用交叉替换检测的方法确定是否为光模块问题,若故障随光模块变动,则是光模块问题,更换对应的光模块。
14. 光模块接收光功率异常(198092431)
1.1.1 告警原因
1. 光纤损坏;
2. 光模块老化;
3. 光纤实际长度大于光模块支持的长度。
1.1.1 处理措施
1. 确保光纤长度没有超过光模块支持的最大距离(在诊断测试中诊断光模块支持的最大距离), 如果告警恢复则结束处理,否则执行下一步;
(1) 右键打开诊断测试,点击组合测试按钮,在相应BPL/FS中勾选光/点模块诊断。
图 2‑48 勾选光/点模块诊断
(2) 在测试结果中可以看到BPL/FS对应光模块支持的最大传输距离以及光模块接受和发射的光功率强度,强度的正常范围一般为-2~-10dBm。
图 2‑49 查看测试结果
(3) 对RRU进行光/电模块诊断,在测试结果中可以看到BPL/FS对应光模块支持的最大传输距离以及光模块接受和发射的光功率强度,强度的正常范围一般为-2~-10dBm。
图 2‑50 对RRU进行光/电模块诊断
图 2‑51 查看测试结果
(4) 了解工程上实际的光纤长度,若超过光模块支持的传输距离,要求工程队进行BPL/FS和RRU上光模块的更换。
注意:
除了支持的传输距离外,注意光模块支持的最大带宽不小于更换前。考虑到兼容性问题,光模块要使用公司配置发货的,避免引入其他问题。
2. 拔插光纤或光模块,如果告警恢复则结束处理,否则执行下一步;
(1) 根据诊断测试中的发送和接收功率,对可能的物理故障点进行光纤或光模块插拔。例如BPL10端口的TX发射功率和RX接收功率均为-4dBm左右;RRU侧TX发射功率为-4dBm,RX接收功率为-11dBm,则可能是BPL1向RRU的发射信号光纤两端接头未插紧导致。
(2) 重新进行诊断测试,查看发送和接收功率是否正常。
3. 更换光纤或光模块。
(1) 采用交叉替换检测的方法确定是否为光纤问题,若故障随光纤变动,则是光纤问题,更换问题光纤。
注意:
因为交叉光纤影响扇区关系,检测后要复原正确的连接关系。
(2) 采用交叉替换检测的方法确定是否为光模块问题,若故障随光模块变动,则是光模块问题,更换对应的光模块。
15. 光口接收帧失锁(198092286)
1.1.1 告警原因
1. 光纤/电缆端面污染;
2. 光纤/电缆链路异常;
3. 对端设备工作异常。
1.1.2 处理措施
1. 确保对端设备工作正常,如果告警恢复则结束处理,否则执行下一步;
(1) 确保RRU已正常上电。
(2) BPL/FS至RRU的光纤收发连接正确。
(3) 对于RRU拉远场景,首先要在RRU侧用光功率计测试BPL/FS至RRU的发射光通道的光信号强度,若强度在-2dBm~-10dBm之间,连接到RRU后,再在BBU侧测试RRU至BPL/FS的发射光通道的光信号强度是否正常。
(4) 注:为了保护人眼,RRU只有在接收到BBU的发光,并且BBU存在RRU和小区配置数据、BBU存储正确版本的情况下才会发光。
(5) 配置管理中重点检查“光口速率”和“光模块协议类型”,“光口速率”同RRU的硬件类型、实际使用光模块支持的速率、MIMO模式相关联,需要根据实际情况配置正确数值;对于FDD LTE,光模块协议类型使用“PHY CPRI”,对于TDD LTE,光模块协议类型使用“PHY LTE IR”。
图 2‑52 检查“光口速率”和“光模块协议类型”
2. 确保光纤长度没有超过光模块支持的最大距离(在诊断测试中诊断光模块支持的最大距离),如果告警恢复则结束处理,否则执行下一步;
(1) 右键打开诊断测试,点击组合测试按钮,在相应BPL/FS中勾选光/点模块诊断。
1) 在测试结果中可以看到BPL/FS对应光模块支持的最大传输距离以及光模块接受和发射的光功率强度,强度的正常范围一般为-2~-10dBm。
(2) 了解工程上实际的光纤长度,若超过光模块支持的传输距离,要求工程队进行BPL/FS和RRU上光模块的更换。
注意:
除了支持的传输距离外,注意光模块支持的最大带宽不小于更换前。考虑到兼容性问题,光模块要使用公司配置发货的,避免引入其他问题。
3. 确保光纤/电缆插好;检查光纤/电缆插头端面是否有污染,若有则清洁光纤/电缆插头。如果告警复则结束处理,否则执行下一步;
4. 排查光纤故障,如果告警复则结束处理,否则执行下一步;
(1) 根据诊断测试中的发送和接收功率,对可能的物理故障点进行光纤插拔。例如BPL1 0端口的TX发射功率为-4dBm,RX接收功率均为-15dBm左右,可能是RRU的光模块TX处或者BPL10端口的RX处光纤未插好。
(2) 采用交叉替换检测的方法确定是否为光纤问题,若故障随光纤变动,则是光纤问题,更换问题光纤。
注意:
因为交叉光纤影响扇区关系,检测后要复原正确的连接关系。
5. 拔插相应光/电模块,如果告警复则结束处理,否则执行下一步;
(1) 根据告警管理中判断故障的BPL/FS端口所在,物理单板最右侧的端口为0。
图 2‑53 判断故障的BPL/FS端口所在
(1) 插拔对应BPL/FS端口的光模块
(2) 插拔对应RRU的光模块
6. 更换相应光/电模块。
(1) 采用交叉替换检测的方法确定是否为光模块问题,若故障随光模块变动,则是光模块问题,更换对应的光模块。
16. 天馈驻波比异常(198098465)
1.1.1 告警原因
1. 天馈线缆连接故障;
2. 存在同频干扰信号;
3. RRU故障。
1.1.2 处理措施
1. 通过网管查询站点驻波比
(1) 打开“诊断测试”,双击待测试网元,在弹出测试界面中,点击“组合测试”按钮。
图 2‑54 打开“诊断测试”
图 2‑55 点击“组合测试”按钮
(1) 选择待测试RRU(可同时选择多个),勾选“RRU驻波比测试”、“RRU功率检测”,点确认进行测试,在结果中可以查看对应射频接口的驻波比。
图 2‑56 选择待测试RRU
图 2‑57 查看对应射频接口的驻波比
& 提示:
1. 驻波比是依据前向和反射合载功率按照驻波比计算公式得出的,相对于现场使用site master测试,是存在偏差的,3.0时正负0.3的精度,2.0一下正负0.2精度。
2. 同频干扰会增加反向合载功率值,导致驻波比增加,因此出现驻波告警不仅仅是线缆联接问题。
3. 驻波比是检测前向发射信号的,设备收发隔离度高,驻波一般不会导致RSSI增高,驻波比在一定范围内对业务影响很小。
4. 驻波比告警门限在配置管理的设置,单位为0.01,达到2.0告警,达到3.0会关闭功放进行保护。
图 2‑58 驻波比告警门限
5. 后台判断是否存在同频干扰
(1) 分析:对于复杂的天馈系统,特别是室分系统,因为射频器件多,比较容易引入同频干扰,例如合路器的频宽、隔离度等指标不达标,设计不合理等。导致出现驻波比告警,一般此类问题的现场有别于物理上引入的驻波比问题,并非连接就出现,而且降低天线发射功率驻波比会降低。
(2) 诊断驻波比,并在配置管理中记录此时的发射功率设置以及前向带宽值。
图 2‑59 记录发射功率设置
图 2‑60 记录前向带宽值
(1) 适当减小“CP修改信号功率”和“小区下行系统频域带宽”值,同步数据。
(2) 系统稳定运行一段时间(之前重启至出现驻波比告警的时间),再诊断驻波比,是否存在明显的降低,若存在,可能是自发射信号经过天馈系统引入同频干扰,重点排查天馈系统各器件技术指标以及天馈系统设计是否合理;若驻波比明显变大(前向合载功率变小、反射合载功率功率基本不变),可能存在外部的同频干扰,重点排查天馈系统中的其他信源。
6. 前台检查RRU、天线、馈线是否正确连接;
7. 前台检查各接头是否拧紧;
8. 采用交叉检测的方法确定是RRU故障还是天馈系统故障。如果是RRU故障,更换RRU,如果是天馈系统故障执行下一步;
(1) 对于多发的RRU,诊断并记录各ANT口的驻波比,对调ANT口的跳线,然后诊断驻波比,若随天馈系统变化,则是天馈系统故障。
(2) 对于单发的RRU,可以在后台更改其发射的ANT口,并调整对应的跳线,若驻波比无变化,则是天馈系统故障。
图 2‑61 后台更改其发射的ANT口
9. 逐级检查天线、合路器、馈线的驻波比,确定出现故障的部件,更换或维修该部件。
(1) 若前台使用sitemaster进行检测,可直接定位天馈系统的故障点,直接进行对应接头连接整改即可。
(2) 否则,根据后台定位的驻波天馈通道ANT n,进行所有接头的连接整改,器件的交叉检测和替换。
(3) 完成整改后,后台再次进行驻波比检测,直至驻波比告警消除。
17. GNSS天馈链路故障(198096836)
1.1.1 告警原因
1. GNSS天馈线缆连接异常或损坏。
2. GPS蘑菇头天线损坏。
3. 若有使用GPS防雷器或功分器等连接设备,则可能因连接设备内部通路异常。
1.1.2 处理措施
1. 点击工具栏上的 按钮,进入告警管理界面,在告警管理界面左侧网元拓扑树上,找到故障站点,在故障站点上点击右键→选择“当前告警”,如下图:
图 2‑62 查看当前告警
在打开的站点告警列表中,双击站点的对应告警信息“GNSS天馈链路故障(198096836)”条目,如下图所示:
图 2‑63 查看告警信息
在打开的告警信息窗口中,可以查看告警的详细信息以及简明“处理建议”,请先参考处理建议进行问题排查,如下图:
图 2‑64 告警详细信息与处理建议
2. 根据EMS告警处理建议,对天馈线缆各个接头处进行检查,看是否有松动或未拧紧的情况,若存在问题则予以重做连接;同时查看GPS馈线是否有弯折或破损的情况,若有则替换线缆。处理后,若故障消除则结束处理,否则进入下一步:
3. 检测CC单板GPS出口电压是否正常(4.6V~5V),不正常则更换CC单板再做检测,更换CC后告警得以消除则结束处理,否则执行下一步:
4. 如果测量工具等条件允许,可过电压测量法、电流测量法或电阻测量法等来进行天馈链路故障定位:
a. 电压测量法:通过万用表测量机顶馈线出口至GPS接收机各接线头出的电压是否正常。一般情况下,在机顶GPS天馈接头处、在分路器的GPS天馈接头处、在避雷器的接头处和GPS天线的馈头处,线芯和屏蔽套间的电压都应保持在4.6V~5V之间。若这些接头处电压测量值不正常,则重点检查是否因为馈线连接等不符合规范导致,比如:目测查看1/4”馈线长度是否明显大于100m,减少接入的功分器数量后各接头处电压是否明显趋于正常等。
b.电流测量法:找一个具有电流指示的直流电源,调整电压输出为5V,将5V端接GPS天线的N头的芯线,将地接GPS天线N头的屏蔽地。GPS天线的工作电流正常范围在 30~40mA之间。如果电流小于5mA或大于45mA,GPS天线肯定不正常。但如果测量的GPS天线的工作电流范围在30~40mA之间,也不能说明GPS天线没问题,要进一步确认没问题还需要通过电压测量法进一步定位。
c.电阻测量法:用万用表的电阻档,测试GPS天线的等效电阻。由于不同的万用表有不同的精度误差,用比对法测试出GPS天线的等效电阻。将万用表电阻的量程调到20K电阻档测试(注意由于GPS天线是有极性的,所以万用表的表笔的红(正)笔和黑(负)笔测试的方向不同,数值也就不同)。将红(正)笔接GPS天线的N头的芯线,黑(负)笔接GPS天线的N头的屏蔽地,记下几个GPS天线的等效电阻值R1。将黑(负)笔接GPS天线的N头的芯线,红(正)笔接GPS天线的N头的屏蔽地,记下几个GPS天线的等效电阻值R2。正常情况下,同一品牌的不同GPS天线的R1或R2的电阻值,应该都是在很小的范围内变化,如果明显某个同一品牌的不同GPS天线和同一品牌的其他GPS天线的R1或R2的电阻值有明显不同,那该GPS天线肯定有问题。比如R1和R2的电阻值为0或无穷大,说明GPS天线短路或断路,已经损坏。
通过上述方法若可以判断出故障所在,则进行相应的整改处理,整改后如果告警消除,则结束处理,否则可将问题升级请求更高一级支持。
5. 在GNSS告警消除之后,可以进入诊断测试界面查看锁定卫星的个数,具体操作如下:
a.进入网元管理界面,在EMS网元代理上点击右键→选择“诊断测试”,进入诊断测试功能界面:
图 2‑65 进入“诊断测试”
b.在诊断测试界面,双击对应网元NE,将会在右侧显示对应的硬件板位图,在板位图上面,点击 按钮(组合测试):
图 2‑66 进入“组合测试”
c.在打开的组合测试界面,选择CCC选项卡下的“内置GNSS信息查询”,然后点击“确定”,如下图:
d.在测试完成之后,测试结果界面将会显示锁定和可见的每一颗卫星方位信息,最下面一行显示锁定的卫星颗数,如下图:
图 2‑68 测试结果
18 GNSS接收机搜星故障(198096837)
1.1.1 告警原因
GNSS接收机搜星失败或者搜到卫星个数不满足门限时上报该告警,常见的触发原因有:
1. GNSS天馈连接线缆异常;
2. GPS天馈方向有建筑物阻挡;
3. 周边环境存在干扰。
1.1.2 处理措施
1. 点击工具栏上的 按钮,进入告警管理界面,在告警管理界面左侧网元拓扑树上,找到故障站点,在故障站点上点击右键→选择“当前告警”,如下图:
图 2‑69 查看当前告警
在打开的站点告警列表中,双击站点的对应告警信息“接收机搜星故障(198096837)”条目,如下图所示:
图 2‑70 查看告警信息
图 2‑71 查看告警详细信息和处理建议
2.进入诊断测试界面(具体操作入口及操作方法请参考2.1.2章节“GNSS天馈链路故障”的步骤5),查看GPS配置是否生效、天馈状态是否正常。
图 2‑72 查看告警详细信息和处理建议
检查GNSS天馈线缆连接,确保连接正常,且GPS天线安装符合工程规范(GPS天线竖直方向±60°范围内无遮挡物),确保良好的卫星视通条件,排查整改后如果告警恢复则结束处理,否则执行下一步;
3. 通过扫频仪查看周边是否存在GNSS干扰源(比如:GPS天线是否安装在微波天线和高压线及电视发射塔的下方,是否受到移动基站天线的主瓣辐射等)。
也可以通过屏蔽天线的方法来检查是否有外界干扰:即用一个圆柱型上下通口的金属罩罩住GPS天线,查看EMS告警信息,若罩住GPS天线后该告警消除,说明存在干扰,则需要排除或避开干扰源。
4. 若上述方法都无法解决故障,请进行CC单板复位,以及用功能正常的GPS天线进行替换法检查,若告警消除,则结束处理,若告警依然存在,可将问题升级,联系相关专家处理。
6. 在完成故障排查后,可以进入诊断测试界面(具体操作入口及操作方法请参考2.1.2章节的步骤5,此略),查看GPS配置是否生效、天馈状态是否正常。
19. 没有可用的空口时钟源(198092217)
1.1.1 告警原因
1. 未配置空口时钟源;或空口时钟源配置不当。
2. 空口时钟源均锁不定(时钟源干扰严重,超出晶振调节限值;或晶振故障)。
1.1.2 处理措施
1. 点击工具栏上的 按钮,进入告警管理界面,在告警管理界面左侧网元拓扑树上,找到故障站点,在故障站点上点击右键→选择“当前告警”,如下图:
图 2‑73 查看当前告警
2. 进入告警管理界面,双击站点的对应告警信息,查看告警信息并参考处理建议,如下图:
图 2‑74 查看处理建议
此外,还可以进入告警菜单中的“处理建议设置”页面,输入相应的关键词搜索,参考网管中的相关处理建议,进行相应的排查处理,下图为该功能的操作入口:
图 2‑75 查看相关的处理建议
比如可以在打开的处理建议页面输入“空口”并敲回车,将搜索出典型的与空口相关的故障处理建议:
图 2‑76 查看相关处理建议明细
3. 根据系统建议,检查是否配置了空口时钟源,若未配置则增加空口时钟源配置并同步到网元;否则进行下一步;
4. 在配置管理中查看当前配置的时钟参考源,检查这些时钟参考源是否存在其他告警,如有则先处理其他告警。待相关时钟源告警恢复之后,若此告警恢复则结束处理,否则执行下一步;
5. 检测CC单板GPS出口电压是否正常(4.6V~5V),不正常则更换CC单板再做检测,告警若得以消除则结束处理,否则执行下一步:
6. 如果测量工具等条件允许,可通过章节2.1.2(GNSS天馈链路故障)的步骤4所介绍的电压测量法、电流测量法或电阻测量法等来进行天馈链路故障定位:
7. 通过上述方法若可以判断出故障所在,则进行相应的整改处理,整改后如果告警消除,则结束处理,否则可将问题升级请求更高一级支持。
20. SNTP对时失败(198092014)
1.1.1 告警原因
1. SNTP对时服务器地址配置错误;
2. SNTP服务器故障;
3. 网络故障。
1.1.2 处理措施
【说明】SNTP对时成功的条件:①CC单板到NTP服务器之间链路通畅,②NTP服务器上已经开启NTP服务,③CC单板功能正常,且已进行正确的NTP服务器链路数据配置,配置节点入口见下图:
图 2‑77 查看时间设备配置
结合上述必要条件,可知SNTP对时失败的主要排查思路是:首先看配置和传输链路,然后再进行CC单板对应的功能检查。
1. 点击工具栏上的 按钮,进入告警管理界面,在告警管理界面左侧网元拓扑树上,找到故障站点,在故障站点上点击右键→选择“当前告警”,如下图:
图 2‑78 查看当前告警
然后,双击站点的对应告警信息,如下图:
图 2‑79 查看当前告警详情
在打开的告警信息及处理建议对话框中,可以参考告警详细信息和处理建议,如下图:
图 2‑80 查看告警详情和处理建议
2. 针对告警处理建议,具体处理方法如下:
1)确认配置的“SNTP服务器地址”正确;SNTP服务器地址务必对于eNB而言路由可达;若使用OMC作为NTP服务器,则确保应该使用ommb的基站通信地址作为NTP服务器IP地址(不可用OMMB的级联IP),如下图所示:
图 2‑81 查看NTP服务器配置
2) 确认NTP服务器防火墙已经关闭,且NTP服务已经开启,对于Linux系统的NTP服务器,可在服务器上用命令“service NTP start”手动启动NTP服务:
lteomm1:~ # service ntp start
Starting network time protocol daemon (NTPD) done
lteomm1:~ #
3) 检查网元和SNTP服务器之间的网络链路是否通畅,是否存在丢包情况,如果丢包严重,则需要重点排查传输问题,ping包方法如下:
a. 右键点击网元代理节点,选择“诊断测试”,进入诊断测试界面:
图 2‑82 进入诊断测试
b.在“诊断测试”界面,点击“诊断”菜单,选择“IP通道质量测试”,如下图:
图 2‑83 进入IP通道质量测试
然后IP通道质量测试界面上方的 按钮将被点亮,填入对应的目的IP地址(即NTP服务器地址),并点击该按钮,则ping包测试开始运行,ping包结果统计将在ping操作完成之后显示在界面下方的列表中:
图 2‑85 填写目标IP
如果检测传输链路不正常,请重点排查传输链路问题。如果传输链路正常,请执行下一步:
4) 执行“SNTP强制对时”操作:
第一步,进入动态管理:
第二步,选择对象站点:
第三步,执行强制对时操作:
3. 若上述方法依然无法消除告警,可将问题升级,请求更高一级支持。
21. 版本包故障
1.1.1 告警原因
1. 部分单板无法从版本包获取版本,或版本异常
1.1.2 处理措施
1. 重下版本包,如果基站的版本比规划版本低,那么直接下载,激活最新的固件版本版本包,平台版本包,FDD软件版本包即可,
2. 如果基站运行的版本号和规划的版本号相同但是是单模版本(目前规划全网使用双模版本),那么需要回退到09版本,并激活09版本,再下载激活10双模版本包。
规划的双模版本的3个版本包:LTE-FDD-SW-V3.10.20P02B10.pkg(FDD 产品版本包),PLAT-FW-V3.10.20P02B10.pkg(固件版本包),PLAT-SW-V3.10.20P02B10.TFL.pkg(平台版本包)。