还剩12页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
MOD CELLACBAR:AcBarringlnfoCfglnd=CFG,AcBarringForMoDataCfglnd=CFG,AcBarringFactorForCall=P70,AcBarTimeForCall=ACCESS_BARRING_TIME_S4,AcBarringForMoSigCfglnd=CFG,AcBarringFactorForSig=P70,AcBarTimeForSig=ACCESS BARRINGTIME S4;原
1.MME因导致a L.E-RAB.FailEst.MME有大量统计按照该表
2.1节继续判断是否干扰太大建立ERAB失败不扰il导致空口消实施干扰抑制措施,包括
1.息交互延a上行干扰随机化M8迟,MME CELLULSCHALGO:LOCALCELLID=x,ULRBA定时器超时LLOCATIONSTRATEGY=FS_INRANDOM_A先释放DAPTIVE;a PUCCH IRC MODCELLALGOSWITCH:LOCALCELLID=x,IRCS〃注意,有控WITCH=PucchlrcSwitch-1;license制,控制项为LOFD-001094Control ChannelIRC》关闭同频邻区的下行频选MCDCELLALGOSWITCH:LocalCellld=x,DISchSwitch=FreqSelSwitch-O;抬升超过;a L.UL.Interference.Avg20DB»限制上门限PUSCH RSRPPuschRsrpHighThdMODCELLPCALGO:PuschRsrpHighThd=-96;MOD CELLALGOSWITCH:LocalCellld=0,UIPcAlgoSwitch=PuschRsrpHighThdSwitch-1;〃从开始支持ERAN
7.0若不能达到预期效果,考虑收缩覆盖,将功率
2.RS降低以收缩覆盖但该措施有可能对同频邻区,3~6DB及同覆盖的异频/异系统邻区带来短时话务冲击,并可能出现覆盖盲区从而部分用户完全失去服务,具体影响可联系当地团队评估RF MODPDSCHCFG:LocalCellld=X,ReferenceSignalPwr=**;无线侧信2,令交互失有大量统L.E-RAB.FailEst.SRBReset按照该表节继续判断是否干扰太大败导致计
3.1建立ERAB失败干扰导致空口信令按照节继续判断是否干扰太大参考该表节措施处理
2.
12.1交互失败
3.无线资源按照该表
4.1节继续判断是否用户数或流量license受限不足导致以
3.1用户数
1、先考虑加载临时License;有大量打点建立a L.E-RAB.FailEst.NoRadioRes下ERAB或流量
2、或启用紧急状态LicenseSET LICENSECTRL:条件满足任意一个即可失败license受FUNCTIONTYPE=eNodeB;每个R版本只能用>基站上报容量超限告警license限3次;;ALM-
26812、若上述措施无法执行,参考的措施限制用户接
31.1有大量打点;入;有大量打点;片基站所有小区最大在线用户数之和超过License检查并确认如下资源自适应开关已全部打开用户数规格的;90%资源自动调整a SRIMCD用户数
3.2或流量GLOBALPROCSWITCH:未licenseSriAdaptiveSwitch=ON;受限资源自动调整方案a PUCCHMODCELLALGOSWITCH:LocalCellld=x,以下条件都不满足a基站上报容量超限告警PucchAlgoSwitch=PucchSwitch-1;licenseALM-26812;a CQI周期自动调整MOD CQIADAPTIVECFG:有大量打点;CqiPeriodAdaptive=ON;有大量打点;周期自适应调整a SRS MOD SRSADAPTIVECFG:基站所有小区最大在线用户数SrsPeriodAdaptive=ON;之和超过用户L.Traffic.User.Max License数规格的90%;a SRS子帧配置重配开关调整MCDCELLALGOSWITCH:SrsAlgoSwitch=SrsSubframeRecfSwitch-1;恢复子帧配置为默认配置SRS SrsSubframeCfgMOD SRSCFG:SrsSubframeCfg=SC3掉话率急剧恶化应急处理
2.
4.4入口条件单次分钟话统发现掉话率急剧恶化恶化程度已经超过客户预期如果客户没有明确预期,建议门限为1510%应急措施总体处理流程如下原因确认方法处理建议
1.SRI周
1.对于DRX关闭场景,打开如下开关MOD期与GAP周ENODEBALGOSWITCH:期冲突HoCommOptSwitch=BasedSriGapOptSwitch-1;及之后版本支持//eRAN
6.0SPC270有大量统计;a L.E-RAB.AbnormRel.Radio对于打开场景,打开如下开关
2.DRXa存在场景,如异频切换、等GAP CAMODENODEBALGOSWITCH:HoCommOptSwitch=DrxBasedSriGapOptSwitch-1;//eRAN
7.0SPC160及之后版本支持干扰抬
2.各环节判断方法及详细处理建议参考如下与施干扰抑制措施,包括:
3.升,空口质片上行干扰随机化MOD CELLULSCHALGO:LOCALCELLID=x,ULRBA量恶化LLOCATIONSTRATEGY=FS_INRANDOM_A DAPTIVE;a PUCCHIRC MOD〃CELLALGOSWITCH:LOCALCELLID=x,IRCS WITCH=PucchlrcSwitch-1;注意,有控制,控制项为license LOFD-001094Control ChannelIRC»关闭同频邻区的下行频选MOD CELLALGOSWITCH:LocalCellld=x,DISchSwitch=FreqSelSwitch-O;a限制上门限PUSCH RSRPPuschRsrpHighThd MODCELLPCALGO:PuschRsrpHighThd=-96;抬升超过;a L.UL.Interference.Avg20DBMOD CELLALGOSWITCH:LocalCellld=0,UIPcAlgoSwitch=PuschRsrpHighThdSwitch-1;〃从开始支持ERAN
7.0若不能达到预期效果,考虑收缩覆盖,将功率降低以收缩4,RS3~6DB覆盖但该措施有可能对同频邻区,及同覆盖的异频/异系统邻区带来短时话务冲击,并可能出现覆盖盲区从而部分用户完全失去服务,具体影响可联系当地团队评估RFMOD PDSCHCFG:LocalCellld=X,ReferenceSignalPwr=**;保障准备
2.5备份数据
2.
5.1本文中涉及到的修改,绝大部分都是针对大话务量冲击场景的,因此,在这些参数变更之前,我们需要备份当前的数据配置;在话务冲击结束之后需要将基站配置恢复到正常配置另外,为了在出现问题时定位问题方便,需要保存更改参数前后、话务冲击前后的主控板一键式口志、基带板一键式日志、话统等数据防止在出现问题时因保存不及时导致数据不足的现象备份配置和采集日志均可使用远程操作和近端操作,推荐使用操作;(参数修改前M2000WebLmt M2000一天)监控模板制定
2.
5.2KPI目前的KPI指标情况如下表所示目的话务高峰来临前现场应该事先确认登记下面的15分钟话统指标:设置告警门限
2.
5.3KPI需要监控的KPI和阈值门限值请参考节KPI监控模板1)首先新建一个告警登陆M2000,选择菜单Performance-Threshold Management-Alarm NameSetting进入新建告警的界面2)添加一个新的告警名字3)添加新告警成功4)然后,为新建的告警设置对应的KPI阈值选择菜单Performance-Threshold Management-threshold Setting进入KPI门限设置界面5)在左侧的导航树中选择需要检查的KPI类型6)在右侧面板上单击鼠标右键,选择“Add”7)在Basic ThresholdInformation面板中,选择需要监控的网元(对于SOP,建议是全部网元),给该门限任务命名,并关联到先前新建的告警8)在Extended ThresholdInformation面板中,选择具体要监控的KPI项、指标恶化方向(升或降)及不同告警级别的告警门限值注意部分项目需要提前自定义好,比如具体可以参考在线帮助章节KPI CallDrop Rate,M2000Setting User-defined Counters9)点击“OK”即可10)可以在Monitor-Browse AlarmList中查看是否发生了告警启动和用户数性能监控
2.
5.4CPU启动CPU占用率监控
1.登陆M2000,选择菜单Monitor—Signaling Trace—Signaling TraceManagement
2.选择CPU UsageMonitoring启动用户数监控
1.登陆M2000,选择菜单Monitor—Signaling Trace—Signaling TraceManagement
2.选择Users StatisticMonitoring节中值守措施3尖键数据观测记录
3.1告警观测活动过程中,需要关注的告警如下:类型告警名称告警ID触发原因处理建议1)如果确定是业务量导致的(比如用户数接近规格),CPU过单板过载告ALM-2620当单板处理芯片占用率过高时,产生此进行处理;载警2告警2)如果不是,建议重启单板;3)如果仍不能恢复,需要更换单板单板硬件ALM-26201)建议首先重启单板;单板硬件故障时,产生此告警硬件故障故障告警02)如果仍不能恢复,需要考虑更换单板‘当网元系统业务量持续超出License容与客户沟通,启用固定期限/紧急License系统超出量限制(可设置)时,产生此告警当网Licens cALM-2681License容量元系统业务量持续低于License容量限制容量不足2限制告警的90%(可设置)时,恢复该告警•♦1)如是用户数引起,需要进行用户数控制;当SCTP发送缓存被大量需要重传的数SCTP链路ALM-2588传输拥塞据占用,占用比例达到整个发送缓冲区2)尝试重置SCTP链路;拥塞告警9的拥塞产生门限时,产生此告警3)重启单板小区不可用当基站检测到小区不能提供业务时,产ALM-2924重启基站告警生此告警0小区无话务ALM-2924当eNodeB检测到小区在设置时间内无重启基小区状态量告警用户接入时,产生此告警2小区服务能[^基站射频资源或基带资源不能满足当前依据告警帮助进行处理ALM-2924力下降告警小区的配置规格时,产生此告警3—观测KPI监控上文中给出的KPI观测CPU按照上文中给出的方法监控CPU负荷问题处理首先按照事先准备的应急预案处理恢复若不能取得理想效果,联系电话值班人员进行问题分析处理通报KPI值守期间需定期发送KPI监控数据以便于相关保障值守人员及时了解详细情况,可提升问题响应速度该环节务必执行到位现场人力情况,可考虑每30或60分钟发送一次数据收集值守期间及时备份日志数据非常重要,因为高话务期间日志数据量大,保存时间短若不及时备份,一旦事后出现问题,或有其它类似的数据分析需求,很可能面临无日志可参考的困境为避免该问题,需要在每天保障结束后导出保障站点的主控一键式日志主控一键式日志的导出对主控CPU占有率有影响,因此必须在话务回落后执行建议等到主控CPU峰值占有率低于50%后主控一键式日志文件较大,如果保障区域站点众多,可只备份话务最高的T0P3站点另外,保障站点的配置文件也一并提取2小区话务预测小区话务预测通常有三种方法基于历史话务分布;1基于预估人群集中区域;2基于人群均分的原则预估各小区话务3从准确性来讲,方法到方法依次降低,但实施难度也依次降低提取最近时间段内的用户使用情况如下附件133单板话务预测I按照当前配置查询得到每个基带板配置了哪几个小区,将这几个小区预测的平均在线用户数相加就得到了预测的该基带板的平均在线用户数;I将该基站所有小区预测的平均在线用户数相加就得到了预测的该主控板均在线用户数容量风险评估
2.
1.2基于话务预测章节预测出的小区、单板基带、主控的平均在线用户数,结合类似事件或当前网络的话务模型,评估当前
2.L1的硬件配置主控板、基带板、小区数量和软件资源用户数容量是否能承载预期话务若不能承载,需给出明确的扩容建议Liconso容量风险评估逻辑流程参考如下1硬件容量评估硬件容量评估是基于现网数据,预估主控板或基带板过载时的用户数门限理论分析和经验数据都表明,单板负荷随在线CPU用户数增加呈现线性增长的趋势,因此基于现网数据得出的线性增长规律可以用来预测单板风险数据的选择原则为若该区域最近个月内有高话务站点单基带板平均在线用户数超过则选用个此类站点数据;13100,3~5若不满足条件则选择其它区域类似场景如都是足球比赛中单基带板平均在线用户数超过21,100的站点数据;若条件、都不满足,则选择全网最高话务个站点数据3123~5另外,为获取更多数据样本点以使得统计规律更为准确,建议使用分钟粒度的话统数据4152CPU利用率当峰值利用率达到时将触发严重流控导致受损,因此容量调整的目的是避免峰值利用率超过然后按照CPU90%KPI CPU90%o上面计算得到的峰均比计算得到峰值利用率对应的平均利用率,即为过载门限例如统计得到峰均比为则过载门限即90%CPU L5,为60%=90%/L5扩容建议主控板的扩容方案有换用、双主控、站点分裂扩容演进原则如下UMPT如果评估主控板需要扩容,则根据当前配置情况选择后一种演进方案例如当前是则建议换用LMPT,单UMPTo3License容量评估在线用户数受限将导致建立失败接入失败的用户业务需求得不到满足必然反复重试,会增License ERAB加大量接入信令,从而增加和空口资源的开销该风险一定要避免CPU建议在保障期间在线用户数申请最大值license10800引导客户首先是购买保障如果不行,在应急场景下使用临时.license,license注在线用户数是指如下控制项License编号名称中文LLT1ACTU01RRC连接用户数每RRC连接用户数FDD英文LLT1ACTU01RRC ConnectedUserper RRCConnectedUser容量受特性影响风险评估某些特性可能导致LTE系统容量发生显著变化,在资源容量评估环节需特别加以注意现在已知的是SFNo
1.2网络健康检查通过维护SOP巡检,排除保障站点可能存在的设备状态异常和KPI异常软件中心-〉版本软件->无线->无线网管系统868->MAINEX207要求检出的问题要全部清理网络调整优化
1.3扩容实施
2.
3.1根据硬件容量评估结果进行资源调整,包括板间负载均衡、双主控、以及其它扩容策略,包括加站、换板、小区分裂等此次淄博针对春节大话务情况对19个公网D频段小区和室分8个E频段小区进行了扩容操作如下表所示版本升级
3.
3.2基于话务预测结果和实际保障经验,如果预计单小区峰值在线用户数将超过400,建议升级到大话务性能最优的版本,目前淄博移动LTE网络已经完成公网和高铁的版本升级公网升级至eRAN
7.0SPC175,高铁升级至eRAN
8.0SPC120版本负载均衡
4.
3.3从ERAN
7.0版本开始,异频MLB算法逐渐成熟并开始在大话务保障中应用异频MLB按照触发方式,分为基于PRB利用率和基于用户数两种,图示如下在重大事件场景下,大流量用户比例非常低,基于PRB利用率的MLB难以选出足够数量的用户执行负载均衡,效果不理想,因此推荐基于用户数的MLB异频MLB按照执行方式,分为连接态MLB和空闲态MLB两种图示如下连接态MLB适用于各种覆盖场景,但却有切换信令开销,在高话务场景下对CPU和空口资源开销有一定影响因此在适用空闲态MLB的覆盖场景下优先推荐空闲态MLB大话务常见的覆盖场景以及对应的MLB推荐策略如下:场景推荐策略场景一
1.采用基于用户数的空闲态MLB(要双向配置MLB,
1.负载均衡小区共覆盖区域(同站全共覆盖或异站部分共覆盖);即负载均衡的小区要互为均衡);
2.负载均衡的某个目标频点就一个小区(例如Frel--Freq2互相均
2.Idle驻留策略无要求,随机或倾向性驻留都可衡时,Frei和Fre2频点小区都只有一个);以,可以保持原网配置
3.不同频点带宽大小差异无要求
4.终端渗透率无要求;场景二
1.Idle态采用倾向性驻留策略,优先驻留覆盖L同站部分共覆盖区域(某个频点覆盖范围较小且未形成连续覆范围小的载波;盖,如仅能覆盖其它频点的30%用户及以下,如宏微异频组网,微站高优
2.采用基于用户数的空闲态MLB(要单向配置先级);MLB,覆盖范围小的载波往范围大的载波做均
2.负载均衡的某个目标频点就一个小区(例如Frei--Freq2衡)均衡时,Fre2频点小区只有一个);
3.不同频点带宽大小差异无要求;
4.终端渗透率无要求;
1.Idle态采用随机驻留策略;场景三
1.异站负载均衡小区部分共覆盖区域;
2.采用基于用户数的连接ML R要双向配置MLB,
2.负载均衡的某个目标频点有多个小区(例如Frei--Freq2即负载均衡的小区要互为均衡)互相均衡时,Fre2频点小区有2个);Note此策略,要提前触发MLB,即在低负载的
3.不同频点带宽大小差异无要求;时候,通过连接态负载均衡,使得均衡到低负载的目标小区的用户,在本次业务释放后,下次空闲态
4.终端渗透率无要求;发起业务接入时,仍旧从低负载小区接入,最终达到空闲态即可达到均衡的目的;优化
2.
3.4RF根据保障经验,影响LTE性能的首要因素是RF覆盖质量良好的RF覆盖能够保证较高的上下行频谱效率,在频谱资源固定的前提下能够保证较高的小区和用户体验吞吐率基于历史数据经验,同一个区域的两次活动,当RF优化充分时,话务高峰期邻区间上行干扰可控制在10dB以内;而在RF优化不合理时,同等话务规模时邻区间上行干扰超过20dBo由此带来的下行用户感知速率的差距超过20倍性能参数优化
2.
3.5性能保障参数建议在扩容和版本升级后,活动开始前7天实施,观察实施后KPI是否有异常如果保障区域在活动开始前完全无话务,则建议在路测之前实施,以便利用路测KPI验证是否有异常参数调整checklist表如下表所示应急预案
2.4在值守开始前要预先制定应急预案,并拉通相关资源进行演练,确保问题能够有序高效的处理应急预案主要分为以下场景告警应急处理
2.
4.1值守期间若出现告警,请按照如下原则进行处理1)首先按照告警帮助进行处理(重启和换板措施在本步骤先不考虑);2)若不能消除告警,求助产品维护保障值守人员建立成功率急剧恶化应急处理
2.
4.2RRC入口条件单次分钟话统发现建立成功率急剧恶化(恶化程度已经超过客户预期如果客户没有明确预期,建议门限为)15RRC90%应急措施总体处理流程如下各环节判断方法及详细处理建议参考如下象原因确认方法处理建议C
1.无线资源受限立功恶有a L.RRC.SetupFail.ResFail按照该表节继续判断是否用户数规格受限大量统计
1.1用户数1,修改T302定时器到16sMOD超过小区/a对于ERAN
7.0及之后版本:L.RRCCONNSTATETIMER:T302=16;单板规格RRC.SetupFail.ResFa il.、考虑收缩覆盖将功率降低以收缩覆盖但该措施2RS3~6DBUserSpec统计值占有可能对同频邻区,及同覆盖的异频/异系统邻区带来短时话务冲的L.RRC.SetupFail.ResFail击,并可能出现覆盖盲区从而部分用户完全失去服务,具体影响可联大部分;系当地团队评估RF MOD PDSCHCFG:LocalCellld=X,>对于之前版本,;法ERAN
7.0ReferenceSignalPwr=**;快速判断,跳过此环节,转启用该措施不会对邻区产生话务冲击,但会增加本
3.AC BAR到
1.2节小区全部用户的接入时延执行如下两条命令,如果执行下面的命令后用户数仍然超,可以把第二条命令中黄色标识的参数接入干扰抬概率进一步降低,延迟时间进一步拉长;
4.升,空口恶MOD CELLALGOSWITCH:化.AcBarAlgoSwitch=ACBAR_SWITCH_STATIC;MOD CELLACBAR:AcBarringlnfoCfglnd=CFG,AcBarringForMoDataCfglnd=CFG,AcBarringFactorForCall=P70,AcBarTimeForCall=ACCESS_BARRING_TIME_S4,以下两个条件同时满足AcBarringForMoSigCfglnd=CFG,AcBarringFactorForSig=P70,;检查并确认如AcBarTimeForSig=ACCESS_BARRING_TIME_S4i有大量统计;下资源自适应开关已全部打开抬a L.UL.Interference.Avg资源自动调整a SRIMOD GLOBALPROCSWITCH:升超过;20DB用户数
1.2SriAdaptiveSwitch=ON;未超过规格,或无法a PUCCH资源自动调整方案MOD CELLALGOSWITCH:判断LocalCellld=x,PucchAlgoSwitch=PucchSwitch-1;a对于ERAN
7.0及之后版本L.周期自动调整RRC.SetupFail.ResFa il.CQI MODCQIADAPTIVECFG:UserSpec统计值只占CqiPeriodAdaptive=ON;的小L.RRC.SetupFail.ResFail周期自适应调整SRSMODSRSADAPTIVECFG:部分;SrsPeriodAdaptive=ON;a对于之前版本,直接执ERAN
7.0子帧配置重配开关调整行此环节SRS MODCELLALGOSWITCH:SrsAlgoSwitch=SrsSubframeRecfSwitch-1;a恢复子帧配置为默认配置SRS SrsSubframeCfgMOD SRSCFG:SrsSubframeCfg=SC
32.MME过a对于ERAN
7.0及之后版如果是基带板过载,直接关闭;如果是主控板过载,将
1.DRX负
3.1CPU载本L.RRC.SetupFail.Re j.进入退出门限配DRX荷较高导致参考该表
1.1节“用户数超过基站规格”处理,降低接入次MMEOverload有大量统计M2000跟踪或话统查询到主置为1000,或直接关闭数;被丢Msg3a对于之前版本,无DRX控E或R基AN带7板.0最大占有率CPU弃或拒绝//关闭法快速判断,跳过该环节MOD DRX:DrxAlgSwitch=ON;DRX超过;或者基站上报单80%
3.有大量MOD CELLDRXPARA:LocalCellld=0,板过载告警;Msg3因流a L.RRC.ConnReq.Msg.disc.FddEnterDrxThd=1000,或控而被拒绝FlowCtrl按照该表节继续判断是否过载
3.1CPU〃修改进入退出门限FddExitDrxThd=1000;有大量统计;或丢弃Ctrl<该建卡用户数超过基站规格上处理」
2.*11降低^入次数;
一、实施干扰抑制措施,包括1上行干扰随机化MOD CELLULSCHALGO:LOCALCELLID=x,ULRBALLOCATIONSTRATEGY=FS_INRANDOM_ADAPTIVE;》PUCCHIRCMOD有控制,控制项为CELLALGOSWITCH:LOCALCELLID=x,IRCSWITCH=Pucc hlrcSwitch-1;//at,licenseLOFD-001094Control ChannelIRC关闭同频邻区的下行频选0MOD CELLALGOSWITCH:LocalCellld=x,DISchSwitch=FreqSelSwitch-O;a限制上门限PUSCH RSRPPuschRsrpHighThdMODCELLPCALGO:PuschRsrpHighThd=-96;MOD CELLALGOSWITCH:LocalCellld=0,//从UIPcAlgoSwitch=PuschRsrpHighThdSwitch-1;开始支持ERAN
7.
02、若不能达到预期效果,考虑收缩覆盖,将RS功率降低3〜6DB以收缩覆盖具体影响及请参考该表节措施MML
1.1建立成功率急剧恶化应急处理
2.
4.3ERAB入口条件单次分钟话统发现建立成功率急剧恶化(恶化程度已经超过客户预期如果客户没有明确预期,建议门限为)15ERAB90%应急措施总体处理流程如下各环节判断方法及详细处理建议参考如下原因确认方处理建法议.传输原因1导致有大量统计;按照该表节继续判断是否传输拥塞a L.E-RAB.FailEst.TNL
1.1建立ERAB失败
1.1传输拥按照如下方法限制接入次数,缓解SCTP拥塞塞导致修改定时器到1,T30216s MOD建立ERABRRCCONNSTATETIMER:T302=16;失败、考虑收缩覆盖将功率降低以收缩覆2RS3~6DB盖但该措施有可能对同频邻区,及同覆盖的异频/异系统邻区带来短时话务冲击,并可能出现覆盖盲区从而部分用户完全失去服务,具体影响可联系当地团队RFa有SCTP链路拥塞告警;评估MODPDSCHCFG:LocalCellld=X,ReferenceSignalPwr=**;启用该措施不会对邻区产生话务冲击,但3,AC BAR会增加本小区全部用户的接入时延执行如下两条命令,如果执行下面的命令后用户数仍然超,可以把第二条命令中黄色标识的参数接入概率进一步降低,延迟时间进一步拉长;MOD CELLALGOSWITCH:AcBarAlgoSwitch=ACBAR SWITCHSTATIC;。