设计指南 4705

电信系统的热插拔设计:避免拼凑、支持高效设计

By: Hamed Sanogo

摘要 : 本应用笔记讨论了热插拔电路在常备系统中的重要作用和电路优化,本文以电信系统作为需要插入背板的微处理器板卡的例子。“始终保持有效运转”的系统定义为不会因为维护或整修而断电的系统,本文涉及的“5个9”高度可靠系统几乎意味着零关断。如此可靠运行的设备必须依靠热插拔电路,在不关闭整体系统电源的前提下插入或拔出维护板卡。本文详细介绍了热插拔电路,对一些拼凑而成的热插拔方案加以分析,说明了这些方法中存在的缺陷。本文还阐述了新一代高集成度控制器,这些热插拔控制器从根本上克服了早期设计的问题。

类似文章于2010年7月19日发表在Planet Analog网站。

引言

与其它复杂的多卡系统类似,电信系统是由插入背板的微处理器板卡系统的集合。这类“始终保持有效运转”的系统通常包括:专用交换机(PBX)、蜂窝基站(BTS)、刀片式中心(BCT)服务器、网络数据通信和存储系统。系统一旦上电运行,将不允许断电中止服务或进行维护。

通常用“5个9”描述这些系统,即99.999%地保持有效运转,这意味着几乎为零的关断时间。对于工作在这一级别的系统,必须允许在保持整个系统工作的状态下插入或拔出板卡,以便对系统进行维护、升级和配置,有时甚至是在不影响系统工作的状态下进行系统扩展。

本文讨论了板级工程师目前在设计热插拔电路时所采取的一些拼凑式方案,并在随后探讨了几种新一代热插拔控制的创新方案。“热插拔”定义中重点强调了电压瞬变,文中介绍了拼凑式热插拔控制方案的一些负面影响。文章最后介绍了近期推出的热插拔控制创新技术。

热插拔事件:理解瞬变

图1. 多PCB基板系统
图1. 多PCB基板系统

热插拔事件:板卡插入、拔出时产生的浪涌电流尖峰

热插拔表示在全速运转、没有断电的系统中插入或拔出板卡、电缆或其它装置。利用合理的设计,带电插入板卡时不会在电源或系统的输入、输出信号上产生任何干扰。

当一个背板插入所有板卡并保持全速运转时(图1),背板上的板卡均处于带电状态。这意味着每块板卡的电源输入端都有一个大电容,而且这个旁路电容处于完全充电状态。电源输入端的大电容为电源设计提供了个重要作用:为板卡的下游电路提供稳定的供电电压,消除旁路电容上的扰动以满足负载的瞬态供电需求。

如果将机架上尚未充电的一块板卡插入带电背板时,将会发生几种情况。参考图2,在新插入并开始上电的PCB上,用于旁路和滤波存储的大电容将呈现瞬间短路并开始充电。充电电荷来自于带电系统,电容C1、C2和C3 (这些其它板卡上已经充电的电容将开始放电)。这种不受控制的电容充电(或放电)将对新插入板卡上的电容注入较大的浪涌电流。浪涌电流的幅度可能在极短的时间内达到数百安培,取决于实际系统。

随着电容快速充电,它们将表现为短路状态,瞬间吸收较大的电流。图3给出了注入电解电容的浪涌电流的波形图,以及电容充电时两端的电压。从曲线图可以看出,电流峰值达到了9.44A,从系统吸取较大功率,这将导致背板系统的电容放电。从而使电源电压跌落,可能造成相邻板卡复位,引入数据传输故障或严重干扰其它系统的运行。

瞬间浪涌电流的幅度是负载(早供电)电容的函数,负载电容越大(并且,ESL和ESR越低),峰值浪涌电流越大。

图2. 电路板插入顺序和上电时的浪涌电流
图2. 电路板插入顺序和上电时的浪涌电流

图3. 注入电解电容的浪涌电流和电容充电时两端的电压
图3. 注入电解电容的浪涌电流和电容充电时两端的电压

电压瞬变的影响可能导致系统失效

任何系统中,这些背板的电源通常提供电流限制。热插拔过程中所产生的电压瞬变可能对已插入背板的板卡造成严重威胁。浪涌现象会导致背板电源的跌落,而背板电源总线的电压跌落和/或电源上的脉冲干扰可能造成系统意外复位。不受限制的浪涌电流还会导致元器件损坏:板卡旁路电容被烧毁、印刷电路板(PCB)引线被烧断、背板连接器引脚和/或保险丝被烧断(这可能是受到破坏的主要部件)。

背板电源总线的跌落会在要插入系统的板卡电源上产生扰动或脉冲干扰,也会导致相邻板卡产生复位或影响背板与卡之间的通信(造成通信错误)。背板通常采用差分总线(LVDS/LVPECL/光纤通道/其它),必须满足信号规格以确保通信正常。热插拔期间由于VCC电源电压和地电平的变化,会在信号总线上引入共模噪声。考虑到这一潜在问题,热插拔控制电路必须采取保护措施,避免在背板上产生强噪声而导致总线的数据通信错误。

另外一个容易忽略的问题是系统的长期可靠性,设计不当的热插拔保护电路会使电路板上的元器件在长期受到热插拔事件的冲击下而损坏。本质上讲,每次热插拔操作都类似于从硅片上“抽取”绑定线,这种周而复始的操作最终会引起毁灭性的破坏。解决这一问题的有效途径是对热插拔板卡的浪涌电流峰值加以控制。

浪涌电流控制的“拼凑”方案

有几种已知的峰值浪涌电流控制方式,有些方法基于工程分析,有些方法则仅仅是降低了热插拔对系统的影响。下面对介绍了几种拼凑式的实施方案。

预充电引脚或“早供电”(例如:电阻法)

一种控制浪涌电流的方法是使用“交错式引脚”,也称为“早供电引脚”、“预充电压”或者是“预先加载”引脚。从物理架构上引入交错引脚,从而使新板卡正确插入,这种连接方式曾经风靡一时。热插拔过程中,通过串联电阻控制浪涌电流。

预充引脚法是一种最基本的热插拔控制方案,通过一长、一短两个电源引脚组成,如图4所示。长电源引脚首先接触到电源并通过一个串联电阻RPRECHARGE开始为新板卡的滤波、旁路电容充电。RPRECHARGE限制充电电流。板卡将要完全插入时,短电源引脚接入电源,从而旁路连接在长电源引脚的电阻RPRECHARGE,为板卡供电提供一个低阻通道。信号引脚通常在插入板卡的最后时刻接入。

图4. 智能连接器提供有效的热插拔保护
图4. 智能连接器提供有效的热插拔保护

该方案中,电阻RPRECHARGE是保护器件,把浪涌电流限制在不至于烧坏引脚或干扰相邻板卡工作的水平。有些工程师还会在此架构中对地增添一个电感和/或二极管。

本文将预充引脚法当作一种“拼凑式”方案的主要原因是其不能控制滤波电容的充电速率。这种架构需要考虑两个关键因素:短引脚相对于长引脚的线长,板卡插入系统的快、慢。另外,这是一种机械方案,考虑到连接器的机械容差,完全相同的引脚长度并不能确保接触时间精确相同。实际应用中用户会看到上述不同变数。而且,当短电源引脚略长、PCB被快速插入背板时,RPRECHARGE将在输入电容充满电之前被短路,因此,这种看似可靠的方案实际存在一定隐患,不能可靠控制浪涌电流。

该架构的另一个关键设计步骤是选择RPRECHARGE,如果电阻选择不合理,将会直接影响系统工作。预充电阻的选择必须权衡预充电流和浪涌电流。

最后,交错式引脚方案需要一个特殊的连接器,这在行业中也是难以接受的。

从上述讨论可以看出,预充引脚架构的作用非常有限,也很难达到精确可靠的水准。它对于启动过程中的电流控制毫无价值,也不具备输出过压(OV)和欠压(UV)监测功能。

热敏电阻(电流-时间特性)法

另一种热插拔实施方案是热敏电阻热插拔控制法。热敏电阻为电子元件,阻值在温度变化时将发生显著变化(电阻是温度的函数)。根据温度变化进行系统调节的电路应用非常普遍。负温度系数(NTC)热敏电阻的电流-时间特性取决于其温度特性,在其应用电路中的功率耗散很稳定。电流-时间特性可以抑制短暂的高压尖峰以及初始浪涌电流。图5所示为基于热敏电阻的热插拔限流电路,配合一个外部MOSFET使用¹。

图5. 基于热敏电阻的热插拔电路
图5. 基于热敏电阻的热插拔电路¹

采用热敏电阻方案时,需要考虑作用在热敏电阻上的瞬态峰值功率。设计人员必须考虑电路板环境温度的变化(覆铜面积和气流)以及热敏电阻自身的因素,如果超出其额定电流和/或电压,则会导致器件损坏。

对于热敏电阻方案需要考虑几个因素,例如,在电信系统中,一旦系统交付运营商使用,将不允许更改或重新设计板卡。由此,热敏电阻可能会引发长期可靠性问题,设计人员必须考虑负温度系数(NTC)的反作用时间。另外一个关键问题是,当板卡反复插入或拔出背板时,热敏电阻可能没有足够的时间冷却,从而在随后的带电插入事件中不能有效地限制浪涌电流。最后,热敏电阻的特性参数会随时间变化,这将导致系统的抗冲击能力下降。

总而言之,该方案在需要根据温度变化进行调整的系统中能够提供良好特性(例如,LCD偏置电源),限制浪涌电流。但是,基于热敏电阻的热插拔控制器不能满足系统长期可靠性的需求。

分离式热插拔电路

实现浪涌电流控制的另一渠道是利用几个分离元件(显然,多数工程师不会考虑拼凑式方案)。通常,利用分离电路配合独立的MOSFET、功率检测电阻及其它偏置元件实现故障保护、断路器和电流控制功能。分离式热插拔电路设计非常复杂,而且很难调试(增加了设计和研发时间),而且成本较高、占用较大的PCB面积。

重要的是,分离方案中,无源元件的寄生参数会对热插拔电路造成较大影响。设计人员必须严格控制这些因素。电路中,利用电阻和电容控制电源的上升和下降时间、电流与电流及其它检测条件。系统设计人员必须严格关注寄生参数对电路工作状况的影响。

讨论了上述三种拼凑式热插拔方案后,我们还有更好的选择。事实上,最好的解决方案是采用完全集成的单芯片热插拔控制器,下一节将讨论业内最具创新的热插拔方案,包括MAX5961热插拔控制器。

浪涌峰值电流控制

更高集成度

利用一个电路限制插入板卡的浪涌电流、提供过流和负载瞬变保护、降低系统失效点,工程师可以严格控制热插拔保护板卡的长期可靠性。市场上可以找到高度集成的热插拔控制IC,有些控制器IC不需要外接检流电阻。许多IC可以简单、高效地实现热插拔保护功能,例如,在单一芯片内支持下列功能:UV和OV保护;过载时利用恒流源实现有源电流限制;电源电压跌落之前断开故障负载;利用外部驱动FET构成“理想二极管”提供反向电流保护;多电压排序;发生负载故障后自动重试。

几家模拟半导体公司已经推出了各种方案,满足不同系统的需求。新一代热插拔IC集成了全面的模拟和数字功能,例如:板卡插入并完全上电后,可连续监测电源电流。连续监测功能可以在板卡正常工作期间继续提供短路和过流保护,还可以帮助识别故障板卡,在系统完全失效或意外关闭之前撤掉故障板卡。

集成ADC的重要性

Maxim、Analog Devices和Linear Technology®均可提供热插拔方案,器件内部提供数字故障和统计数据记录。近期出现的一个新名词是“数字热插拔”IC,代表集成了电压和电流监测ADC的热插拔方案。表1给出了不同供应商所提供的热插拔IC的性能比较,表中未列出MAX5967,该器件的引脚和功能完全兼容于LTC4215。

表1. 数字热插拔控制IC对比
LTC4215 ADM1175 MAX5961 MAX5970
ADC Resolution (bits) 2 12 10 10
Conversion Rate (Hz) 10 Not Specified 10k 10k
Automatic or Polled? Auto Polled Auto Auto
History "Depth" 1 sample 1 sample 50 samples 50 samples
INL 0.2 LSB, 0.5 LSB Not Specified 0.5 LSB 0.5 LSB
Full-Scale Error (voltage, current) ±5.5 LSB, ±5.0 LSB ±60.0 LSB, ±100.0 LSB ±10 LSB, ±30.0 LSB ±10 LSB, ±30.0 LSB
Interface I²C/SMBus™ I²C I²C/SMBus I²C/SMBus
High-Speed Voltage (min, max) 2.9V, 15V 3.15V, 13.2V 0V, 16V 0V, 16V
GATE Pullup Current (µA) 20 12 5 5
GATE Pulldown Current, Normal (mA) 1 2 500 500
Slow-Trip Circuit-Breaker Threshold (mV) 25 85 12.5, 25, 50 (and 8-bit programmable) 12.5, 25, 50 (and 8-bit programmable)
Fast-Trip Circuit-Breaker Threshold 115mV 125%, 150%, 175%, 200% of programmed slow trip 125%, 150%, 175%, 200% of programmed slow trip
Load UV Protection Analog 2 each, 10-bit programmable 2 each, 10-bit programmable
Load OV Protection 2 each, 10-bit programmable 2 each, 10-bit programmable

热插拔控制IC中嵌入ADC,有助于扩展器件的监测能力并可报告电源状态以及引起故障的一些关键因素。MAX5961还可以存储几个毫秒的电压、电流测试数据,这些数据可以用于后续的故障诊断和分析。

集成ADC还为OEM厂商创造了机会,能够使其产品更具竞争力。利用先进的电路板管理技术提供系统增值功能:
  • 信息采集:设计人员可以根据当前收集的系统关键数据构建下一代系统,优化效率。
  • 连续监控:对于这些需要始终保持运转状态的系统,正常工作期间可能需要连续监测其供电电源的温度,以记录一些对应于功率等级的“关键统计数据”。这些数据有助于在今后对一些故障状况进行预测。
  • 功率预算:通过读取以往或当前故障条件的数据,可以判断是否出现嵌入式板卡的功耗超出了其总功率预算的份额。这种监测对于早期识别不正常的工作条件、减缓甚至消除对系统其余电路的影响很有帮助。

通过I²C连接系统微处理器

板卡微处理器可以通过热插拔控制器的I²C接口采集一些关键的统计数据。通过该接口可以配置热插拔控制器的工作模式,工作在闭锁或连续重试状态;系统管理固件可以据此识别板卡的问题。该接口也是主板向维护人员发出报警信号的渠道,其作用与汽车仪表盘上的引擎故障指示灯类似。

结论

热插拔控制器对于那些始终保持运行状态的系统是不可或缺的保护电路。发生带电插拔事件后,跟踪浪涌电流引起的PCB故障也是非常棘手的设计任务。利用那些拼凑起来的热插拔方案解决故障问题或者只是很好地解决了其中部分问题,对于系统的长期稳定性而言存在一定隐患,也是工程师无法预测的。

目前,高度集成的热插拔方案能够确保系统在带电插拔的操作中不会引起数据传输错误或导致系统已插入板卡的复位。这种方案对于保持系统的长期可靠性很有帮助,能够满足、甚至优于“5个9”的设计目标。



参考文献
¹Maxim应用笔记1785:“Flexible Hot-Swap Current Limiter Allows Thermal Protection”。