海量存储机群系统中提高系统MTTF的设计和分析

时间:2010-04-16来源:网络

下面,以m=3为例,求系统进入状态m'的均值时间E3(T)。由一维生灭过程的瞬态分析,可得以下方程组。其中,Pi(t)表示在t时刻系统处于状态i的概率。


这是一个四元常系数线性微分方程组,可通过消元法消为一元线性微分方程,解之,然后可以求出其他各元的解。再根据边界条件,可以求出各解中的系数。系统的边界条件为

。 。

而E3(T)可表示为:

。。

为了求出E3(T)的具体值,还必须求出a3的值。限于篇幅,不加证明的给出如下求am的定理。

定理:如果一个拥有n个节点的机群系统,含kn个互不相同的数据块,每个数据块都有m个备份,每个备份随机地分布于机群系统中不同的节点上,那么当系统中出现有s-1个节点失效的时候,无数据块丢失;而当系统中出现有s个节点失效的时候,系统中出现某个数据块无法挽回地丢失的概率为, 其中, 并且s>=1。

根据此定理,求出当n=1000, m=3, k=100时a3=0.0006。

根据以上推导,可求出E3(T)在不同条件下的值,得到在n=1000, l=1/(24*3600) (/秒)的配置下,当lb=0.1(/秒)时,E3(T)=319天;当lb=0.05(/秒)时,E3(T)=86天;当lb=0.01(/秒)时,E3(T)=2天。类似地,可求出m=2时系统进入状态m'的均值时间E2(T),得到在n=1000, l=1/(24*3600) (/秒)的配置下,当lb=0.1(/秒)时,E2(T)=1.3小时;当lb=0.05(/秒)时,E2(T)=0.73小时;当lb=0.01(/秒)时,E2(T)=0.27小时。

分析以上数据可以得到两个结论。第一,三个备份的系统比两个备份的,能显著地提升系统的MTTF。在通常配置下,三个备份的系统的MTTF可达几十天;而两个备份的系统的MTTF只能在1小时左右。第二,数据块的转移时间显著地影响系统的MTTF,转移时间越短,系统的MTTF越长。

4仿真实验

下面,通过仿真实验来验证上面的结论。仿真实验中的主要参数和限制条件如下。状态块总数与节点总数之比为rchunk=100,节点失效速率l=1/(24小时),节点恢复速率m=1/(24小时)。在进行状态转移时,源节点和目标节点的选择策略:源节点,必须包含该状态块的备份,同时其上正在进行拷贝的状态块数目必须最小;目标节点,从所有不含该状态块的备份的节点中随机选取,同时其上所存储的状态块数目不能超过平均值的tcap=1.3。为保证状态块拷贝不影响系统的正常服务,人为限制正在进行拷贝的节点数目不超过机群系统中节点总数的tratio=40%。为了同样的目的,人为限制状态块拷贝只占用网络带宽的一半;若有多个状态块在向外输出,则它们分享带宽。网络带宽为100Mb/s,一个状态块大小为64M。为了使新加入的节点不在短时间里收到大量的新备份,人为限制每个节点正在进行拷贝的状态块数目不超过tcopy=1。实验结果,如图2所表示。这些限制条件均来自实际系统。


图2不同备份数下的系统MTTF

1 2 3

关键词: MTTF 海量存储 分析 机群系统

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版