淘先锋技术网

首页 1 2 3 4 5 6 7

1 前言:

韦伯分布被经常用来对失效性(time to Failure)或者,反而言之为,可靠性,进行衡量的工具。他的目标就是构建一个失效性分析的模型,或者说构建一个失效性分析的Pattern. 失效性可用于很多领域,包括存储器元器件、机械抗疲劳、以及航空、汽车结构件。
本章介绍韦布尔分布(weibull distribution)的累计分布函数CDF\密度分布函数PDF\数学期望EDF的基本公式、参数、基本图形和推导。
在介绍公式概念的时候,把概率论里面通用的概念大多拿出来在概念小节进行了阐述。
韦伯分布还有一个重要的,特点就是他的灵活性非常好。

韦伯分布的应用场景:包括,【工业制造、研究生产过程和运输时间关系、极值理论、预测天气、可靠性和失效分析、雷达系统对接受到的杂波信号的依分布建模。拟合度无线通信技术中,相对指数衰减频道模型,Weibull衰减模型对衰减频道建模有较好的拟合度。量化寿险模型的重复索赔、预测技术变革、风速由于曲线形状与现实状况很匹配,被用来描述风速的分布。】

2 韦伯分布的累计分布函数(CDF-Cumulative Distribution Function):

【案,本章CDF就是指的 CDF of weibull 】
【CDF其实就是PDF的积分,见附件的参考定义】

2.1 双参数韦伯分布累计分布函数和推导

【Franklin案,在展示CDF公式的之前,不得不提我们的国内的某些度知识里面的公式,采用的希腊字母完全和国外的不同,然而,很多希腊字母在使用中有特定的意义,本文采用的是通用的表达公式】
F ( x ) = { 1 − e − ( x λ ) k x ≥ 0 0 x < 0 【 某 度 表 达 式 】 F ( x ) = { 1 − e − ( x η ) β x ≥ 0 0 x < 0 【 通 用 表 达 式 】 F(x)=\left\{\begin{matrix} 1-e^{-(\frac{x}{\lambda })^{k}} & x\geq 0 & \\ 0& x< 0 & \end{matrix}\right.【某度表达式】 F(x)=\left\{\begin{matrix} 1-e^{-(\frac{x}{\eta })^{\beta }} & x\geq 0 & \\ 0& x< 0 & \end{matrix}\right.【通用表达式】 F(x)={1e(λx)k0x0x<0F(x)={1e(ηx)β0x0x<0
【某度】

  • x 为随机变量 (continuous random variable)
  • k 为形状参数 (shape parameter)
  • λ 缩放因子 (scale parameter)

【通用】

  • x 为随机变量 (continuous random variable)[案,大多用t表述]
  • β 为形状参数 (shape parameter)
  • η 缩放因子 (scale parameter)

【如果我们把t作为代表Failure的随机变量,累计分布函数就表征了一个系统的寿命周期(因为依赖于时间)中发生故障随机时间的概率的累计情况】
F ( t ) = 1 − e − ( t η ) β ( t > 0 ) \large\displaystyle F(t) = 1 - e^{-(\frac{t}{\eta })^{\beta }} (t>0) F(t)=1e(ηt)β(t>0)
显然,由于我们定义了F(t)作为系统的实效率函数(failure rate function),那么对应的,系统可靠性(Reliability)的函数为:
【失效和可靠完全是两个完全随机变量,所有,其实可以反着定义,所以,也有互相叫reverse Weibull Distribution的说法】
R ( t ) = 1 − F ( t ) \large\displaystyle R(t) = 1 - F(t) R(t)=1F(t)
也就是,

R ( t ) = e − ( t η ) β ( t > 0 ) \large\displaystyle R(t) = e^{-(\frac{t}{\eta })^{\beta }} (t>0) R(t)=e(ηt)β(t>0)
图一
上 图 , 显 示 了 F ( t ) R ( t ) 在 构 建 失 效 图 的 意 义 , 红 色 为 系 统 故 障 的 概 率 , 绿 色 为 系 统 稳 定 的 概 率 上图,显示了F(t) R(t)在构建失效图的意义,红色为系统故障的概率,绿色为系统稳定的概率 F(t)R(t)绿
【显然,这也是累计分布函数的意义展示。上图纵坐标为发生问题的概率,而横坐标为时间(t)】

The Cumulative Distribution Function (CDF), of a real-valued random variable X, evaluated at x, is the probability function that X will take a value less than or equal to x.

【累计分布函数就是计算随机变量小于等于某个值的所有可能的概率】
在这里插入图片描述

2.2 三参数韦伯分布累计分布函数

F ( x ) = { 1 − e − ( x − γ η ) β x ≥ 0 0 x < 0 【 通 用 表 达 式 】 \large\displaystyle F(x)=\left\{\begin{matrix} 1-e^{-(\frac{x-\gamma}{\eta })^{\beta }} & x\geq 0 & \\ 0& x< 0 & \end{matrix}\right.【通用表达式】 F(x)={1e(ηxγ)β0x0x<0

  • x 为随机变量 (continuous random variable)[案,大多用t表述]
  • β 为形状阐述 (shape parameter)
  • η 缩放因子 (scale parameter)
    - γ 位置参数 (location parameter) 也有被称为threshold参数
    【案,多了一个位置参数】
    【案,CDF在某些分析里面,似乎也被称为 Weibull probability plot】

3 韦伯分布的概率密度函数(PDF-Probability density function):

【案,本章PDF就是指的 PDF of weibull 】

3.1 PDF的推导

PDF 其实就是 CDF 的微分,从名字也可以知道,一个是累计函数,一个是密度函数。
可以通过数学推导求出PDF的表达式:

d F ( t ) d x = f ( t ) \frac{\mathrm{d} F(t)}{\mathrm{d} x}=f(t) dxdF(t)=f(t)
依据简单的微积分公式,
d ( 1 ) d x = 0 , d ( e x ) d x = e x , d ( e a x ) d x = a e a x , d ( a x k ) d x = a x k − 1 e a x k \frac{\mathrm{d}(1)}{\mathrm{d} x}=0,\frac{\mathrm{d}(e^{x})}{\mathrm{d} x}=e^{x},\frac{\mathrm{d}(e^{ax})}{\mathrm{d} x}=ae^{ax},\frac{\mathrm{d}(ax^{k})}{\mathrm{d} x}=ax^{k-1}e^{ax^{k}} dxd(1)=0,dxd(ex)=ex,dxd(eax)=aeax,dxd(axk)=axk1eaxk
可得,
F ( t ) = 1 − e − ( t η ) β , f ( t ) = d F ( t ) d x = 0 − d e − ( t η ) β d x F(t) = 1 - e^{-(\frac{t}{\eta })^{\beta }}, f(t)=\frac{\mathrm{d} F(t)}{\mathrm{d} x}=0- \frac{\mathrm{d} e^{-(\frac{t}{\eta })^{\beta }}}{\mathrm{d} x} F(t)=1e(ηt)βf(t)=dxdF(t)=0dxde(ηt)β
令,
a = − ( 1 η ) β , d ( e a x ) d x = a e a x a=-(\frac{1}{\eta })^{\beta },\frac{\mathrm{d}(e^{ax})}{\mathrm{d} x}=ae^{ax} a=(η1)β,dxd(eax)=aeax
f ( t ) = − ( 1 η ) β . t β − 1 . β . e − ( t η ) β = β η β t β − 1 e − ( t η ) β \large\displaystyle f(t)=-(\frac{1}{\eta })^{\beta }.t^{\beta-1}.\beta.e^{-(\frac{t}{\eta })^{\beta }}= \frac{\beta }{\eta ^{\beta }}t^{\beta -1}e^{-(\frac{t}{\eta })^\beta } f(t)=(η1)β.tβ1.β.e(ηt)β=ηββtβ1e(ηt)β
由此,我们得到下列两参数的韦伯分布的密度函数的表达式:

3.2 两参数Weibull Distribution的PDF

f ( t ; β , η ) = { β η β t β − 1 e − ( t η ) β t , β , η > 0 0 其 他 情 况 \large\displaystyle f(t;\beta,\eta)=\left\{\begin{matrix} \frac{\beta }{\eta ^{\beta }}t^{\beta -1}e^{-(\frac{t}{\eta })^\beta } & t,\beta,\eta> 0 & \\ 0& 其他情况 & \end{matrix}\right. f(t;β,η)={ηββtβ1e(ηt)β0t,β,η>0

  • β (shape parameter 形状参数) 又被称为 weibull slope 韦伯斜率
  • η (scale parameter 缩放参数)
    其图像如下:

但是,其实韦伯分布更详细的定义为3参数的表达式。

3.3 三参数韦伯分布Weibull Distribution的PDF(Probability density function)

一个连续的随机变量X,具备下列三个参数和密度函数的为三参数韦伯分布。

f ( t ; β , η , γ ) = { β η β ( t − γ ) β − 1 e − ( t − γ η ) β t , β , η > 0 0 其 他 情 况 \large\displaystyle f(t;\beta,\eta,\gamma)=\left\{\begin{matrix} \frac{\beta }{\eta ^{\beta }}(t-\gamma)^{\beta -1}e^{-(\frac{t-\gamma}{\eta })^\beta } & t,\beta,\eta> 0 & \\ 0& 其他情况 & \end{matrix}\right. f(t;β,η,γ)={ηββ(tγ)β1e(ηtγ)β0t,β,η>0

  • β (shape parameter 形状参数) 又被称为 weibull slope 韦伯斜率
  • η (scale parameter 缩放参数)
  • γ (location parameter 位置参数,又被称为 threshold 阈值参数)
    【案,可见,当γ=0的时候,三参数变为两参数分布】

3.4 单参数-标准Weibull Distribution的PDF

在这里插入图片描述
【案摘录,希腊字母表意有点不同】

4 失效率函数故障率函数(Hazard Rate or Failure rate Function)

h ( t ) = f ( t ) R ( t ) = β η β t β − 1 e − ( t η ) β e − ( t η ) β = β η β . t β − 1 \large\displaystyle h(t) =\frac{f(t)}{R(t)}=\frac{\frac{\beta }{\eta ^{\beta }}t^{\beta -1}e^{-(\frac{t}{\eta })^\beta }}{ e^{-(\frac{t}{\eta })^{\beta }}}=\frac{\beta}{\eta^\beta}.t^{\beta-1} h(t)=R(t)f(t)=e(ηt)βηββtβ1e(ηt)β=ηββ.tβ1
在这里插入图片描述

5 E(X)、均值、数学期望或者说是平均寿命计算( Weibull mean life or MTTF)

【三参数公式】
E ( X ) = η Γ ( 1 + 1 β ) + μ \large\displaystyle E(X) =\eta \Gamma \left( 1+\frac{1}{\beta } \right)+\mu E(X)=ηΓ(1+β1)+μ
【两参数公式】
E ( X ) = η Γ ( 1 + 1 β ) \large\displaystyle E(X) =\eta \Gamma \left( 1+\frac{1}{\beta } \right) E(X)=ηΓ(1+β1)
Γ ( x ) \Gamma(x) Γ(x)【案,这里出现了伽马函数,在参考列表里面有比较详细的介绍】
【案,数学期望是我们做韦伯分布要研究的一个最重要概念,他反映的就是研究对象的平均生命周期】

6 方差公式(Variance) V(X)

σ = η 2 [ Γ ( 1 + 2 β ) − Γ 2 ( 1 + 1 β ) ] \large\displaystyle \sigma ={{\eta }^{2}}\left[ \Gamma \left( 1+\frac{2}{\beta } \right)-{{\Gamma }^{2}}\left( 1+\frac{1}{\beta } \right) \right] σ=η2[Γ(1+β2)Γ2(1+β1)]
【案,方差公式是数学期望的均值,一般计算结果小于E(X)】

7 其他相关定义公式

7.1 偏度(skewness)

在这里插入图片描述

7.2 峰度(kurtosis)

在这里插入图片描述

7.3 中位等式,或者叫B50公式

【案,用来计算汽车比如提供检修周期、或者其他系统进行中期检修的计算】
在这里插入图片描述

7 名词参考:

7.0 累计分布:(Cumulative Density)CDF

Fx(x) = P(X ≤ x) [CDF 就是累计随机变量取值之前的所有可能概率。【案,一般用大F(x)表述】
【案,举个简单的例子,丢骰子,是个随机事件发生6种不同的结果的概率相同的,那么,获得1点的概率就是1/6,获得2点的概率也是1/6,那么,获得2个以下点的概率,就是获得1点的概率和2点的概率的和,也就是累积概率,可以表述为小于等于2的概率就是1/6 + 1/6 = 2/6 = 1/3】
于是有:

Probability of getting 1 = P(X≤ 1 ) = 1 / 6
Probability of getting 2 = P(X≤ 2 ) = 2 / 6
Probability of getting 3 = P(X≤ 3 ) = 3 / 6
Probability of getting 4 = P(X≤ 4 ) = 4 / 6
Probability of getting 5 = P(X≤ 5 ) = 5 / 6
Probability of getting 6 = P(X≤ 6 ) = 6 / 6 = 1

这是离散的,

Where X is the probability that takes a value less than or equal to x and that lies in the semi-closed interval (a,b], where a < b.
P(a < X ≤ b) = Fx(b) – Fx(a)

如果,搞成连续的,那么,CDF可以看成是PDF的积分,下面这个例子展示了这个关系:
已知PDF,
在这里插入图片描述
求CDF,
在这里插入图片描述

7.1 概率密度:(Probability Density)PDF

概率密度,通用的描述,可以参考文后的参考链接。这里简单累述一下。
我们理解概率密度,PD,可以认为他就是一个随机事件发生的概率。然后,这个概率的取值p(x),和发生的随机事件有一个对应的关系,我们可以认为是一个函数,f(x)。

x的定义域理解为概率相关的定义区间,事件随机发生的几率。所有区间的事件发生概率显然为1。
单纯的讲概率密度没有实际的意义,它必须有确定的有界区间为前提。可以把概率密度看成是纵坐标,区间看成是横坐标,概率密度对区间的积分就是面积,而这个面积就是事件在这个区间发生的概率,所有面积的和为1
对于随机变量X的分布函数F(x),如果存在非负可积函数f(x),使得对任意实数x,有
在这里插入图片描述
则X为连续型随机变量,称f(x)为X的概率密度函数,简称为概率密度
【案,一般用大F(x)表述CDF,f(x)表述PDF】

7.2 伽马函数

伽马函数在数学中随处可见。
从统计学,数论,数学中的复分析,到物理学中的弦理论。它似乎是一种数学粘合剂,将不同的领域联系在一起。
1738年,伟大的欧拉,立志将阶乘推广到非整数的范围。
Γ ( n ) = ( n − 1 ) ! \large\displaystyle \Gamma \left( n \right)=\left( n-1 \right)! Γ(n)=(n1)!
【这个推导过程请参阅文末的链接,总之,伽马函数从离散到连续可以表述为下面的表达式】
Γ ( n ) = ∫ 0 ∞ t n − 1 e − t d t \large\displaystyle \Gamma \left( n \right)=\int _{0}^{\infty }{{{t}^{n-1}}}{{e}^{-t}}dt Γ(n)=0tn1etdt

7.2.1 伽马函数的性质:

在这里插入图片描述

7.2.2 伽马分布:

在这里插入图片描述

7.2.3 伽马分布的数学期望和方差在这里插入图片描述

7.3 数学期望【均值】E(X)

7.3.1 定义:

就是均值:在概率论和统计学中,数学期望(mathematic expectation [4] )(或均值,亦简称期望)
是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小。
表达式,E(x)

7.3.2 起源故事:

在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,一共进行五局,赢家可以获得100法郎的奖励。当比赛进行到第四局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平?
用概率论的知识,不难得知,甲获胜的可能性大,乙获胜的可能性小。
因为甲输掉后两局的可能性只有(1/2)×(1/2)=1/4,也就是说甲赢得后两局或后两局中任意赢一局的概率为1-(1/4)=3/4,甲有75%的期望获得100法郎;而乙期望赢得100法郎就得在后两局均击败甲,乙连续赢得后两局的概率为(1/2)(1/2)=1/4,即乙有25%的期望获得100法郎奖金。
可见,虽然不能再进行比赛,但依据上述可能性推断,甲乙双方最终胜利的客观期望分别为75%和25%,因此甲应分得奖金的100
75%=75(法郎),乙应分得奖金的的100×25%=25(法郎)。这个故事里出现了“期望”这个词,数学期望由此而来。

7.3.3 连续型数学期望

设连续性随机变量X的概率密度函数为f(x),若积分绝对收敛,则称积分的值

在这里插入图片描述

为随机变量的数学期望,记为E(X)。
在这里插入图片描述

7.4 高斯分布

Normal Probability Distribution Formula
P ( x ) = 1 2 π σ 2 e − ( x − μ ) 2 / 2 σ 2 \begin{array}{l}\large P(x)=\frac{1}{\sqrt{2\pi \sigma ^{2}}} e^{-(x-\mu )^{2}/2\sigma ^{2}}\end{array} P(x)=2πσ2 1e(xμ)2/2σ2
μ = Mean
σ = Standard Distribution.
x = Normal random variable.

文献参考:

Cumulative Distribution Function

Weibull Distribution , ASQ ,Hemant Urdhwareshe

Characteristics of the Weibull Distribution

The New Weibull Handbook

世界上最美丽的函数——γ函数,一颗数学皇冠上的明珠
Understanding Probability Distributions