分享

[原创] 以统计学角度看验证、确认和持续性确认的关系

 留在家里 2016-10-07
北京首儿药厂-首儿数据统计分析群 王文建
在新版GMP中最让人纠结的概念,大概非“验证与确认”莫属了,2015年总局又下发的新的“验证与确认”的附录,其中又提到“持续性确认”,这里我想从统计学的角度去看验证、确认和持续性确认的关系。
工业化制造的一个特点,就是大批量的、流水线式的工业化生产制造,它是对大批量多批次的各类原材料,经过生产线连续加工制造,生产出众多产品的过程。
为了保证工业化制造出的产品质量有保证,少生产出不合格品、次品,于是出现了最初的质量检验,对原材料进行来料检验,对生产的产品进行出厂检验。但是,仅靠一进一出、一头一尾的检验把关是不够的;为此,也需要同步对生产制造过程进行控制和管理,如何保证生产制造过程有效、可靠、持续稳定,这才是制造业的价值所在。
而生产制造过程,包括人、机、料、法、环、测(5M1E)6个方面,哪个方面出现问题都不保证产品制造过程有效、可靠和持续稳定。
生产制造某个产品之初,总是要对生产该产品的设备、用料、加工制造方法、操作人员、产品合格与否的判定方法、检测方法、生产环境要求进行约定,并需要试生产一下,看看是否能满足预期要求,是否可以放心的批量生产。
而以上的过程,要做到科学有效,而不是仅凭经验,则要依靠数据、依靠统计规律进行,实际上就是假设检验、检验功效和控制图(SPC)问题,如果需要和GMP中的概念做一个对应,可以理解为验证、确认和持续性确认。
   
验证
  
   

图片x.png (221 Bytes, 下载次数: 0)

下载附件 保存到相册

2016-6-14 08:53 上传

  
   
假设检验
  
   
确认
  
   

图片x - 副本 (2).png (221 Bytes, 下载次数: 0)

下载附件 保存到相册

2016-6-14 08:58 上传

  
   
检验功效
  
   
持续性确认
  
   

图片x - 副本.png (221 Bytes, 下载次数: 0)

下载附件 保存到相册

2016-6-14 08:58 上传

  
   
控制图(SPC)
  
例题1:
一个新产品试生产,得到含量数据10组“99.11%、100.26%、99.03%、98.23%、101.34%、98.23%、98.36%、98.94%、99.16%、99.12%、”,而产品法定标准为90%~110%,工艺投料要求100%投料,含量范围控制要求在98%~102%之间。
问题:
1、根据得到的这10组数据,在95%的置信限下,这批产品的含量是否达到了预期要求的100%?
2、为了判断这批产品含量是否达到预期的100%(范围在98%~102%时),样品数量至少要有多少个才可以。(a=0.01)
解答:问题1:(假设检验):
这里就用到统计中的假设检验,得下图(使用minitab 17):

图片1.png (14.37 KB, 下载次数: 1)

下载附件 保存到相册

2016-6-14 08:52 上传

单样本 T: C1
原假设:μ = 100    备择假设:μ≠ 100  的检验:
                          
变量   N    均值    标准差    均值标准误    95% 置信区间         T       P
C1    10   99.179  0.967       0.306      (98.488, 99.871)    -2.69   0.025
从以上结果得:
1、P=0.025,小于0.05,则原假设不成立,备择假设成立。也就是这组数据均值在95%的置信限下,不等于100%。
2、这组数据95%的置信区间为(98.488, 99.871),100%这个值不在这个区间内,也说明含量这组数据均值不等于100%。
问题2:(检验功效):
这里就用到统计中检验功效,得下图(在minitab 17中叫“幂和样本数量”):

图片2.png (19.82 KB, 下载次数: 0)

下载附件 保存到相册

2016-6-14 08:52 上传

幂和样本数量
单样本 t 检验
正在检验均值 = 零 (与 ≠ 零)
计算功效的均值 = 零 + 差值
α = 0.01  假定标准差 = 0.9666
        
差值  样本数量  目标功效  实际功效
2      7        0.9    0.904881
从以上结果得:
1、  以10组数据所得标准差为0.9666,置信限为99%(a=0.01)的情况下,达到含量标准在98%~102%范围内时,有90%(b=0.1)的置信概率,只需抽取的样本数量为7个,就可以达到99%(a=0.01)的检验功效。
2、  根据以上分析,以后抽样量只需要7个就可以,而不需要抽取10个样本。
例题2:
例题1中的产品经过试生产后,转入商业批生产,为了保证产品稳定生产,需要对生产过程中的含量指标进行管控,要求在95%~105%,这时得到以下按生产顺序的25批次数据,97.52%、101.38%、100.31%、98.19%、97.22%、100.73%、98.38%、97.70%、97.58%、99.68%、98.20%、98.36%、100.93%、98.90%、98.64%、100.92%、101.58%、99.54%、99.54%、97.81%、100.68%、101.72%、98.04%、99.26%、102.82%。
问题:
1、以含量为控制指标,这25批次的生产过程是否稳定的?能力如何?
2、该产品投入商业批生产后,如何在现有数据基础上进行持续控制,以保证产品长期持续稳定生产。
解题:问题1:(控制图(SPC))使用minitab 17中的协助,得到下图:

图片3.png (16.31 KB, 下载次数: 0)

下载附件 保存到相册

2016-6-14 08:52 上传

图片4.png (12.97 KB, 下载次数: 0)

下载附件 保存到相册

2016-6-14 08:52 上传

图片5.png (32.24 KB, 下载次数: 0)

下载附件 保存到相册

2016-6-14 08:52 上传

从以上三张图可得:1、  从这25组数据分析看,所代表的该产品生产过程是稳定的。2、  但在95%~105%的标准范围内,该产品含量的过程能力低,Z=2.79<3;Ppk=0.94<1;3、  以目前的过程能力,预期的不合格批次概率约为0.27%。问题2:1、  将上控制限为104.12%和下控制限为94.73%的控制图(SPC),正式使用在该产品的生产控制中,进行监测诊断,每生产一批,将相应的含量数据描点到控制图(SPC)中。2、  如果有点超出上、下控制限的,则进行相应分析调查,即:张公绪提出的26字真言“点出界就判异,查出异因,采取措施,加以消除,不再出现,纳入标准。” 通过以上二个例子,可以对验证、确认和持续确认(控制图(SPC))三者之间的关系,列表如下进行理解,下表各项之间的关系,也体现出了“量化管理,风险决策”的思想:

  统计概念  
GMP概念
实质内涵
适合批次
与数据排序
与规格限
彼此关系
正态、t、泊松分布
---
数学公式;软件表达式;图形
――
――
――
根本和基础
假设检验
验证
总体检验  (第一类错误 α
单批或多批
无关
无关
必要性
检验功效
确认
总体检验  (第二类错误 β
单批或多批
无关
无关
充分性
控制图(SPC)
持续性  确认
过程监控
连续多批
有关
无关
手段
过程能力分析
质量保证
连续多批
有关
有关
目标

注释:检验功效
在假设检验中,当存在显著效应或差异时找到这些效应或差异的可能性。功效是在原假设不成立时正确否定原假设的概率。  
影响功效的因子很多:
· 样本数量:增加样本数量可提供有关总体的更多信息,因此可以提高功效。  
· a (类型 I 错误的概率):增大a 值可增加功效,因为否定 a 值较大的原假设的可能性更大。
· s(总体的变异性):当 s 较小时,更容易检测到差异,这有助于增加功效。
· 总体效应的量值:总体越相似,越难检测到差异。因此,功效降低。   
可在收集数据之前计算功效(预期研究),以确保假设检验可以检测到显著差异或效应。例如,一家制药公司要确定其假设检验需要具有多大的功效,才能检测出三种不同糖尿病治疗之间的差异。为提高功效,他们增加了样本数量,以了解使用这些药物的糖尿病患者总体的更多信息。而且,他们还可通过遵循好的抽样做法来尝试降低误差方差。
也可以计算功效,以了解已经执行的检验的功效(回顾研究)。例如,汽车部件制造商进行了一项比较两种钢材配方重量的试验,所得结果没有显著的统计意义。使用 Minitab,制造商可以根据希望看到的最小差异来计算功效。如果检测此差异的功效低,可能需要修改试验设计以提高功效并继续评估相同问题。但是,如果功效高,他们可能断定两种钢材配方并无差异并且不再继续进行试验。
功效等于 1- b,其中 b 是发生类型 II 错误的概率(当原假设不成立时未能否定原假设)。随着a(显著性水平)的增加,b 会降低。因此,随着 a 的增加,功效也会提高。请记住,增大 a 同时会增大类型 I 错误(当原假设成立时否定原假设)的概率。


阅读11112
评论50
查看原文

精选留言

写评论
ahwjw970
文中的多个图,显示不出来,大家下压缩文件后解压看吧。
2016-6-13 21:56:45
syhorchid
学习一下
2016-6-13 22:23:58
042005112
学习一下
2016-6-14 07:27:09
yanzhengren
谢谢分享。
2016-6-14 07:52:01
binghezhishui
学习了,谢谢分享!
2016-6-14 07:56:39
hzleiyu
下载看看谢谢分享
2016-6-14 08:08:30
globle001
thanks for sharing
2016-6-14 08:13:15
uiofer
这个角度比较新颖,但是觉得改个题目会更准确些,统计学在验证、确认和持续性确认中的应用。验证、确认和持续性确认,更多的还是为了响应ICHQ10关于产品生命周期的划分,而提出来的概念。毫无疑问,现在统计学的应用在验证中的作用是越来越广泛,但是统计学只是分析数据的工具,而非是串联数据的根据。
2016-6-14 08:39:00
蜗牛98
ahwjw970 发表于 2016-6-13 21:56
文中的多个图,显示不出来,大家下压缩文件后解压看吧。

楼主,给你文章进行了编辑,图片已经插进来了
文章作者,不会是你吧?
2016-6-14 09:00:50
kicoo2862
uiofer 发表于 2016-6-14 08:39
这个角度比较新颖,但是觉得改个题目会更准确些,统计学在验证、确认和持续性确认中的应用。验证、确认 ...

“统计学只是分析数据的工具,而非是串联数据的根据。”同意
2016-6-14 09:31:20
wuguanghui953
2016-6-14 10:48:28
yuansoul
蜗牛98 发表于 2016-6-14 09:00
楼主,给你文章进行了编辑,图片已经插进来了
文章作者,不会是你吧?

从以上结果得:
1、 以10组数据所得标准差为0.9666,置信限为99%(a0.01)的情况下,达到含量标准在98%~102%范围内时,有90%(b=0.1)的置信概率,只需抽取的样本数量为7个,就可以达到99%(a0.01)的检验功效。
2、 根据以上分析,以后抽样量只需要7个就可以,而不需要抽取10个样本。



第一个 置信限 错了吧,应该是合格率

2016-6-14 14:00:07
蜗牛98
yuansoul 发表于 2016-6-14 14:00
从以上结果得:1、 以10组数据所得标准差为0.9666,置信限为99%(a=0.01)的情况下,达到含量标准在98% ...

没有注意到这个
你就直接说,应该怎么说就是了

没有注意到这个
你就直接说,应该怎么说就是了

实际就是 2828 原则里面 的 等效 可接受限度,最小取样量的思路。但是这个,对于成品检验来说,统计学意义不存在。


实际就是 2828 原则里面 的 等效 可接受限度,最小取样量的思路。但是这个,对于成品检验来说,统计学意 ...

这个角度比较新颖,但是觉得改个题目会更准确些,统计学在验证、确认和持续性确认中的应用。验证、确认 ...

谢谢版主建议,是的用“统计学在验证、确认和持续性确认中的应用”更确切一些。

楼主,给你文章进行了编辑,图片已经插进来了
文章作者,不会是你吧?

文章作者,不会是你吧?
跟着我们请的老师,吴遵高-吴老师学习了二年,文章中每一点都是吴老师教的,我只是把它们串了起来,试着与GMP中的三个概念对应一下。加入了一点我想法,见笑了,版主。不对的地方,请多指点。也要感谢教我二年多的吴老师。

文章作者,不会是你吧?
跟着我们请的老师,吴遵高-吴老师学习了二年,文章中每一点都是吴老师教的,我 ...

没有啊,只要学了,想着用了,不管对不对都是进步啊
总会找到出路的

“统计学只是分析数据的工具,而非是串联数据的根据。”同意

同意您的说法,统计学是工具,我们正在试着使用它。不过,通过这段时间的学习,我认为,有统计学方面的观念更重要,质量源于设计嘛,如果有了这些观念,在验证、确认或持续确认之初,就有目的地进行实验设计、数据收集要求,这样不致于在最后需要分析时,才发现,有很多缺陷,这二年,我们有过太多这样的教训。
同时,统计学,也不仅仅是工具,而是规律,也是对发现问题的诊断工具。中国质量管理的泰斗张公绪先生也是开创了控制图的诊断功能,并在新华制药做实验,得到过映证。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多