[原创] 以统计学角度看验证、确认和持续性确认的关系

留在家里 2016-10-07

展开全文

北京首儿药厂-首儿数据统计分析群王文建

在新版GMP中最让人纠结的概念，大概非“验证与确认”莫属了，2015年总局又下发的新的“验证与确认”的附录，其中又提到“持续性确认”，这里我想从统计学的角度去看验证、确认和持续性确认的关系。

工业化制造的一个特点，就是大批量的、流水线式的工业化生产制造，它是对大批量多批次的各类原材料，经过生产线连续加工制造，生产出众多产品的过程。

为了保证工业化制造出的产品质量有保证，少生产出不合格品、次品，于是出现了最初的质量检验，对原材料进行来料检验，对生产的产品进行出厂检验。但是，仅靠一进一出、一头一尾的检验把关是不够的；为此，也需要同步对生产制造过程进行控制和管理，如何保证生产制造过程有效、可靠、持续稳定，这才是制造业的价值所在。

而生产制造过程，包括人、机、料、法、环、测（5M1E）6个方面，哪个方面出现问题都不保证产品制造过程有效、可靠和持续稳定。

生产制造某个产品之初，总是要对生产该产品的设备、用料、加工制造方法、操作人员、产品合格与否的判定方法、检测方法、生产环境要求进行约定，并需要试生产一下，看看是否能满足预期要求，是否可以放心的批量生产。

而以上的过程，要做到科学有效，而不是仅凭经验，则要依靠数据、依靠统计规律进行，实际上就是假设检验、检验功效和控制图（SPC）问题，如果需要和GMP中的概念做一个对应，可以理解为验证、确认和持续性确认。

验证	登录/注册后可看大图图片x.png (221 Bytes, 下载次数: 0) 下载附件保存到相册 2016-6-14 08:53 上传	假设检验
确认	登录/注册后可看大图图片x - 副本 (2).png (221 Bytes, 下载次数: 0) 下载附件保存到相册 2016-6-14 08:58 上传	检验功效
持续性确认	登录/注册后可看大图图片x - 副本.png (221 Bytes, 下载次数: 0) 下载附件保存到相册 2016-6-14 08:58 上传	控制图（SPC）

例题1：

一个新产品试生产，得到含量数据10组“99.11%、100.26%、99.03%、98.23%、101.34%、98.23%、98.36%、98.94%、99.16%、99.12%、”，而产品法定标准为90%～110%，工艺投料要求100%投料，含量范围控制要求在98%～102%之间。

问题：

1、根据得到的这10组数据，在95%的置信限下，这批产品的含量是否达到了预期要求的100%？

2、为了判断这批产品含量是否达到预期的100%（范围在98%～102%时），样品数量至少要有多少个才可以。（a＝0.01）

解答：问题1：（假设检验）：

这里就用到统计中的假设检验，得下图（使用minitab 17）：

图片1.png (14.37 KB, 下载次数: 1)

下载附件保存到相册

2016-6-14 08:52 上传

单样本 T: C1

原假设：μ = 100 备择假设：μ≠ 100 的检验：

变量 N 均值标准差均值标准误 95% 置信区间 T P

C1 10 99.179 0.967 0.306 (98.488, 99.871) -2.69 0.025

从以上结果得：

1、P＝0.025，小于0.05，则原假设不成立，备择假设成立。也就是这组数据均值在95%的置信限下，不等于100%。

2、这组数据95%的置信区间为(98.488, 99.871)，100%这个值不在这个区间内，也说明含量这组数据均值不等于100%。

问题2：（检验功效）：

这里就用到统计中检验功效，得下图（在minitab 17中叫“幂和样本数量”）：

图片2.png (19.82 KB, 下载次数: 0)

下载附件保存到相册

2016-6-14 08:52 上传

幂和样本数量

单样本 t 检验

正在检验均值 = 零 (与 ≠ 零)

计算功效的均值 = 零 + 差值

α = 0.01 假定标准差 = 0.9666

差值样本数量目标功效实际功效

2 7 0.9 0.904881

从以上结果得：

1、以10组数据所得标准差为0.9666，置信限为99%（a＝0.01）的情况下，达到含量标准在98%～102%范围内时，有90%（b＝0.1）的置信概率，只需抽取的样本数量为7个，就可以达到99%（a＝0.01）的检验功效。

2、根据以上分析，以后抽样量只需要7个就可以，而不需要抽取10个样本。

例题2：

例题1中的产品经过试生产后，转入商业批生产，为了保证产品稳定生产，需要对生产过程中的含量指标进行管控，要求在95%～105%，这时得到以下按生产顺序的25批次数据，97.52%、101.38%、100.31%、98.19%、97.22%、100.73%、98.38%、97.70%、97.58%、99.68%、98.20%、98.36%、100.93%、98.90%、98.64%、100.92%、101.58%、99.54%、99.54%、97.81%、100.68%、101.72%、98.04%、99.26%、102.82%。

问题：

1、以含量为控制指标，这25批次的生产过程是否稳定的？能力如何？

2、该产品投入商业批生产后，如何在现有数据基础上进行持续控制，以保证产品长期持续稳定生产。

解题：问题1：（控制图（SPC））使用minitab 17中的协助，得到下图：

图片3.png (16.31 KB, 下载次数: 0)

下载附件保存到相册

2016-6-14 08:52 上传

图片4.png (12.97 KB, 下载次数: 0)

下载附件保存到相册

2016-6-14 08:52 上传

图片5.png (32.24 KB, 下载次数: 0)

下载附件保存到相册

2016-6-14 08:52 上传

从以上三张图可得：1、 从这25组数据分析看，所代表的该产品生产过程是稳定的。2、 但在95%～105%的标准范围内，该产品含量的过程能力低，Z＝2.79＜3；Ppk＝0.94＜1；3、 以目前的过程能力，预期的不合格批次概率约为0.27%。问题2：1、 将上控制限为104.12%和下控制限为94.73%的控制图（SPC），正式使用在该产品的生产控制中，进行监测诊断，每生产一批，将相应的含量数据描点到控制图（SPC）中。2、如果有点超出上、下控制限的，则进行相应分析调查，即：张公绪提出的26字真言“点出界就判异，查出异因，采取措施，加以消除，不再出现，纳入标准。” 通过以上二个例子，可以对验证、确认和持续确认（控制图（SPC））三者之间的关系，列表如下进行理解，下表各项之间的关系，也体现出了“量化管理，风险决策”的思想：

统计概念	GMP概念	实质内涵	适合批次	与数据排序	与规格限	彼此关系
正态、t、泊松分布	---	数学公式；软件表达式；图形	――	――	――	根本和基础
假设检验	验证	总体检验（第一类错误 α）	单批或多批	无关	无关	必要性
检验功效	确认	总体检验（第二类错误 β）	单批或多批	无关	无关	充分性
控制图（SPC）	持续性确认	过程监控	连续多批	有关	无关	手段
过程能力分析	持续性确认	质量保证	连续多批	有关	有关	目标

注释：检验功效

在假设检验中，当存在显著效应或差异时找到这些效应或差异的可能性。功效是在原假设不成立时正确否定原假设的概率。

影响功效的因子很多：

· 样本数量：增加样本数量可提供有关总体的更多信息，因此可以提高功效。

· a （类型 I 错误的概率）：增大a 值可增加功效，因为否定 a 值较大的原假设的可能性更大。

· s（总体的变异性）：当 s 较小时，更容易检测到差异，这有助于增加功效。

· 总体效应的量值：总体越相似，越难检测到差异。因此，功效降低。

可在收集数据之前计算功效（预期研究），以确保假设检验可以检测到显著差异或效应。例如，一家制药公司要确定其假设检验需要具有多大的功效，才能检测出三种不同糖尿病治疗之间的差异。为提高功效，他们增加了样本数量，以了解使用这些药物的糖尿病患者总体的更多信息。而且，他们还可通过遵循好的抽样做法来尝试降低误差方差。

也可以计算功效，以了解已经执行的检验的功效（回顾研究）。例如，汽车部件制造商进行了一项比较两种钢材配方重量的试验，所得结果没有显著的统计意义。使用 Minitab，制造商可以根据希望看到的最小差异来计算功效。如果检测此差异的功效低，可能需要修改试验设计以提高功效并继续评估相同问题。但是，如果功效高，他们可能断定两种钢材配方并无差异并且不再继续进行试验。

功效等于 1- b，其中 b 是发生类型 II 错误的概率（当原假设不成立时未能否定原假设）。随着a（显著性水平）的增加，b 会降低。因此，随着 a 的增加，功效也会提高。请记住，增大 a 同时会增大类型 I 错误（当原假设成立时否定原假设）的概率。

阅读11112

查看原文

精选留言

写评论

ahwjw970

文中的多个图，显示不出来，大家下压缩文件后解压看吧。

2016-6-13 21:56:45

syhorchid

学习一下

2016-6-13 22:23:58

042005112

学习一下

2016-6-14 07:27:09

yanzhengren

谢谢分享。

2016-6-14 07:52:01

binghezhishui

学习了，谢谢分享！

2016-6-14 07:56:39

hzleiyu

下载看看谢谢分享

2016-6-14 08:08:30

globle001

thanks for sharing

2016-6-14 08:13:15

uiofer

这个角度比较新颖，但是觉得改个题目会更准确些，统计学在验证、确认和持续性确认中的应用。验证、确认和持续性确认，更多的还是为了响应ICHQ10关于产品生命周期的划分，而提出来的概念。毫无疑问，现在统计学的应用在验证中的作用是越来越广泛，但是统计学只是分析数据的工具，而非是串联数据的根据。

2016-6-14 08:39:00

蜗牛98

ahwjw970 发表于 2016-6-13 21:56
文中的多个图，显示不出来，大家下压缩文件后解压看吧。

楼主，给你文章进行了编辑，图片已经插进来了
文章作者，不会是你吧？

2016-6-14 09:00:50

kicoo2862

uiofer 发表于 2016-6-14 08:39
这个角度比较新颖，但是觉得改个题目会更准确些，统计学在验证、确认和持续性确认中的应用。验证、确认 ...

“统计学只是分析数据的工具，而非是串联数据的根据。”同意

2016-6-14 09:31:20

wuguanghui953

2016-6-14 10:48:28

yuansoul

蜗牛98 发表于 2016-6-14 09:00
楼主，给你文章进行了编辑，图片已经插进来了
文章作者，不会是你吧？

从以上结果得：

2、根据以上分析，以后抽样量只需要7个就可以，而不需要抽取10个样本。

第一个置信限错了吧，应该是合格率

2016-6-14 14:00:07

蜗牛98

yuansoul 发表于 2016-6-14 14:00
从以上结果得：1、以10组数据所得标准差为0.9666，置信限为99%（a＝0.01）的情况下，达到含量标准在98% ...

没有注意到这个
你就直接说，应该怎么说就是了

没有注意到这个
你就直接说，应该怎么说就是了

实际就是 2828 原则里面的等效可接受限度，最小取样量的思路。但是这个，对于成品检验来说，统计学意义不存在。

实际就是 2828 原则里面的等效可接受限度，最小取样量的思路。但是这个，对于成品检验来说，统计学意 ...

这个角度比较新颖，但是觉得改个题目会更准确些，统计学在验证、确认和持续性确认中的应用。验证、确认 ...

谢谢版主建议，是的用“统计学在验证、确认和持续性确认中的应用”更确切一些。

楼主，给你文章进行了编辑，图片已经插进来了
文章作者，不会是你吧？

文章作者，不会是你吧？
跟着我们请的老师，吴遵高-吴老师学习了二年，文章中每一点都是吴老师教的，我只是把它们串了起来，试着与GMP中的三个概念对应一下。加入了一点我想法，见笑了，版主。不对的地方，请多指点。也要感谢教我二年多的吴老师。

文章作者，不会是你吧？
跟着我们请的老师，吴遵高-吴老师学习了二年，文章中每一点都是吴老师教的，我 ...

没有啊，只要学了，想着用了，不管对不对都是进步啊
总会找到出路的

“统计学只是分析数据的工具，而非是串联数据的根据。”同意

同意您的说法，统计学是工具，我们正在试着使用它。不过，通过这段时间的学习，我认为，有统计学方面的观念更重要，质量源于设计嘛，如果有了这些观念，在验证、确认或持续确认之初，就有目的地进行实验设计、数据收集要求，这样不致于在最后需要分析时，才发现，有很多缺陷，这二年，我们有过太多这样的教训。
同时，统计学，也不仅仅是工具，而是规律，也是对发现问题的诊断工具。中国质量管理的泰斗张公绪先生也是开创了控制图的诊断功能，并在新华制药做实验，得到过映证。