北京首儿药厂-首儿数据统计分析群 王文建 在新版GMP中最让人纠结的概念,大概非“验证与确认”莫属了,2015年总局又下发的新的“验证与确认”的附录,其中又提到“持续性确认”,这里我想从统计学的角度去看验证、确认和持续性确认的关系。 工业化制造的一个特点,就是大批量的、流水线式的工业化生产制造,它是对大批量多批次的各类原材料,经过生产线连续加工制造,生产出众多产品的过程。 为了保证工业化制造出的产品质量有保证,少生产出不合格品、次品,于是出现了最初的质量检验,对原材料进行来料检验,对生产的产品进行出厂检验。但是,仅靠一进一出、一头一尾的检验把关是不够的;为此,也需要同步对生产制造过程进行控制和管理,如何保证生产制造过程有效、可靠、持续稳定,这才是制造业的价值所在。 而生产制造过程,包括人、机、料、法、环、测(5M1E)6个方面,哪个方面出现问题都不保证产品制造过程有效、可靠和持续稳定。 生产制造某个产品之初,总是要对生产该产品的设备、用料、加工制造方法、操作人员、产品合格与否的判定方法、检测方法、生产环境要求进行约定,并需要试生产一下,看看是否能满足预期要求,是否可以放心的批量生产。 而以上的过程,要做到科学有效,而不是仅凭经验,则要依靠数据、依靠统计规律进行,实际上就是假设检验、检验功效和控制图(SPC)问题,如果需要和GMP中的概念做一个对应,可以理解为验证、确认和持续性确认。
例题1: 一个新产品试生产,得到含量数据10组“99.11%、100.26%、99.03%、98.23%、101.34%、98.23%、98.36%、98.94%、99.16%、99.12%、”,而产品法定标准为90%~110%,工艺投料要求100%投料,含量范围控制要求在98%~102%之间。 问题: 1、根据得到的这10组数据,在95%的置信限下,这批产品的含量是否达到了预期要求的100%? 2、为了判断这批产品含量是否达到预期的100%(范围在98%~102%时),样品数量至少要有多少个才可以。(a=0.01) 解答:问题1:(假设检验): 这里就用到统计中的假设检验,得下图(使用minitab 17): 单样本 T: C1 原假设:μ = 100 备择假设:μ≠ 100 的检验: 变量 N 均值 标准差 均值标准误 95% 置信区间 T P C1 10 99.179 0.967 0.306 (98.488, 99.871) -2.69 0.025 从以上结果得: 1、P=0.025,小于0.05,则原假设不成立,备择假设成立。也就是这组数据均值在95%的置信限下,不等于100%。 2、这组数据95%的置信区间为(98.488, 99.871),100%这个值不在这个区间内,也说明含量这组数据均值不等于100%。 问题2:(检验功效): 这里就用到统计中检验功效,得下图(在minitab 17中叫“幂和样本数量”): 幂和样本数量 单样本 t 检验 正在检验均值 = 零 (与 ≠ 零) 计算功效的均值 = 零 + 差值 α = 0.01 假定标准差 = 0.9666 差值 样本数量 目标功效 实际功效 2 7 0.9 0.904881 从以上结果得: 1、 以10组数据所得标准差为0.9666,置信限为99%(a=0.01)的情况下,达到含量标准在98%~102%范围内时,有90%(b=0.1)的置信概率,只需抽取的样本数量为7个,就可以达到99%(a=0.01)的检验功效。 2、 根据以上分析,以后抽样量只需要7个就可以,而不需要抽取10个样本。 例题2: 例题1中的产品经过试生产后,转入商业批生产,为了保证产品稳定生产,需要对生产过程中的含量指标进行管控,要求在95%~105%,这时得到以下按生产顺序的25批次数据,97.52%、101.38%、100.31%、98.19%、97.22%、100.73%、98.38%、97.70%、97.58%、99.68%、98.20%、98.36%、100.93%、98.90%、98.64%、100.92%、101.58%、99.54%、99.54%、97.81%、100.68%、101.72%、98.04%、99.26%、102.82%。 问题: 1、以含量为控制指标,这25批次的生产过程是否稳定的?能力如何? 2、该产品投入商业批生产后,如何在现有数据基础上进行持续控制,以保证产品长期持续稳定生产。 解题:问题1:(控制图(SPC))使用minitab 17中的协助,得到下图: 从以上三张图可得:1、 从这25组数据分析看,所代表的该产品生产过程是稳定的。2、 但在95%~105%的标准范围内,该产品含量的过程能力低,Z=2.79<3;Ppk=0.94<1;3、 以目前的过程能力,预期的不合格批次概率约为0.27%。问题2:1、 将上控制限为104.12%和下控制限为94.73%的控制图(SPC),正式使用在该产品的生产控制中,进行监测诊断,每生产一批,将相应的含量数据描点到控制图(SPC)中。2、 如果有点超出上、下控制限的,则进行相应分析调查,即:张公绪提出的26字真言“点出界就判异,查出异因,采取措施,加以消除,不再出现,纳入标准。” 通过以上二个例子,可以对验证、确认和持续确认(控制图(SPC))三者之间的关系,列表如下进行理解,下表各项之间的关系,也体现出了“量化管理,风险决策”的思想:
注释:检验功效 在假设检验中,当存在显著效应或差异时找到这些效应或差异的可能性。功效是在原假设不成立时正确否定原假设的概率。 影响功效的因子很多: · 样本数量:增加样本数量可提供有关总体的更多信息,因此可以提高功效。 · a (类型 I 错误的概率):增大a 值可增加功效,因为否定 a 值较大的原假设的可能性更大。 · s(总体的变异性):当 s 较小时,更容易检测到差异,这有助于增加功效。 · 总体效应的量值:总体越相似,越难检测到差异。因此,功效降低。 可在收集数据之前计算功效(预期研究),以确保假设检验可以检测到显著差异或效应。例如,一家制药公司要确定其假设检验需要具有多大的功效,才能检测出三种不同糖尿病治疗之间的差异。为提高功效,他们增加了样本数量,以了解使用这些药物的糖尿病患者总体的更多信息。而且,他们还可通过遵循好的抽样做法来尝试降低误差方差。 也可以计算功效,以了解已经执行的检验的功效(回顾研究)。例如,汽车部件制造商进行了一项比较两种钢材配方重量的试验,所得结果没有显著的统计意义。使用 Minitab,制造商可以根据希望看到的最小差异来计算功效。如果检测此差异的功效低,可能需要修改试验设计以提高功效并继续评估相同问题。但是,如果功效高,他们可能断定两种钢材配方并无差异并且不再继续进行试验。 功效等于 1- b,其中 b 是发生类型 II 错误的概率(当原假设不成立时未能否定原假设)。随着a(显著性水平)的增加,b 会降低。因此,随着 a 的增加,功效也会提高。请记住,增大 a 同时会增大类型 I 错误(当原假设成立时否定原假设)的概率。 精选留言写评论ahwjw970 文中的多个图,显示不出来,大家下压缩文件后解压看吧。 2016-6-13 21:56:45 syhorchid 学习一下 2016-6-13 22:23:58 ![]() 042005112 学习一下 2016-6-14 07:27:09 ![]() yanzhengren 谢谢分享。 2016-6-14 07:52:01 ![]() binghezhishui 学习了,谢谢分享! 2016-6-14 07:56:39 ![]() hzleiyu 下载看看谢谢分享 2016-6-14 08:08:30 ![]() globle001 thanks for sharing 2016-6-14 08:13:15 ![]() uiofer ![]() 2016-6-14 08:39:00 ![]() 蜗牛98 2016-6-14 09:00:50 ![]() kicoo2862 uiofer 发表于 2016-6-14 08:39 “统计学只是分析数据的工具,而非是串联数据的根据。”同意 2016-6-14 09:31:20 ![]() wuguanghui953 2016-6-14 10:48:28 ![]() yuansoul 蜗牛98 发表于 2016-6-14 09:00 从以上结果得: 1、 以10组数据所得标准差为0.9666,置信限为99%(a=0.01)的情况下,达到含量标准在98%~102%范围内时,有90%(b=0.1)的置信概率,只需抽取的样本数量为7个,就可以达到99%(a=0.01)的检验功效。 2、 根据以上分析,以后抽样量只需要7个就可以,而不需要抽取10个样本。 第一个 置信限 错了吧,应该是合格率 2016-6-14 14:00:07 ![]() 蜗牛98 yuansoul 发表于 2016-6-14 14:00 没有注意到这个 你就直接说,应该怎么说就是了 没有注意到这个 实际就是 2828 原则里面 的 等效 可接受限度,最小取样量的思路。但是这个,对于成品检验来说,统计学意义不存在。 实际就是 2828 原则里面 的 等效 可接受限度,最小取样量的思路。但是这个,对于成品检验来说,统计学意 ... 这个角度比较新颖,但是觉得改个题目会更准确些,统计学在验证、确认和持续性确认中的应用。验证、确认 ... 谢谢版主建议,是的用“统计学在验证、确认和持续性确认中的应用”更确切一些。 楼主,给你文章进行了编辑,图片已经插进来了 文章作者,不会是你吧? 跟着我们请的老师,吴遵高-吴老师学习了二年,文章中每一点都是吴老师教的,我只是把它们串了起来,试着与GMP中的三个概念对应一下。加入了一点我想法,见笑了,版主。不对的地方,请多指点。也要感谢教我二年多的吴老师。 文章作者,不会是你吧? 没有啊,只要学了,想着用了,不管对不对都是进步啊 总会找到出路的 “统计学只是分析数据的工具,而非是串联数据的根据。”同意 同意您的说法,统计学是工具,我们正在试着使用它。不过,通过这段时间的学习,我认为,有统计学方面的观念更重要,质量源于设计嘛,如果有了这些观念,在验证、确认或持续确认之初,就有目的地进行实验设计、数据收集要求,这样不致于在最后需要分析时,才发现,有很多缺陷,这二年,我们有过太多这样的教训。 同时,统计学,也不仅仅是工具,而是规律,也是对发现问题的诊断工具。中国质量管理的泰斗张公绪先生也是开创了控制图的诊断功能,并在新华制药做实验,得到过映证。 |
|