课本中对于拒绝域的选择通常是选择连在一起的中间段子(原谅我语文不好),但是如果我们自己选择几段(但是这几段加起来满足概率的条件,例如95%),我觉得从假设检验的原理来说,也是可行的,如果不可行,为什么,如果可行,那么会对结果产生什么影响。 【JackDiamond的回答(16票)】: 谢邀,这其实是个好问题。 一方面,原则上选取多个不相交的区间(或者更一般地,选择一个sample space的一个Lebesgue可测子集)作为接受域,只要其对应的第一类错误概率小于等于 ![]() ,那么这个检验就是一个合法的检验。 不这样做的原因,不仅仅是这样比较麻烦,更主要的是这样的检验一般都不够powerful(回忆powerful的意思是在 ![]() 包含真模型时正确拒绝 ![]() 的概率大)。举个最简单的例子,对一元正态分布,检验其population mean ![]() ,其中 ![]() (这里原来我写的不对,多谢 @夏澈丹 指正,现在改为最简单的simple vs simple test)。这种情况下the most powerful test是likelihood ratio test,而计算可知likelihood ratio test的acceptance region一定是单个区间。 所以结论是这样的检验完全可以是可行的,只是一般来说既复杂、又不如接受域为一个区间的检验powerful,所以很少见到。 【陈无左的回答(1票)】: 1。不考虑细节,假设检验就是观察数据是否掉在所取的拒绝域内。 2。所以一个假设检验的构造就是拒绝域的构造。 3。统计假设检验无非是对数据生成机制的概率模型进行假设。然后观察数据。然后看数据是否掉入拒绝域。 4。为了简化拒绝域的结构,一般再作样本上的可测函数,称为检验统计量,然后上升到检验统计量的值域概率空间,在那儿构造拒绝域。 5。逻辑是小概率后果导致小概率假设,这是不可能后果导致不可能前提的概化版本。 6。以此逻辑在检验统计量的值域概率空间上构造拒绝域意味着寻找其上抽样分布之下的低密度区域。 7。进一步,当还有备择假设存在的时候,要考虑同时尽量减小第二类错误。 8。这时整个问题变成了一个统计流型上的约束优化。 9。一个经典结论(Neyman-Pearson Lemma)是当零假设和备择假设自由度同为1时,似然比检验统计量指定的低密度区域给出最优拒绝域。 原文地址:知乎 |
|