源于现实问题的假设通常较为复杂:(1) 零假设的空间可能很大,直接检验十分困难;(2) 备择假设可能同样规模庞大且具有异质性,因此设计一个对各类备择假设均具备检验效能的检验方法充满挑战。然而,如果一个复杂的假设能够表达为多个对应不同方向的简单假设的交,“寻找并检验”方法可以提供一个有用的策略:将数据随机分为两部分A和B,使用数据A寻找一个零假设似乎不成立的方向,并利用数据B针对该方向的简单假设进行检验。然而,单纯应用“寻找并检验”方法可能会因随机的数据分割而导致结果缺乏可重复性和统计效能。为解决这些问题,我们证明,通过适当地聚合和校准大量基于不同数据划分的“寻找并检验”,我们可以获得一种可靠、可重复且效能较高的综合检验方法。我们将展示如何使用此框架针对多种问题构建检验,包括癌症亚型的检测和回归模型的拟合优度检验。
郭方健是美国密歇根大学安娜堡分校统计学系的助理教授。他的研究领域涵盖可重复的数据分析、因果推断以及非标准情形下的统计推断。他于美国华盛顿大学校区获得统计学博士学位,并曾在英国剑桥大学统计实验室担任博士后研究员。