Хессет как раз и привёл пример того, что бывает если пренебрегать правилами и использовать статистику не разбираясь в ней.
Во времена моего обучения в одном из ВУЗов одна из доцентов проводила научное исследование и хотела по анализу слюны определить уровень стресса (ориентируясь на подготовленность студентов к занятию). За достаточно короткий срок каждый студент должен был набрать пробирочку своей слюны) Если этого не происходило, то студент подвергался репрессии. Студенты были не глупее препода и стали кто как может стимулировать выработку слюны леденцами, лимоном и т.д. и т.п., а то и разбавлять слюну физраствором до нужного объёма. Тётка собрала статистический материал, обработала его и получила исследование, тиснула работу в сборник трудов института, вписала себе её в научные заслуги. Вот только отношение других коллег к работе было не очень. Так что не будем путать статистику адекватную с псевдостатистикой.
Относительно форматов тестов посмотрите статистику по полевым применениям тестов. Там как раз указывается сколько было вынесено правильных решений и в каком количестве случаев были допущены ошибки 1-го рода, а в каком - 2-го рода. Соотношение этих ошибок как раз и зависит от чувствительности и специфичности теста определённого формата. В связи с тем, что от формата теста зависят эти критерии, ряд зонных тестов имеет отнюдь не симметричные границы принятия решения. Мы имеем дело с психикой человека и от формата теста и введения вопросов зависит очень многое.