Reliabilita testu je míra, do které jsou různá měření testů konzistentní. Tedy míra, do které jsou rozdíly v naměřených skórech odrazem skutečných rozdílů mezi true skóry. Čím vyšší je reliabilita testu, tím méně jsou rozdíly v jednotlivých měřeních způsobeny náhodnou chybou měření. Lze předpokládat, že běžní výzkumníci nechápou reliabilitu správně. Na to lze usuzovat podle rozšířeného využívání Cronbachovy alphy jako míry reliability. Tento ukazatel reliability totiž výzkumníci poměrně často používají nevhodně. Při reportování alphy např. neuvádějí splnění předpokladů pro použití alphy (tau ekvivalence, nezávislost chyby), někdy ani neuvádí konkrétní název tohoto ukazatele (nepovažují to za nutné, protože si nejsou vědomi, že existuje mnohem více uakazatelů reliability než Cronbach?). Přitom existuje mnoho jiných koeficientů pro odhad reliability testu.

Předpokládám, že obtíže prezentované v článcích je důležité řešit (i když do hloubky jim úplně nerozumím, ale pokud by důležité nebyly, asi bychom se jimi tolik nezabývali). Možnými řešeními může být například vyšší přísnost recenzentů při posuzování, jaký článek publikují (např. se stane standardem, že v kvalitních časopisech nebude článek publikován, pokud nebudou uvedené splněné předpoklady pro použití Cronbacha jako odhadu reliability). Dále zajistit, aby odhad jiných koeficientů reliability byl stejně dostupný jako Cronbach - tedy např. právě vytvoření kalkulačky jako v Cho (2016). Zařazení různých způsobů a koeficentů odhadu reliability do osnov psychometrických univerzitních kurzů.