Пивовар, который произвел революцию в статистике

Интерпретация результатов небольших исследований всегда была одной из сложнейших научных задач. Насколько они применимы к явлениям более широкого порядка? Укладываются ли в рамки закономерности или являются частным феноменом, чем-то вроде случайного шума?

К счастью, в наши дни в распоряжении ученых есть способ, позволяющий оценить, насколько можно доверять данным этого рода. Он был придуман в начале 20 века технологом, работавшим на пивоваренную кампанию «Гиннесс». Это статистический тест, который изначально был призван удостоверять качество хмельного напитка, но сегодня широко применяется в биологии, медицине, других областях научных исследований.

Англичанин Уильям Сили Госсет родился в 1876 году. С самого раннего детства он любил экспериментировать и изобретать. Высшее образование наш герой получил в Винчестерском университете и в Оксфорде.

Уильям Сили Госсет (William Sealy Gosset)

В возрасте 23 лет он устроился на работу в компанию «Гиннесс». В то время это было относительно небольшое предприятие, использовавшее традиционные процессы приготовления. Технология была донельзя простой – ячмень или какое-то другое зерно смешивались с ароматизированной водой, после чего добавлялись дрожжи, которые за неделю доводили пиво до готовности. Проверка качества напитка обычно осуществлялась посредством дегустации его вкуса и запаха. Но компания намеревалась перейти к производству в промышленных масштабах, и данный метод оценки переставал быть сколько-нибудь практичным. Просто представьте себе крупный пивоваренный завод, по которому ходят шатающиеся от огромного объема проделанной работы «дегустаторы».

Перед Госсетом была поставлена задача придумать недорогой и быстрый способ проверки качества продукции, не задействующий человеческий контингент традиционного типа. Одна из технологий, испытывавшихся англичанином, заключалась в сравнении содержания сахара в экстракте ячменного солода из разных партий. Сладкий продукт являлся пищей для дрожжей, поэтому колебания в данном параметре могли свидетельствовать об ухудшении качества пенного напитка. Однако количество образцов, предоставлявшихся Госсету, было очень небольшим. Кроме того, обнаруженная разница между ними могла означать не только истинное отличие в содержании сахара, но и некую аномалию в одной из проб – вследствие, например, неравномерного перемешивания жидкости в чане.

Таким образом, Госсет столкнулся с проблемой, возникающей при любом исследовании ограниченного масштаба – некорректными образцами, не отражающими свойств всей партии. Здесь можно привести более наглядный пример: вы хотите узнать среднюю стоимость дома в том или ином городе, но высчитываете её на основании цены всего десяти строений. Понятно, что данная выборка не позволит получить даже самого общего представления по интересующему вас вопросу. Как бы то ни было, Госсет осознал, что возникшую проблему можно решить, если научиться определять, является ли тот или иной образец солодового экстракта надежным показателем качества всей партии пива.

До той поры статистики не уделяли особого внимания исследованию малых выборок, поскольку на тех стояло клеймо непригодности для вменяемого анализа. Госсету волей-неволей пришлось стать пионером в этой области, и он превосходно справился с нелегкой задачей. Англичанин решил сравнивать среднюю концентрацию сахаров в текущей партии с аналогичными показателями из выборок гораздо большего масштаба, используя классическую, похожую на колокол кривую, которая именуется нормальным распределением. В какой-то момент обнаружилось, что чем меньше количество образцов, тем больше средняя концентрация их партии отличается от аналогичного значения крупного, совокупного объема продукции. Чтобы решить эту проблему, Госсет разработал концепцию t-распределения.

Оригинальная таблица t-распределения из работы Госсета «Вероятная ошибка среднего» (англ. The probable error of a mean)

Главным отличием от графика нормального распределения было то, что если у классического «колокола» концы кривой быстро нисходят до нуля, то у t-распределения эти части спускаются более плавно, образуя длинные «хвосты». Последние отображают значительно большую ненадежность, присущую малой выборке. Госсет связал размер этого набора данных с вероятностью изменчивости и придумал важнейший механизм проверки – критическое значение. Если разница в концентрации сахара у двух образцов была больше этого параметра, то она почти наверняка имелась и у крупных партий пива, которые, собственно, и требовалось сопоставить. Если же отличие было меньше критического значения, сравниваемые объемы напитка являлись условно одинаковыми.

Мемориальная доска в хранилище рекордов Гиннесса в память о Госсе

Данный метод сопоставления получил название t-критерия. Он позволил пивоваренной компании «Гиннесс» увеличить производство до промышленных масштабов и стать тем гигантом отрасли, о котором известно каждому любителю пенного напитка. Сегодня, более столетия спустя, t-критерий используется не только для проверки качества пива. Он приносит огромную пользу ученым, которым нужно интерпретировать результаты своих исследований и экспериментов. Если требуется сравнить, например, концентрацию натрия в образцах крови пациентов или проверить, какое пшеничное поле дает урожай с наибольшим содержанием крахмала, описанный метод является самым надежным инструментом получения желаемого результата.


Интересный факт: метод, разработанный Госсетом, широко известен как «t-критерий Стьюдента», но никакого отношения к студентам высших учебных заведений он не имеет. Название он получил благодаря тому, что компания «Гиннесс» запретила Госсету публиковать результаты своих исследований под настоящим именем. Ученому пришлось искать себе псевдоним, и он выбрал в качестве такового слово «Student», отпечатанное на тетради, в которой он вел свои записи.

Добавить комментарий
Предыдущая статья

Топ 12 популярных аккаунтов TikTok с животными, на которые стоит подписаться