Математическая статистика
| Наука | |
| Математическая статистика | |
|---|---|
| | |
| Тема | Математика |
| Предмет изучения | Математические методы обработки и анализа экспериментальных данных |
| Основные направления |
Оценка параметров, Проверка гипотез, Корреляционный анализ, Регрессионный анализ, Факторный анализ, Дисперсионный анализ, Многомерный статистический анализ |
| Вспомогат. дисциплины | Прикладная статистика |
| Значительные учёные |
Якоб Бернулли, Карл Гаусс, Пафнутий Львович Чебышёв, Андрей Николаевич Колмогоров, Карл Пирсон, Роналд Фишер и другие |
Математи́ческая стати́стика — математическая дисциплина, изучающая математические методы систематизации, обработки и использования и интерпретации статистических данных для получения выводов в науке и практике. Эта наука занимается выявлением закономерностей в массовых явлениях. Данный раздел математики является одним из наиболее часто используемых в приложениях, поскольку в большинстве научных экспериментов всегда присутствуют случайные факторы[1][2][3].
Предмет и метод математической статистики
Предметом математической статистики является разработка методов регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Под экспериментальными данными, как правило, понимают информацию, получаемую при проведении выборочных обследований. Эти данные могут иметь различную природу. От типа данных зависит то, какие методы математической статистики могут быть применимы к решению той или иной задачи[1][4][5].
В зависимости от того, какие арифметические операции применимы к данным, их относят к номинальной, порядковой, ещё называемой ординальной, шкале разностей или шкале отношений. К первому типу относятся данные, которые можно сравнивать только по принципу равенства. Это, например, паспортные данные или пароли. В номинальной шкале отсутствует понятие единицы измерения, а данные по сути своей являются качественными. Здесь возможно очень небольшое количество статистических операций. Например, можно вычислить класс, в котором содержится наибольшее количество элементов[6][7].
В порядковой шкале измерены данные, которые можно ранжировать по порядку возрастания или убывания, то есть становится допустимой операция сравнения. К ним относятся различные результаты конкурсов, соревнований. Также это могут быть шкалы землетрясений, шкалы оценки событий на предприятиях с повышенным риском. В методах испытания продукции могут быть разработаны узкоспециализированные шкалы порядка[6][7].
К шкалам интервалов относятся данные, для которых имеют смысл операции суммирования разностей (интервалов) между количественными показателями. Классическим примером является шкала интервалов времени. К этому же типу шкал относятся шкалы расстояний, температур и другие[6].
Шкалы отношений — это шкалы, для данных, измеренных в которых, помимо операций сравнения справедливы операции вычитания, умножения, а во многих случаях ещё и сложения. Примерами этих шкал могут служить масса и термодинамическая температура. Для шкал интервалов и шкал отношений справедливо понятие условных (то есть принятых по соглашению) единиц измерения[6].
Статистическим методом называется такой метод, который опирается на анализ статистических данных о некоторых совокупностях объектов. Такие методы используются во многих областях знаний. Общими чертами для различных статистических методов являются подсчёты количества объектов, относящихся к различным группам, выявление распределения количественных признаков. Также к ним относится применение выборочного метода в случаях, когда детальный анализ всех объектов совокупности затруднителен или невозможен, использование теории вероятностей для оценки достаточности количества наблюдений при осуществлении тех или иных выводов и для оценки точности результатов[1][2].
Задачи математической статистики
Задачи математической статистики связаны с обработкой результатов наблюдений над массовыми случайными явлениями. В зависимости от эмпирических данных рассматриваются различные задачи математической статистики[8].
Первой типичной задачей математической статистики является задача определения по статистическим данным закона распределения случайной величины. При неограниченном количестве экспериментов характерные для случайной величины закономерности будут проявляться с любой заданной наперёд точностью. Однако на практике число опытов ограничено. В связи с этим результат обработки наблюдений будет иметь больший или меньший элемент случайности. Таким образом, от методики обработки эмпирических данных требуется сохранение типичных свойств изучаемого явления и отбрасывание несущественных деталей, связанных с недостаточным объёмом выборки[9].
Следующая задача связана с проверкой гипотез. Эта задача связана с выдвижением гипотезы относительно изучаемого случайного явления и с проверкой согласованности статистических данных этой гипотезе. Гипотеза может выдвигаться относительно закона распределения изучаемой случайной величины. Другим примером гипотезы служит выявление объективной зависимости между двумя величинами[10].
Ещё одной важнейшей задачей математической статистики является оценка параметров. Эта задача связана с определением числовых характеристик или связанных с ними параметров исследуемых случайных величин или их систем. Если из теоретических соображений известно семейство законов распределения, возникает необходимость определения его конкретных. Например, на основании центральной предельной теоремы, может быть сделано предположение о том, что результаты некоторых измерений подчиняются нормальному распределению вероятностей. В этом случае нужно оценить его параметры — математическое ожидание и дисперсию[11][1].
Одной из важных задач математической статистики является вопрос целесообразного числа наблюдений, необходимых для получения выводов относительно изучаемого случайного явления с заданной точностью. Часто это число определяется заранее. Однако в ряде случаев удобнее определять количество экспериментов в процессе их проведения, то есть после каждого опыта принимать решение, нужен ли следующий или можно остановиться. При качественном подборе параметров такой процедуры можно значительно снизить число наблюдений по сравнению с фиксированным заранее. Такого рода вопросы решаются в теории планирования эксперимента, которая стала важной частью современной математической статистики[1].
Наряду с развитием и уточнением общих понятий математической статистики совершенствуются и её отдельные разделы. К таким разделам относятся, например, корреляционный и регрессионный анализ, дисперсионный и факторный анализ, многомерный статистический анализ, статистический анализ случайных процессов[1].
Связь с теорией вероятностей и прикладной статистикой
Основой для статистических методов являются вероятностные требования к изучаемым случайным явлениям. Нарушение этих требований приводит к грубым ошибкам в получаемых результатах и основанных на них выводах[1].
Важнейшими теоремами, на основе которых базируются статистические методы, являются предельные теоремы теории вероятностей. Это группа законов больших чисел, группа центральных предельных теорем и вероятностей больших уклонений. Например, в соответствии с законом больших чисел при большом числе испытаний частоты регистрации событий сходятся по вероятности к вероятности их наступления, а усреднённые значения — к их математическим ожиданиям[12][13][14][1].
Кроме того, для всех основанных на теории вероятностей методов математической статистики важен уровень значимости. Он характеризует вероятность отвергнуть проверяемую гипотезу, если на самом деле она верна. Его также называют вероятностью ошибки первого рода. Существенным является вопрос выбора этого параметра. При слишком близком к нулю значению уровня значимости выводы становятся размытыми и не позволяющими различить даже значительно отличающиеся явления[1][15].
Математическую статистику также можно считать разделом теории вероятностей. Это связано с тем, что любая задача математической статистики представляет собой задачу теории вероятностей, иногда весьма своеобразную[16].
Математическая статистика выступает разработчиком значительной части математического аппарата для прикладной статистики. В отличие от математической статистики, где существенным условием является вероятностная природа обрабатываемых данных, в прикладной статистике развивается широкий класс методов статистической обработки, данные в которых априори не носят вероятностный характер. К таким методам относятся, например, методы кластерного анализа, методы многомерного шкалирования, теория измерений и другие[17][18].
Историческая справка
Зарождение математической статистики как науки связано с работами основателей теории вероятностей — Якоба Бернулли, Пьера Лапласа и Симеона Пуассона. В России применение математической статистики в демографических и страховых расчётах получило развитие благодаря трудам 1846 года Виктора Яковлевича Буняковского, опиравшегося на теорию вероятностей. Ключевое влияние на дальнейший прогресс математической статистики оказала деятельность российской школы теории вероятностей во второй половине XIX — начале XX века, представленной Пафнутием Львовичем Чебышёвым, Андреем Андреевичем Марковым, Александром Михайловичем Ляпуновым и Сергеем Натановичем Бернштейном. Многие аспекты теории статистических оценок были фактически разработаны на базе теории ошибок и метода наименьших квадратов Карлом Фридрихом Гауссом и Андреем Андреевичем Марковым[1][2].
Несмотря на важность работ Адольфа Кетле, Френсиса Гальтона и Карла Пирсона, они в меньшей степени использовали достижения теории вероятностей по сравнению с российской школой. Карл Пирсон активно занимался составлением таблиц функций, необходимых для практического применения методов математической статистики. Эта работа была продолжена во многих научных центрах, в том числе в СССР Евгением Евгеньевичем Слуцким, Николаем Васильевичем Смирновым и Логином Николаевичем Большевым[1][2].
Создание теории малых выборок, общей теории статистических оценок, критериев проверки гипотез, не требующих априорных распределений, и последовательного анализа принадлежит англо-американской школе, представленной такими учеными, как Стьюдент (он же Уильям Госсет), Роналд Фишер, Эгон Пирсон, Ежи Нейман и Абрахам Вальд, чья деятельность началась в первой четверти XX века. В Советском Союзе значительный вклад в математическую статистику внесли Андрей Николаевич Колмогоров, Всеволод Иванович Романовский, Евгений Евгеньевич Слуцкий, разработавший важные методы в статистике стационарных рядов, Николай Васильевич Смирнов, создавший основы теории непараметрических методов, и Юрий Владимирович Линник, обогативший аналитический аппарат новыми приёмами. Методы математической статистики активно применяются для исследования и контроля массового производства, а также в физике, гидрологии, климатологии, астрономии, биологии, медицине и других областях[1][2].
Современная статистика ведёт исследования в различных направлениях. Одним из направлений является разработка и внедрение методов планирования эксперимента[1]. Другим примером служит анализ «пакетов» статистических критериев. Кроме того, широко распространены работы по применению методов математической статистики в лингвистике, медицине и других областях[19].
Литература
- Боровков А. А. Математическая статистика. — Санкт-Петербург: Лань, 2010. — 704 с. — ISBN 978-5-8114-1013-2.
- Вентцель Е. С. Теория вероятностей. — Москва: Высшая школа, 2006. — 575 с.
- Лагутин М. Б. Наглядная математическая статистика. — Москва: Бином. Лаборатория знаний, 2015. — 475 с. — ISBN 978-5-9963-2955-7.
- Чернова Н. И. Математическая статистика. — Новосибирск: СибГУТИ, 2009. — 90 с.
- Hald A. A History of Mathematical Statistics from 1750 to 1930 (англ.). — New-York: Wiley, 1998. — 824 p. — ISBN 978-0-47-117912-2.
Примечания
- ↑ 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 Прохоров Ю. В. Математическая статистика. БРЭ (10 февраля 2023). Дата обращения: 30 декабря 2025.
- ↑ 2,0 2,1 2,2 2,3 2,4 Тихонов А. Н., Самарский А. А., Свешников А. Г. Математическая статистика // Математический энциклопедический словарь / Главный редактор Ю. В. Прохоров. — Москва: Советская энциклопедия, 1988. — С. 344—348. — 848 с.
- ↑ Лагутин, 2015, с. 5.
- ↑ Чернова, 2009, с. 8.
- ↑ Лохвицкий, 2025, с. 76.
- ↑ 6,0 6,1 6,2 6,3 МИ 2365-96 ГСИ. Шкалы измерений. Основные положения. Термины и определения. ГП «ВНИИФТРИ» (29 февраля 1996). Дата обращения: 2 января 2026.
- ↑ 7,0 7,1 Лохвицкий М. С., Синева И. С., Скородумова Е. А. Теория вероятностей и математическая статистика: учебное пособие. — Москва: МТУСИ, 2025. — С. 76—77. — 148 с.
- ↑ Вентцель, 2006, с. 131—132.
- ↑ Вентцель, 2006, с. 132.
- ↑ Вентцель, 2006, с. 132—133.
- ↑ Вентцель, 2006, с. 133.
- ↑ Боровков, 2010, с. 21—68.
- ↑ Предельные теоремы. БРЭ (9 сентября 2022). Дата обращения: 2 января 2026. Архивировано 17 июля 2025 года.
- ↑ Touchette H. A basic introduction to large deviations: Theory, applications, simulations (англ.) // Modern Computational Science 11: Lecture Notes from the 3rd International Oldenburg Summer School. — BIS-Verlag der Carl von Ossietzky Universit¨at Oldenburg, 2011.
- ↑ Уровень значимости статистического критерия. БРЭ (25 января 2023). Дата обращения: 2 января 2026. Архивировано 14 декабря 2024 года.
- ↑ Боровков, 2010, с. 19.
- ↑ Айвазян С. А., Мхитарян В. С. Основы эконометрики. — Москва: Юнити-Дана, 2001. — Т. 1. Теория вероятностей и прикладная статистика. — С. 29. — 656 с. — ISBN 5-238-00304-8.
- ↑ Мешалкин Л. Д., Айвазян С. А., Енюков И. С. Прикладная статистика: Основы моделирования и первичная обработка данных. — Москва: Финансы и статистика, 1983. — С. 17—18. — 471 с.
- ↑ Зубков А. М., Прохоров А. В. Кафедра математической статистики и случайных процессов // Вестник Московского университета. Серия 1. Математика. Механика : журнал. — 2025. — № 1. — С. 32—39. — ISSN 0579-9368.