Халафян А.А.Боровиков В.П., Калайдина В.П
Теория вероятностей, математическая статистика и анализ данных. STATISTICA, EXCEL
Современный уровень развития компьютерных технологий позволяет изучение теории вероятностей и математической статистики вывести на новый образовательный уровень, сделав упор на прикладную часть дисциплины – математическую статистику и компьютерный анализ данных.
В учебном пособии изложены элементы комбинаторики, различные способы вычисления вероятностей, даны понятия случайной величины, ее функциональные и числовые характеристики. Теоретический материал сопровождается примерами и специально подобранными задачами, позволяющими глубже изучить материал. В отдельной главе описано использование Excel и STATISTICA для решения прикладных задач. Excel входит в состав Microsoft Office и на сегодняшний день является одним из наиболее популярных приложений в мире. STATISTICA занимает лидирующее положение среди программ анализа данных, имеет более миллиона пользователей по всему миру. Благодаря деятельности компании StatSoft Russia (statsoft.ru) – эксклюзивного представителя в России компании разработчика StatSoft Inc. (USA), программа полностью русифицирована, создан интеллектуальный портал Знаний, который представляет глобальный мультимедийный ресурс для широкого круга пользователей: школьников, студентов, аспирантов – всех желающих развить свой интеллект, познакомиться с современными технологиями компьютерного анализа данных.
Учебное пособие адресовано широкому кругу студентов, бакалаврам гуманитарных и естественнонаучных специальностей нематематического направления, изучающих высшую математику.
В связи с изучением теории вероятностей и математической статистики в образовательных учреждениях среднего и профессионального образования, пособие будет интересным и полезным учащимся и преподавателям средних школ и учреждений СПО.

ПРЕДИСЛОВИЕ


В предлагаемом учебном пособии мы стремились соединить изложение основ теории вероятностей и математической статистики и практические занятия на компьютере.
Современный уровень развития информационных технологий, доступность компьютерной техники и легкость, с которой учащиеся овладевают ею, позволяют традиционное, достаточно рутинное изучение теории вероятностей и математической статистики вывести на новый образовательный уровень, сделав упор на прикладную часть дисциплины – математическую статистику и компьютерный анализ данных.
Овладение методами математической статистики и приобретение навыков компьютерного анализа данных невозможно без знаний основ комбинаторики и теории вероятностей, поэтому в гл. 1 изложены элементы комбинаторики; в гл. 2–4 освещены различные способы вычисления вероятностей; в гл. 5–6 изложены понятия случайной величины, ее функциональные и числовые характеристики. Разделу теории вероятностей, предваряющему изучение математической статистики – закону больших чисел и центральной предельной теореме, посвящена гл. 7.
Известно, что изучение абстрактных математических понятий более эффективно, если излагаемый материал сопровождается интересными примерами и специально подобранными задачами. Поэтому авторами приводится подробное описание решения примеров по теории вероятностей. В каждом разделе приведены задачи для самостоятельного решения. Так как решение многих задач сопровождается трудоемкими вычислениями, то в отдельной главе приведены примеры использования пакетов Excel и STATISTICA.
В гл. 9 рассмотрены некоторые положения математической статистики и анализа данных на компьютере. Для иллюстрации преимуществ компьютерного анализа данных изложение материала сопровождается примерами решения статистических задач с помощью пакетов Excel и STATISTICA. Задачи, предусмотренные для самостоятельного решения, могут быть использованы для проведения практикумов и практических занятий на компьютере со школьниками и студентами.
Так как учебное пособие ориентировано на бакалавров гуманитарных и естественно-научных специальностей нематематического направления, школьников, студентов СПО с малым объемом часов на преподавание математических дисциплин, в теоретической части не приводятся доказательства теорем.
Математика и компьютерные технологии анализа данных проникают во все сферы человеческой деятельности, позволяя человеку осознанно принимать решения в окружающем нас мире. Мы надеемся, что данное издание будет полезно как для учащихся, так и для организации преподавателями эффективного учебного процесса.

ВВЕДЕНИЕ


Одна из тенденций развития современной математики состоит в резком повышении значимости тех разделов прикладной математики, которые анализируют явления, имеющие «случайный» характер и основываются на достаточно молодой науке – теории вероятностей.
Эту тенденцию можно объяснить тем, что большинство возникших в ХХ в. дисциплин, например, теория игр, теория массового обслуживания, теория информации, теория случайных процессов и т.д., оказались тесно связанными с теорией вероятностей и вошли в нее как составные части. В настоящее время теорию вероятностей приходится рассматривать как объединение большого числа разнородных и глубоко развитых прикладных математических дисциплин.
Во многих странах мира элементы теории вероятностей давно проходят в школе, в других – этот вопрос еще только обсуждается. Поэтому включение теории вероятностей в школьный курс математики российских школ является своевременным и необходимым.
Теория вероятностей отражает наше современное восприятие реального мира и позволяет в хаосе случайных явлений увидеть закономерности, которые помогают нам принимать правильные решения.
Теория вероятностей имеет непосредственное отношение к вопросу о соотношении случайности и предопределенности в эволюции, который, на протяжении многих лет рассматривался и рассматривается философами и представителями различных научных направлений.
Принципиально невозможно говорить об абсолютно одинаковых реальных объектах окружающего нас мира и абсолютно одинаковых воздействиях на них, а потому и об их полной предопределенности (детерминированности). Также не будет верным утверждение, что явления окружающего нас мира являются абсолютно случайными.
Все реальные объекты и явления имеют, по-видимому, как детерминированные, так и случайные черты, которые могут проявляться в большей или меньшей степени, поэтому вопрос о том, каким является мир на самом деле, в принципе не допускает однозначного ответа.
Например, если мы применим законы механики и всемирного тяготения Ньютона к единственной планете, вращающейся вокруг звезды, и запустим планету с заданного места с заданной скоростью, то сможем предсказать, где она будет в любой момент времени в будущем. Но если ввести еще две-три планеты в систему, то все значительно усложнится. Каждая планета действует своей силой притяжения на все остальные планеты и в свою очередь испытывает их влияние. Найти точное решение такой задачи многих тел, как ее называют астрономы, практически невозможно, т.е. система перестает быть полностью предопределенной. Сама Солнечная система не является абсолютно детерминированной, так как нельзя точно предсказать ее будущее.
Несмотря на то, что наши знания об окружающем нас мире постоянно углубляются и расширяются, долговременные изменения климата, кратковременные изменения погоды, землетрясения и другие природные катаклизмы не являются объектами для успешного прогнозирования, так как в них преобладает случайная составляющая.
Еще менее детерминированными являются некоторые законы и явления микромира. Например, нельзя говорить о точном положении электрона в определенный момент времени, но можно лишь говорить о его вероятностном положении в пространстве (электронное облако). Такого рода законы называются статистическими. Согласно этим законам, будущее состояние системы определяется не однозначно, а лишь с некоторой вероятностью.
Если вернуться из макро- и микромира в наш реальный мир, то можно привести более простые и понятные примеры явлений, содержащих детерминированную и случайную составляющие.
Например, если подбрасываем игральную кость, то выпадение определенной грани является случайным явлением, и никто не может его предсказать, но если мы многократно повторим наш эксперимент, то грани выпадут примерно одинаковое число раз – это уже закономерность, некоторая предопределенность.
Точно также как Галилей наблюдал за падением шаров различной массы, Якоб Бернулли наблюдал за падением монет, и спрашивал себя, есть ли закономерность в том, какой стороной упадет монета. Оказывается, такие закономерности действительно существуют, и их изучает теория вероятностей.
Если Вы решили испытать судьбу и сыграть в рулетку или в другую азартную игру, то Вы можете в конкретной партии проиграть или выиграть, так как это случайное явление. Но если Вы будете играть достаточно долго, то обязательно проиграете, это – закономерность, или предопределенность, которая и является экономической основой существующих игровых клубов.
Если невозможно с определенной вероятностью предсказать будущее состояние объекта, то его состояние считается неопределенным.
Таким образом, детерминированность и неопределенность – два полюса, между которыми находится случайность, ее мерой и является вероятность. Важно заметить, что детерминированные закономерности могут переходить в случайные и наоборот, а многие закономерности включают в себя и детерминированные, и случайные составляющие. Это и есть свойство реального мира, в котором мы живем и который, нам следует изучать. Такое триединство присуще многим явлениям окружающего нас мира в различных пропорциях. В одних явлениях случайность доминирует над неопределенностью, которая в свою очередь доминирует над детерминированностью, в других наоборот.
Итак, закономерности проявляются при многократном повторении испытаний. Поэтому теория вероятностей изучает свойства массовых случайных явлений, способных многократно повторяться при воспроизведении определенного комплекса условий.
Основное свойство любого случайного явления, независимо от его природы, – мера или вероятность его осуществления. Оценка меры или вероятности наступления интересующего нас события – основная задача теории вероятностей.
Математическая статистика – самостоятельный раздел математики, опирающийся на теорию вероятностей, который изучает методы сбора, систематизации и обработки результатов наблюдений с целью выявления статистических закономерностей.
Теория вероятностей и математическая статистика взаимосвязаны, но при этом существуют принципиальные различия по существу решаемых задач. Если теория вероятностей изучает закономерности случайных явлений на основе абстрактного, научного описания действительности, так называемой вероятностной модели, то математическая статистика выявляет закономерности, исследуя результаты наблюдений над случайным явлением, образующими выборку из некоторой совокупности.
Например, несложно посчитать, что при подбрасывании монеты вероятность выпадения герба или цифры одинакова и равна 1/2.
Но если подбросить монету много раз, то примерно в половине случаев она упадет гербом вверх, а в половине – гербом вниз и отношение числа выпадений герба к общему количеству произведенных испытаний будет примерно равно 1/2.
В первом случае мы посчитали вероятность умозрительно, разделив количество исходов, благоприятствующих выпадению герба – 1 к общему числу возможных исходов – 2, а во втором – воспользовались результатами выборочных наблюдений. При этом обоими методами – вероятностным моделированием и статистическим испытанием – мы выявили одну и ту же закономерность.
Теория вероятностей вначале развивалась как прикладная дисциплина. По-видимому, верным будет утверждение, что она обязана своему появлению азартным играм, хотя сегодня теория вероятностей с азартными играми имеет столько же общего сколько геометрия с измерением площадей. Игра в кости была самой популярной азартной игрой до конца Средних веков. Слово «азарт» происходит от арабского слова «alzar», переводимого как «игральная кость». Согласно греческой легенде, игру в кости предложил Паламедей для развлечения греческих солдат, скучающих при ожидании битвы при Трое (V в. до н. э.).
Возможно, игра в кости была известна значительно раньше. Так Дж. Нейман в своей книге «Вводный курс теории вероятностей и математической статистики» пишет, что археологи обнаружили в гробнице фараона две пары костей: «честные» (с равными вероятностями выпадения всех граней) и «нечестные» (с умышленным смещением центра тяжести, что увеличивало вероятность выпадения шестерок).
Ключевыми моментами развития теории вероятностей были парадоксы, возникавшие при попытках моделирования азартных игр.
Парадокс 1. Игральная кость при бросании с равной вероятностью падает на любую из граней с очками 1, 2, 3, 4, 5, 6. Когда бросают две кости, сумма выпавших очков заключена между 2 и 12. Как 9, так и 10 из чисел 1, 2, 3, 4, 5, 6 можно получить двумя различными способами:

9 = 4 + 5 = 6 + 3;

10 = 5 + 5 = 4 + 6.

В задаче с тремя костями 9 и 10 получаются шестью способами. Почему тогда 9 появляется чаще, когда бросают две кости, а 10 – чаще, когда бросают три кости?
Несмотря на простоту задачи, некоторым великим математикам не удавалось ее решить, так как они забывали о необходимости учета порядка выпадения костей. Ошибались и Лейбниц, и Даламбер.

Парадокс 2. Однажды Даламберу задали вопрос: с какой вероятностью монета, брошенная дважды, по крайней мере один раз выпадет гербом вверх? Ответ ученого был ошибочным – 2/3. Ошибкой Даламбера было то, что он рассматривал три возможных исхода (ГР, РР, ГГ) вместо четырех (ГР, РГ, РР, ГГ).

Парадокс 3. Задача шевалье де Мере. Одновременно подбрасываются две кости. Какова вероятность того, что в 24 подбрасываниях две шестерки выпадут, по крайней мере, 1 раз. По его подсчетам эта вероятность больше 1/2. Но, играя длительное время, он почему-то проигрывал. Шевалье обратился за помощью к Блезу Паскалю, который решил ее и показал, что эта вероятность равна 0,49. Эта задача была также решена Пьером Ферма. Дата опубликования Б. Паскалем решения этой задачи (1654 г.) считается днем рождения науки «Теория вероятностей».

Более подробно решение этих задач мы рассмотрим в последующих разделах учебника.
Первые работы, в которых излагались понятия теории вероятностей датируются ХVI–XVII вв. Это были работы Д. Кардано, Б. Паскаля, П. Ферма, Х. Гюйгенса и др.
Самой ранней книгой по теории вероятностей является «Книга об игре в кости» Д. Кардано (1501–1576). Эта книга была опубликована лишь в 1663 г., спустя 100 лет после написания. Аналогичный трактат был написан Галилеем между 1613 и 1624 г.
Значительный вклад в теорию вероятностей в ХVII–XVIII вв. внес Я. Бернулли, доказав теорему, которая в последствии получила названия «закона больших чисел». Следующий этап развития теории вероятностей ознаменовался работами А. Муавра, К. Гаусса, С. Пуассона, П. Лапласа и др.
В ХIХ–ХХ вв. исключительно важную роль в развитии теории вероятностей сыграли русские математики П.Л. Чебышев, А.М Ляпунов, А.А. Марков.
В ХХ в. последующий импульс в развитии теории вероятностей был дан работами таких выдающихся математиков как С.Н. Бернштейн, А.Я. Хинчин, Б.В. Гнеденко, Стьюдент (В. Гассет), Р. Фишер, Э. Пирсон и др.
В ХХ в. теория вероятностей сформировалась как строгая математическая наука. Впервые законченную систему аксиом сформулировал в 1936 г. советский математик академик А.Н. Колмогоров в своей книге «Основные понятия теории вероятностей». Из первоначально заданной системы аксиом вытекают другие ее положения и теоремы.
В настоящее время методы теории вероятностей и математической статистики лежат в основе эмпирических исследований, т.е. исследований, имеющих дело с реальными данными и фактами. Вы не сможете понять современную экономику, психологию, социологию, биологию, генетику, не зная основ теории вероятностей и математической статистики. Как правило, эти исследования опираются на данные, получаемые в результате выборочных обследований, поэтому к ним должны быть применимы статистические методы.
Проникновение аналитических методов в гуманитарные дисциплины и исследование реальных (эмпирических) данных, является велением времени. Различные тесты, критерии и шкалы измерений составляют необходимый инструментарий гуманитарных дисциплин, использование которого опирается на вероятностные методы.