Фёдор Борщёв

Заметки с тегом «Статистика»

Чарльз Уиллан — Голая статистика

Статистика — единственная полезная наука, которую нельзя изучить через википедию:

Википедия: непонятно о статистике

Вместо википедии лучше читать «Голую статистику». Автор не углубляется в теорию и трогательно извиняется, когда ссылается на формулы. Книга — практичная: расскажет как устроены опросы общественного мнения, что такое корреляция и центральная предельная теорема, и что лучше показывать руководству — среднее арифметичекое или медиану.

Чарльз Уиллан — Голая статистка / Charles Wheelan — Naked Statistics

Читать «Статистику» стоит всем, чья работа связана с цифрами. Если ваша — не связана, то почитайте хотя бы начало, где автор рассказывает о популярных приемах вранья при помощи статистики.

Покупайте на озоне.

На самом деле точность может маскировать — случайно или вполне намеренно — недостоверность, вызывая у нас ложное ощущение определенности. Паранойя охватившая Джозефа Маккарти, сенатора от штата Висконсин и ярого антикоммуниста, достигла своего апогея в 1950 году, когда он не только утверждал, что в Госдепартамент США внедрились коммунисты, но и доказывал, что располагает поименным списком этих людей.

Во время своего выступления в г. Уиллинг Маккарти потрясал в воздухе листком бумаги: «Я держу в руке список из 205 фамилий членов Коммунистической партии. Они известны госсекретарю. Тем не менее эти люди продолжают работать в Госдепе, более того, они формируют внешнюю политику страны!».

Впоследствии выяснилось, что Маккарти держал в руке чистый листок бумаги однако указание точного числа (205) придало словам сенатора большую достоверность, несмотря на столь наглую ложь

Систематическая ошибка выбора может возникнуть при различных обстоятельствах. Опрос потребителей в аэропорту искажается тем фактом, что любители летать самолетами, как правило, более состоятельные люди, чем население в целом; в случае проведения опроса на площадке для отдыха возле автомагистрали Interstate 90 может сложиться противоположная ситуация.

На результаты обоих опросов наверняка повлияет и то, что люди, готовые в них участвовать, отличаются от людей, предпочитающих не отвлекаться на подобные вещи. Если вы попросите 100 человек в каком-либо общественном месте заполнить совсем небольшую анкету, то те 60, которые согласятся это сделать, наверняка будут существенно отличаться от остальных 40, которые вас проигнорируют

Как измерить что угодно

Купил эту книгу из-за второго названия — «Оценка стоимости нематериального в бизнесе». Про оценку нематериального нет ничего, а вот про измерения — очень даже.

Дуглас Хаббард — Как измерить что угодно. Оценка стоимости нематериального в бизнесе

Древний грек Эратосфен Киренский прикинул длину земной окружности не выходя из библиотеки, зная расстояние между двумя городами и разницу в длине солнечной тени. Дуглас Хаббард восторгается подходом Эратосфена и учит читателей «интуитивным измерениям» — такое умение пригодится любому менеджеру. В условиях неопределенности лучше принимать решения на основе промежутка возможных значений, чем вообще без учета показателей.

Автор доказывает, что измерение — итеративный процесс, где задача каждой итерации — уменьшить неопределенность. Чтобы разобраться в неизвестном показателе, не нужны масштабные измерения и сбор статистики — просто прикиньте промежуток (автор почему-то называет его 90% доверительным интервалом) и вы уже будете знать намного больше, чем раньше.

Книгу населяют странные личности — интуитивные байесианцы, калиброванные эксперты и страховые актуарии. После пятой главы текст превращается в псевдонаучную кашу — дальше читать нет смысла. Автор как раз успеет рассказать об итеративном измерении и даст пару психологических трюков, которые научат точнее прикидывать промежутки.

Покупайте книгу на литресе — сможете сходу называть неизвестные величины, вроде размаха крыльев Боинга, уровня вовлечения потребителей или длины 20-долларовой банкноты.

Предположим, что вы собираетесь перевести часть сотрудников на дистанционную работу. Один из факторов, который вам необходимо учесть — сколько времени средний служащий ежедневно тратит на дорогу до работы и домой.

Чтобы выяснить это, вы можете официально опросить всех работников, потратив много времени и денег. При этом, скорее всего, ответ будет точнее, чем вам необходимо. Допустим теперь, что взамен вы выберете наугад пять человек. Вызовите этих людей и спросите, сколько времени они обычно тратят на дорогу. Предположим, будут получены следующие ответы: 30, 60, 45, 80 и 60 минут.

Возьмем самое высокое и самое низкое значения в выборке — 35 и 80. Вероятность того, что медиана значений продолжительности поездок на работу и домой для совокупности работников находится в этом интервале значений составляет 93%. Я называю это Правилом пяти. Правило пяти несложно, оно работает, и можно доказать его статистическую обоснованность для решения целого ряда задач. Когда выборка настолько мала, интервал значений может быть очень широким, но если он окажется значительно уже предыдущего интервала значит, вы провели измерение.

Точное определение объекта измерения — исходный пункт любого научного исследования, даже самого революционного. Менеджеры компаний должны понять что некоторые вещи кажутся нематериальными только потому, что люди сами толком не решили, о чем они говорят. Определитесь с объектом — и половина работы по измерению будет завершена.

  1. Если это имеет хоть какое-то значение, значит, оно обнаруживается или наблюдается.
  2. Если это обнаруживается, значит, оно обнаруживается в каком-то количестве (или количественном интервале).
  3. Если это обнаруживается в количественном интервале, его можно измерить»