Корреляция — что это такое простыми словами
Обновлено 24 июля 2021- Что это такое
- Коэффициент корреляции
- Причины корреляции и гипотезы
- Как с помощью этого становятся богаче
- Памятка
Здравствуйте, уважаемые читатели блога KtoNaNovenkogo.ru. Когда некоторые люди слышат слово «корреляция», то зачастую просто впадают в ступор. Оно и понятно: жуткий термин из мира высшей математики и статистики.
Сразу представляются унылые графики, многоэтажные формулы, при взгляде на которые хочется забиться в угол и плакать. На самом деле все гораздо проще.
Потратив несколько минут на прочтение этой статьи, вы узнаете, что такое корреляция и как ее использовать в повседневной жизни.
Определение корелляции — что это
Простыми словами корреляция – это взаимосвязь двух или нескольких случайных параметров. Когда одна величина растет или уменьшается, другая тоже изменяется.
Объясним на примере: существует корреляция между температурой воздуха и потреблением мороженого. Чем жарче погода, тем больше холодного лакомства покупают люди. И наоборот.
Такие закономерности устанавливаются путем исследования больших объемов статистических данных. Собираем информацию о потреблении мороженого за несколько лет и сведения о колебаниях температуры за тот же период. А дальше сопоставляем и ищем зависимость.
Коррелировать – это значит быть взаимосвязанным с чем-то. Существует положительная и отрицательная корреляции.
При положительной чем больше один параметр, тем больше и другой. Например, чем масштабнее траты фермера на удобрения, тем обильнее урожай. При обратной корреляции рост одной величины сопровождается уменьшением другой. Чем выше здание, тем хуже оно противостоит землетрясениям.
Корреляция — это взаимосвязь без гарантий
Рассмотрим пример прямой корреляции: чем выше уровень благосостояния человека, тем больше его продолжительность жизни. Обеспеченные люди питаются качественной пищей и своевременно получают врачебную помощь. В отличие от бедняков.
Однако нельзя с уверенностью сказать, что определенный олигарх проживет дольше вот этого нищего.
Это лишь статистическая вероятность, которая может не сработать для одного конкретного случая. Этим корреляция отличается от линейной зависимости, где исход известен со 100-процентной вероятностью.
Но если мы возьмем выборку из сотни тысяч богачей и такого же числа малоимущих, сравним их продолжительность жизни, то общая тенденция будет верна.
Коэффициент корреляции
Это число, которое обозначается как «r». Оно находится в промежутке от -1 до 1. Отражает силу и полюс взаимосвязи величин. Посмотрим на примере:
Значение коэффициента | Какая корреляция? | О чем это говорит? |
---|---|---|
r=1 | Сильная положительная корреляция | Люди, которые едят чернику, обладают острым зрением. Ешьте чернику! |
r меньше 0,5 | Слабая положительная корреляция | Некоторые люди, которые любят чернику, обладают острым зрением. Но это не точно. Короче, ничего не пока понятно. Но лучше есть чернику на всякий случай. |
r=0 | Корреляция отсутствует | Черника и зрение никак не связаны. |
r меньше -0,5 | Слабая отрицательная корреляция | Бывают случаи ухудшения зрения из-за черники. Не стоит рисковать. |
r=-1 | Сильная отрицательная корреляция | Практически все, кто ел чернику, ослепли. Берегитесь черники! |
Величина коэффициента корреляции рассчитывается по формуле:
Если внезапно потемнело в глазах и возникло непреодолимое желание закрыть статью (синдром гуманитария), то есть вариант попроще. Microsoft Exel все выполнит сам при помощи функции «КОРРЕЛ». Делается это так:
Судя по расчетам, рост человека практически никак не влияет на уровень зарплаты.
Реальные причины корреляции и возможные гипотезы
Курс доллара и стоимость нефти отрицательно коррелируют. Можем выдвинуть гипотезу: повышение цен на черное золото вызывает падение стоимости американской валюты. Но почему так происходит? Откуда взялась связь между этими явлениями?
Определение причины корреляции – это очень сложная задача. Переплетаются тысячи различных факторов, часть из которых скрыта.
Возможно, дело в том, что США – крупнейший потребитель нефти в мире. Каждый день они импортируют около 7,2 миллиона баррелей. Снижение цены на черное золото – хорошо для американской экономики, ведь позволяет тратить меньше денег. Следовательно, доллар растет.
Корреляция предоставляет возможность сделать вывод из статистических данных.
Например, мы выяснили, что существует отрицательная взаимосвязь между доходом персонала и его эффективностью в работе. Наша гипотеза: «Лентяи и бездельники получают больше, чем ответственные сотрудники». Тогда мы пересмотрим систему мотивации и избавимся от бесполезных людей.
Гипотеза – это лишь статистический вывод, предположение. Она вполне может оказаться ошибочной.
Согласно статистике, чем больше пожарных участвует в тушении огня, тем существенней размер ущерба. Какую гипотезу можем сделать отсюда? Пожарные приносят вред, давайте сократим их! Но если разобраться, то настоящая причина повреждения – это огонь. А увеличение числа лиц, задействованных в его тушении, – следствие масштаба пожара.
Наша вселенная бесконечна, а значит всегда можно найти несколько переменных, которые будут коррелировать между собой, несмотря на полное отсутствие причинно-следственных связей. Даже самое буйное воображение не сможет объяснить, что объединяет сыр и одеяло-убийцу:
Более подробно на эту тему смотрите в видео:
Как при помощи корреляции люди становятся богаче
Главное правило любого инвестора: не класть все яйца в одну корзину. Вложения рекомендуется диверсифицировать (что это?) – распределять. Поэтому люди покупают акции не одной компании, а десятка разных, формируя инвестиционные портфели. Если котировки какой-то фирмы упадут, то оставшиеся девять смогут отыграть падение или хотя бы уменьшить убытки.
Но это в теории, а на практике все портит корреляция. Проблема в том, что стоимости акций разных компаний внутри отрасли или даже всей страны могут сильно коррелировать. Проблемы огромной корпорации провоцируют панику на рынке, снижают стоимость иных активов, на первый взгляд не связанных между собой. В 2008 году случился крах Lehman Brothers, который вызвал цепную реакцию и обвал на мировых рынках.
Поэтому при инвестировании нужно стараться выбирать направления, которые не связаны между собой (r стремится к 0).
Например, пара «золото – облигации США» = -0,13. Если собрать портфель из совершенно независимых частей, риски финансовых потерь сократятся.
Территориальное приближение активов друг к другу усиливает корреляцию. Значит, нужно рассматривать варианты в разных точках мира, максимально удаленных друг от друга.
В жизни этот принцип тоже действует. Если ваши навыки и знания позволяют трудиться программистом, таксистом, сантехником и журналистом – вы хорошо защищены от риска безработицы.
Памятка
- Корреляция – это соотношение, взаимозависимость нескольких переменных.
- Связь бывает положительной и отрицательной.
- Коэффициент корреляции определяет степень взаимозависимости одной переменной от другой.
- На основании корреляции люди выдвигают гипотезы (часто ошибочные).
- Истинная причина корреляции порою скрыта под множеством факторов и внешних сил.
- Бывает ложная корреляционная зависимость.
- Раскладывая яйца по корзинам, помните о том, что они не должны коррелироваться друг с другом.
Удачи вам! До скорых встреч на страницах блога KtoNaNovenkogo.ru
Эта статья относится к рубрикам:
КОРРЕЛИРУЕТ — Что такое КОРРЕЛИРУЕТ?
Слово состоит из 11 букв: первая к, вторая о, третья р, четвёртая р, пятая е, шестая л, седьмая и, восьмая р, девятая у, десятая е, последняя т,
Слово коррелирует английскими буквами(транслитом) — korreliret
Значения слова коррелирует. Что такое коррелирует?
Коррелировать
КОРРЕЛИРОВАТЬ Помещать что-то в ситуацию, в которой оно находится в известном соотношении с другими вещами. 2. Вычислять коэффициент корреляции.
Оксфордский словарь по психологии. — 2002
Коррелировать — то есть производить расчет корреляции (математической или статистической взаимосвязи) между признаками.
Большой глоссарий по антропологии. — 2001
Примеры употребления слова коррелирует
Оно в известной степени коррелирует с маржой.
Посчитанный показатель скорее коррелирует с ВВП стран, чем с количеством долларовых миллиардеров.
С одной стороны, очевидно, что рост цен слабо коррелирует с качеством услуг.
Связано это с тем, что в России, по ее словам, цена квадратного метра жилья коррелирует с ценой на нефть.
Также довольно слабо наличие сбережений коррелирует с уровнем дохода.
- коррекция
- коррелировавший
- коррелировать
- коррелирует
- коррелируют
- коррелирующий
- коррелометр
Что такое корреляция
Наукообразные понятия всегда популярны. Глагол «коррелировать» широко используется журналистами и политиками, иногда не к месту. Обычно термином «корреляция» обозначают любую связь.
Люди давно заметили, что все явления, происходящие на нашей планете, в некоторой степени оказывают влияние друг на друга. Не всегда связи между ними можно с легкостью обнаружить, но, тем не менее, они существуют. Говоря о взаимозависимости событий, нередко употребляют слово «корреляция». Чаще всего его используют экономисты и аналитики.
Разберемся, что на самом деле обозначает это понятие.
Корреляция: определение
Пожалуй, первым в научном мире о корреляции заговорил палеонтолог Жорж Кювье. На рубеже 18-19 веков он сделал ряд открытий в области сравнительной анатомии. В результате этих открытий Кювье сформулировал закон соотношения частей, согласно которому изменения в строении одного из органов животного приводят к изменениям в строении других органов. Опираясь на эти знания, Кювье научился восстанавливать облик ископаемых животных по отдельным сохранившимся фрагментам.
Что же касается статистики, то в этой науке понятие корреляции закрепилось позже – в конце 19 века, благодаря английскому биологу Фрэнсису Гальтону.
Корреляция – это не просто связь (relation), а, скорее, взаимоотношения или взаимозависимость (co-relation).
Формула для получения коэффициента корреляции была выведена учеником Гальтона, математиком и биологом К. Пирсоном.
Коэффициент корреляции
Корреляцией называют статистическую связь каких-либо независимых друг от друга величин. Предполагается, что как только значение одного из параметров меняется, меняется и значение другого. Если же изменения касаются только отдельных статистических характеристик, связь такого рода считается статистической. О корреляции в этом случае речи не идет.
Для выражения степени взаимозависимости используется коэффициент корреляции. Диапазон значений коэффициента – от -1 до +1.
- Если корреляция является абсолютной и положительной (+1), то при подорожании одной ценной бумаги в той же степени будет дорожать и другая.
- Говоря об абсолютной отрицательной корреляции, мы подразумеваем, что если стоимость одной ценной бумаги растет, то стоимость отрицательно коррелированной – падает.
- Если же коэффициент корреляции нулевой, то никакой взаимозависимости между движениями ценных бумаг нет: они случайны.
Чем выше значение коэффициента, тем больше проявляется взаимозависимость. Если значение коэффициента больше 0,5, то взаимосвязь ярко выражена.
Необходимо уточнить, что абсолютная корреляция ценных бумаг существует только в идеальном мире. В реальном же акции только в некоторой степени коррелированы.
Парная корреляция
Этот термин употребляется для обозначения взаимоотношений между двумя определенными величинами. Известно, что расходы на рекламу в США в значительной мере влияют на объем ВВП этой страны. Коэффициент корреляции между данными величинами по итогам наблюдений, продолжавшихся в течение 20 лет, составляет 0,9699.
Более «приземленный» пример – связь между посещаемостью страницы онлайн-магазина и объемом его продаж.
И уж, конечно, вряд ли кто-нибудь станет отрицать наличие зависимости, существующей между температурой воздуха и продажами пива или мороженого.
Корреляция – это взаимозависимость двух величин; коэффициент корреляции – это объективный показатель, определяющий степень этой взаимозависимости. Коэффициент корреляции может быть и положительным, и отрицательным. Что касается ценных бумаг, то они крайне редко бывают абсолютно коррелированными.
⇧Корреляция: что это, ее виды и как на ней заработать | Бета Финанс
На финансовых рынках также нередко прослеживается корреляция между инструментами, которые торгуются. Она проявляется в том, что изменение цены одного из активов приводит к колебаниям стоимости другого.
Какой бывает корреляция
Выделяют прямую и обратную корреляцию. Если графики цены очень похожи по своей конфигурации, то эту взаимосвязь называют прямой. Если же графики цены похожи, но в зеркальном отражении, имеет место обратная корреляция.
Процент схожести графиков может быть 100 % или ниже. Чем больше похожи конфигурации цен, тем выше процент корреляции.
Примеры корреляции на финансовых рынках
Корреляция финансовых инструментов существует как на фондовых биржах, так и на рынке валют, сырья и даже криптовалют.
Акции компаний, принадлежащих к одной отрасли экономики, могут коррелировать между собой. Если речь идет о компаниях, которые работают в сырьевом секторе, например, нефтедобывающем, то котировки их акций будут коррелировать еще и с ценами на нефть.
Есть валюты, которые также зависят от цен на сырье. Например, развивающиеся экономики таких стран, как Россия и Канада, находятся во взаимосвязи с изменениями нефтяных цен. Обвал на рынке нефти приводит к падению канадского доллара и российского рубля.
А вот новозеландский доллар частично зависит от изменения стоимости молока, тогда как австралийский — от динамики цен на железную руду и золото.
Как узнать о корреляции финансовых активов
Есть формулы, согласно которым можно рассчитать коэффициент корреляции. А можно сделать расчет автоматически, воспользовавшись программой Excel.
Для этого надо выполнить несколько действий:
1. Импортировать значения цен активов, которые необходимо проанализировать, в таблицу Excel.
3. Убедиться, что эти данные относятся к одинаковым таймфреймам.
4. Применить функцию «КОРРЕЛ» к одному и второму массиву данных. Котировки первого инструмента принимаются как массив 1, а второго — как массив 2.
5. Нажать кнопку «Ок» и получить данные коэффициента корреляции.
Где и как применять корреляцию при торговле
1. Зная о корреляции, можно на основе анализа одного инструмента сделать вывод о динамике цены коррелирующего с ним. Например, вам известно, что ФРС США будет снижать процентные ставки, значит, доллар начнет падать в цене. Следовательно, золото, которое торгуется с ним в обратной корреляции, будет расти.
3. Если вы знаете о корреляции валютных пар, формирование сигнала на одной из них даст сигнал о поведении другой. Например, преодоление ключевого уровня и закрепление цены выше него по одной паре может говорить о том, что начавшийся пробой на другой паре также окажется истинным.
4. Корреляцию можно применять для хеджирования рисков в инвестиционных портфелях. Так, например, вы формируете инвестпортфель из коррелирующих между собой акций. В случае, если ваш прогноз не подтвердится, вы получите убыток по всем инструментам. Но если включить в портфель сделку по активу с обратной корреляцией, прибыль по ней перекроет убыток при неблагоприятном сценарии.
6. Знания о корреляции помогает при хеджировании торговых позиций. На валютном рынке сделки по долларовым парам можно хеджировать позициями по золоту. Это можно сделать в рамках краткосрочного торгового портфеля для сокращения потерь. Например, торговлю доллара в парах EUR/USD, GBP/USD и AUD/USD можно хеджировать отложенным ордером на покупку золота.
Как заработать на корреляции вы можете узнать из этого видео
Открыть торговый счет и начать зарабатывать на финансовых рынках прямо сейчас
Песков объяснил изменение отношения Путина к Зеленскому: Политика: Россия: Lenta.ru
Действия украинского президента Владимира Зеленского не коррелируют с его первыми декларациями. Так пресс-секретарь президента России Дмитрий Песков в интервью программе «Москва. Кремль. Путин» на канале «Россия 1» объяснил изменение отношения главы государства Владимира Путина к украинскому лидеру. Его слова приводит «Интерфакс».
В Кремле согласились с тем, что у президента России со временем изменилось отношение к президенту Украины. «Вы говорили, что не так с Украиной, что, кстати, наверное, затрудняет воплощение идеи о двусторонней встрече. Помимо вот этого основного момента о невыполнении Минских договоренностей, еще, наверное, и тот факт, что президент Зеленский с самого начала выглядел как очень современный демократичный президент, который несет порядок и демократию в свою страну. И, конечно, вот этот настрой, он явно не коррелируется с абсолютно беспрецедентным давлением на политических оппонентов, желанием избавиться от своих успешных политических оппонентов путем открытия уголовного дела», — сказал Песков.
Пресс-секретарь главы государства повторил, что «это не коррелируется с декларациями, которые мы слышали в самом начале президентского срока [Зеленского]». Он подчеркнул, что причиной разочарования президента России стали не высказывания украинского лидера, а нежелание Украины выполнять Минские договоренности. Песков также отметил, что Москву не очень волнует риторика Киева, называющего Россию страной-агрессором.
30 июня президент России в ходе прямой линии ответил на вопрос о возможности встречи с украинским коллегой. По словам Путина, украинский президент отдал свою страну «под полное внешнее управление». «Ключевые вопросы Украины решаются не в Киеве, а в Берлине и Вашингтоне», — сказал он. Российский лидер добавил, что не отказывается от встречи, однако «нужно понять, о чем говорить».
Быстрая доставка новостей — в «Ленте дня» в Telegram
Как настроение Илона Маска влияет на криптовалюту
Великий комбинатор Илон Маск в очередной раз пошатнул курс биткоина после заявления о том, что продукцию компании Tesla больше нельзя будет купить за криптовалюту. По мнению Маска, на майнинг крипты уходит слишком много электроэнергии, что вредит окружающей среде. Сразу после этих новостей биткоин упал больше чем на 10 %.
Стоит отметить, что это довольно неожиданное решение, потому что буквально в конце марта Маск торжественно объявил, что теперь его электрокары будут продаваться за биткоины. В связи с этим у некоторых людей закономерно возник вопрос – а не спекулирует ли господин Маск на криптовалюте, напрямую влияя на ее скачки своими резкими заявлениями.
Пожалуй, эта теория больше подходит конспирологам, но факт остается фактом – Маск, подобно могущественной сущности, способен обрушить или поднять курс самых дорогих активов на рынке. Давайте же посмотрим, как это у него получалось в прошлые разы.
Криптовалютные маневры Маска
В феврале этого года компания Tesla инвестировала в биткоин целых 1,5 миллиарда долларов. Сразу после этого стоимость криптовалюты подросла на 14 %, а ее держатели слезно благодарили Маска за столь широкий жест.
Но, как показала практика предыдущих маневров, для манипуляции курсом биткоина достаточно разместить в своем твиттер-аккаунте соответствующий хештег – #bitcoin, и его цена резко подорожает на 15 % (так сделал Маск 29 января этого года). Тогда бизнесмену понравился эффект раздутого пузыря, и он решил не останавливаться.
Буквально через несколько дней Маск взялся за Dogecoin (конкурент биткоина). Он опубликовал в твиттере мем, в основе которого лежал кадр из мультика «Король Лев», где обезьяна-шаман Рафики держит на руках маленького Симбу. Только вместо Рафики было прифотошоплено лицо Маска, а вместо Симбы – лого Dogecoin. Так цена крипты подскочила на целых 58 %.
Через некоторое время Маск вновь вернулся к Doge, спровоцировав рост валюты. Он написал в твиттере, что купил ее своему младшему сыну, которому уже пора становиться инвестором. Однако радость вкладчиков длилась недолго, потому что буквально через неделю Маск обвалил курс Doge очередным твитом.
Он заявил, что поддержал бы владельцев криптовалюты, если они захотели бы ее продать. Это привело к падению Doge на 14 %.
Впоследствии Маск говорил о том, что цены на главные криптовалюты (биткоин и эфириум) завышены. Это тоже привело к скачкам на бирже и удачному моменту для спекуляции трейдеров.
Глядя на все эти события, в публичное пространство зашел Билл Гейтс и предостерег людей от рыночных манипуляций. Он заявил, что если у «вас меньше денег, чем у Илона Маска», лучше не играйте в эту игру. Однако еще больше действия Маска взволновали инвесторов Tesla, которые хотели бы ограничить его твиттер-активность, влияющую самым непредсказуемым образом на финансовые показатели их активов.
Вдохновленный Илон Маск
© Getty Images
Но Маск не собирался притормаживать. Через некоторое время он пришел на Saturday Night Live и сказал, что Dogecoin «захватит мир». Удивительно, но после его высказывания крипта не взлетела, а, наоборот, упала на 48 %. В этом же эфире он сообщил, что у него синдром Аспергера, из-за которого он испытывает трудности при социальном взаимодействии. Возможно, это заявление и повлияло на падение крипты.
Разбираться в манипуляциях Маска можно бесконечно, но ясно совершенно одно – их результаты такие же непредсказуемые, как гром среди ясного неба. Из-за активности бизнесмена криптовалюты стали его заложниками и теперь напрямую зависят от его настроения.
Возможно, про Аспергера он пошутил, но с этим парнем и его маневрами нам точно надо быть поосторожнее.
Размер мозга коррелирует с общительностью • Александр Марков • Новости науки на «Элементах» • Нейробиология, Психология
Быстрое увеличение мозга в эволюции гоминид предположительно было связано с развитием «социального интеллекта», то есть умственных способностей, направленных на понимание поступков и мотивов соплеменников и эффективное взаимодействие с ними. Венгерские нейробиологи показали, что эта теория приложима и к индивидуальным различиям в размере мозга у современных людей. Оказалось, что социабельность человека положительно коррелирует с размером лобных и височных долей, неокортекса и всего конечного мозга.
Согласно гипотезе «социального интеллекта» (Social Intelligence Hypothesis), или «макиавеллиевского интеллекта» (R. W. Byrne. Machiavellian Intelligence, PDF, 1,2 Мб), увеличение мозга в эволюции приматов вообще и гоминид в частности было неразрывно связано с общественным образом жизни. У приматов между особями в группе формируются сложные взаимоотношения и «личные связи», которые у других животных, как правило, бывают только между матерью и детенышами, реже (у моногамных видов) — между брачными партнерами. Для поддержания этих отношений общественному примату необходимо понимать поступки и мотивы соплеменников, а это крайне сложная и «ресурсоемкая» вычислительная задача. Ведь соплеменники, чье поведение нужно научиться моделировать у себя в голове, сами являются высокоорганизованными приматами со сложным поведением, предки которых тоже находились под действием отбора на «социальный интеллект».
Если статус и репродуктивный успех особей в группе начинает зависеть от их социального интеллекта, это может породить положительную обратную связь («эволюционную гонку вооружений»), что ведет к ускоренному увеличению мозга в череде поколений (см.: Найдено ключевое различие между человеческим и обезьяньим интеллектом, «Элементы», 13.09.2007). Теория социального интеллекта подтверждается положительными корреляциями между размером мозга (или неокортекса) у приматов (а в ряде случаев также у хищных и копытных) с различными показателями сложности общественных отношений (размер группы, частота образования «коалиций» внутри группы, частота случаев социального обучения, наличие устойчивых семейных пар и т. д.).
Исходя из этого, логично предположить, что у современных людей размер мозга тоже может коррелировать с социально-ориентированными умственными способностями. Это не обязательно должно быть так — в частности потому, что рост среднего объема мозга у Homo sapiens давно прекратился, и даже, по некоторым данным, в последние 10–40 тысяч лет наметилась тенденция к его уменьшению. Это значит, что если на наших предков раньше и действовал «макиавеллиевский» фактор, сейчас его действие то ли прекратилось, то ли уравновесилось другими факторами, направленными в обратную сторону. Тем не менее обнаружение подобной корреляции стало бы весомым аргументом в пользу гипотезы макиавеллиевского интеллекта.
Для проверки этого предположения венгерские психологи и нейробиологи решили сопоставить размеры разных отделов мозга с такой психологической чертой, как социабельность (общительность). Для этой характеристики существуют стандартные, многократно испытанные тесты, а ее осмысленность и информативность подтверждена факторным анализом и другими сложными математическими методами. Здесь необходимо пояснить, что дискуссия о выборе универсальной системы координат для анализа индивидуальных психических различий давно уже ведется психологами не на уровне общих рассуждений, а на основе весьма изощренной математики. По итогам многолетних исследований наибольшую поддержку получила пятифакторная модель — так называемая «большая пятерка» (Big Five). В неё входят следующие пять базовых психологических характеристик или «измерений»: экстраверсия, доброжелательность, добросовестность, невротизм и открытость опыту. Следует помнить, что это не более чем условные названия достаточно строго определенных комплексных характеристик. Общеупотребительные значения этих слов лишь приблизительно отражают смысл пяти измерений «большой пятерки». Параллельно существует ряд альтернативных моделей, тоже достаточно хорошо обоснованных, но, по-видимому, приложимых к менее широкому кругу исследовательских задач.
Ранее уже были предприняты безуспешные попытки найти корреляцию между размером мозга и экстраверсией — характеристикой, которая, с одной стороны, входит в состав большой пятерки, с другой — отчасти отражает «социальный интеллект». Однако в состав экстраверсии входят и параметры, не имеющие к социальному интеллекту никакого отношения.
Поэтому авторы решили использовать другую комплексную психологическую характеристику — социабельность, которая не входит в большую пятерку, но зато входит в другую, тоже вполне респектабельную модель — «альтернативную пятерку Цукермана» (Zuckerman, 2002). Считается, что модель Цукермана более «биологична» и в большей степени ориентирована на задачи психогенетики и эволюционной психологии. Забегая вперед, заметим, что результаты обсуждаемой работы подтверждают это мнение. В состав «социабельности» входят такие показатели, как количество друзей, время, проводимое с ними, частота «выходов в свет», участие в коллективных затеях, непереносимость социальной изоляции.
В исследовании приняли участие 25 добровольцев (7 женщин, 18 мужчин). Социабельность оценивали при помощи стандартного опросника, размеры отделов мозга — при помощи магнитно-резонансной томографии и стандартного программного обеспечения, разработанного для этой задачи. По отдельности оценивался объем конечного мозга, неокортекса, левой и правой лобной и височной долей (потому что именно в них находятся основные центры, связанные с социальным интеллектом). В ходе статистической обработки данных использовались поправки на рост и возраст, а также другие, более сложные, процедуры, предназначенные для оценки достоверности результатов.
Оказалось, что социабельность положительно коррелирует с объемом всех перечисленных отделов мозга. Корреляция с объемом лобных долей оказалась несколько менее четкой, чем с объемом височных долей, неокортекса и всего конечного мозга. При раздельном рассмотрении мужчин и женщин положительные корреляции сохраняются, но перестают быть статистически значимыми — скорее всего, из-за маленького размера выборки.
Полученные результаты можно рассматривать как дополнительное подтверждение гипотезы социального интеллекта, согласно которой сложные социальные отношения были важным стимулом увеличения мозга в эволюции наших предков.
Сами авторы рассматривают свое исследование как «пилотное». Основная его слабость — в малом числе участников. Полученные результаты необходимо перепроверить на других выборках. Кроме того, исследование не дает ответа на вопрос о причинах и следствиях. Теоретически, здесь возможны три варианта: 1) большой мозг является причиной повышенной общительности; 2) общительные люди активнее тренируют социально-ориентированные мозговые центры, что ведет к увеличению мозга; 3) какой-то третий фактор схожим образом влияет и на социабельность, и на объем мозга. Эти варианты не являются взаимоисключающими: возможны любые переходы и комбинации. Будем надеяться, что новые исследования прояснят этот вопрос.
Главная ценность работы венгерских ученых состоит в том, что она дает эволюционным психологам, разрабатывающим теорию социального интеллекта, ценную «наводку»: они могут теперь оставить тщетные попытки увязать анатомию мозга (и отдельных его частей) с экстраверсией и заняться социабельностью — показателем, который, по-видимому, лучше подходит для решения этой задачи.
Источник: Klára Horváth, János Martos, Béla Mihalik, Róbert Bódizs. Is the social brain theory applicable to human individual differences? Relationship between sociability personality dimension and brain size (PDF, 352 Кб) // Evolutionary psychology. 2011. V. 9. P. 244–256.
См. также:
Найдено ключевое различие между человеческим и обезьяньим интеллектом, «Элементы», 13.09.2007.
Александр Марков
Определение коррелята по Merriam-Webster
корр. | \ ˈKȯr-ə-lət , ˈKär-, -ˌlāt \ 1 : либо из двух вещей, так связанных, что одно прямо подразумевает или дополняет другое (например, муж и жена) размер мозга как коррелят интеллекта2 : явление, которое сопровождает другое явление, обычно параллельно ему и каким-то образом связано с ним. … Точные электрические корреляты сознательного мышления в человеческом мозгу… — Баярд Вебстер
корр. | \ ˈKȯr-ə-ˌlāt , ˈKär- \переходный глагол
1а : для установления взаимной или взаимной связи между соотносить деятельность в лаборатории и поле б : , чтобы показать корреляцию или причинно-следственную связь между Нет никаких свидетельств того, что коррелирует ростом и интеллектом.2 : представить или изложить так, чтобы показать взаимосвязь Он соотносит открытия ученых, психологов и мистиков. — Юджин Эксман.
корреляция | Введение в статистику
Что такое корреляция?
Корреляция — это статистическая мера, которая выражает степень, в которой две переменные линейно связаны (что означает, что они изменяются вместе с постоянной скоростью).Это распространенный инструмент для описания простых отношений без объяснения причин и следствий.
Как измеряется корреляция?
Коэффициент корреляции выборки, r , количественно определяет силу взаимосвязи. Корреляции также проверяются на статистическую значимость.
Какие ограничения у корреляционного анализа?
Корреляция не может смотреть на присутствие или влияние других переменных за пределами двух исследуемых.Важно отметить, что корреляция не говорит нам о причине и следствии. Корреляция также не может точно описать криволинейные отношения.
Корреляции описывают перемещение данных вместе
Корреляции полезны для описания простых отношений между данными. Например, представьте, что вы просматриваете набор данных о кемпингах в горном парке. Вы хотите знать, существует ли связь между высотой кемпинга (насколько высоко он находится в горах) и средней высокой температурой летом.
Для каждого отдельного кемпинга у вас есть два показателя: высота над уровнем моря и температура. Когда вы сравниваете эти две переменные в вашем образце с корреляцией, вы можете найти линейную зависимость: по мере увеличения высоты температура падает. Они отрицательно коррелируют с .
Что означают числа корреляции?
Мы описываем корреляции с помощью безразмерной меры, называемой коэффициентом корреляции, который находится в диапазоне от -1 до +1 и обозначается r .Статистическая значимость обозначается р-значением. Поэтому корреляции обычно записываются с двумя ключевыми числами: r = и p = .
- Чем ближе r к нулю, тем слабее линейная зависимость.
- Положительные значения r указывают на положительную корреляцию, при которой значения обеих переменных имеют тенденцию увеличиваться вместе.
- Отрицательные значения r указывают на отрицательную корреляцию, когда значения одной переменной имеют тенденцию увеличиваться, когда значения другой переменной уменьшаются.
- Значение p свидетельствует о том, что мы можем сделать осмысленный вывод о том, что коэффициент корреляции населения, вероятно, отличен от нуля, на основании того, что мы наблюдаем в выборке.
- «Измерение без единиц измерения» означает, что корреляции существуют по собственной шкале: в нашем примере число, указанное для r , не находится в той же шкале, что и высота над уровнем моря или температура. Это отличается от другой сводной статистики. Например, среднее значение измерений высоты находится в том же масштабе, что и его переменная.
Как только мы получим значительную корреляцию, мы можем также посмотреть на ее силу. Идеальная положительная корреляция имеет значение 1, а идеальная отрицательная корреляция имеет значение -1. Но в реальном мире мы никогда не ожидаем увидеть идеальную корреляцию, если одна переменная на самом деле не является косвенной мерой для другой. Фактически, наблюдение за идеальным числом корреляции может предупредить вас об ошибке в ваших данных! Например, если вы случайно записали расстояние от уровня моря для каждого кемпинга вместо температуры, это будет идеально коррелировать с высотой.
Еще одна полезная информация — это N или количество наблюдений. Как и в случае с большинством статистических тестов, знание размера выборки помогает нам судить о силе нашей выборки и о том, насколько хорошо она представляет совокупность. Например, если мы измерили высоту и температуру только для пяти кемпингов, но в парке есть две тысячи кемпингов, мы бы хотели добавить в нашу выборку больше кемпингов.
Визуализация корреляций с помощью диаграмм рассеяния
Вернемся к нашему примеру сверху: по мере увеличения высоты лагеря температура падает.Мы можем посмотреть на это непосредственно с помощью диаграммы рассеяния. Представьте, что мы нанесли данные о нашем кемпинге:
.- Каждая точка на графике представляет один кемпинг, который мы можем разместить на осях x и y по высоте и высокой температуре в летнее время.
- Коэффициент корреляции ( r ) также иллюстрирует нашу диаграмму рассеяния. Это говорит нам в числовом выражении, насколько близко точки, отображенные на диаграмме рассеяния, подходят к линейной зависимости. Более сильные отношения или большие значения r означают отношения, в которых точки находятся очень близко к линии, которая соответствует данным.
А как насчет более сложных отношений?
Диаграммы рассеяниятакже полезны для определения того, есть ли в наших данных что-либо, что может нарушить точную корреляцию, например необычные закономерности, такие как криволинейная связь или экстремальный выброс.
Корреляции не могут точно определить криволинейные отношения. В криволинейной взаимосвязи переменные коррелируют в заданном направлении до определенной точки, где взаимосвязь изменяется.
Например, представьте, что мы смотрели на высоту нашего кемпинга и на то, насколько высоко отдыхающие в среднем оценивают каждый кемпинг.Возможно, поначалу высота и рейтинг кемпинга положительно коррелируют, потому что с кемпингов выше открывается лучший вид на парк. Но в какой-то момент более высокие высоты начинают отрицательно коррелировать с рейтингом кемпинга, потому что отдыхающим ночью холодно!
Мы можем получить еще больше информации, добавив закрашенные эллипсы плотности на нашу диаграмму рассеяния. Эллипс плотности показывает наиболее плотную область точек на диаграмме рассеяния, что, в свою очередь, помогает нам увидеть силу и направление корреляции.
Эллипсы плотности могут быть разных размеров. Один из распространенных вариантов для изучения корреляции — это эллипс плотности 95%, который захватывает приблизительно 95% самых плотных наблюдений. Если две переменные движутся вместе, например, высота и температура наших лагерей, мы ожидаем увидеть, что этот эллипс плотности отражает форму линии. И мы можем видеть, что в криволинейной зависимости эллипс плотности выглядит кругом: корреляция не дает нам содержательного описания этой связи.
Статистический язык — корреляция и причинно-следственная связь
Корреляция и причинно-следственная связь
Что такое корреляция и причинно-следственная связь и чем они отличаются?
Две или более переменных считаются связанными в статистическом контексте, если их значения изменяются так, что по мере увеличения или уменьшения значения одной переменной изменяется и значение другой переменной (хотя это может быть в противоположном направлении).
Например, для двух переменных «отработанные часы» и «полученный доход» существует связь между ними, если увеличение количества отработанных часов связано с увеличением заработанного дохода.Если мы рассмотрим две переменные «цена» и «покупательная способность», то по мере увеличения цены на товары способность человека покупать эти товары уменьшается (при условии постоянного дохода).
Корреляция — это статистическая мера (выраженная в виде числа), которая описывает размер и направление взаимосвязи между двумя или более переменными. Однако корреляция между переменными не означает автоматически, что изменение одной переменной является причиной изменения значений другой переменной.
Причинная связь указывает, что одно событие является результатом возникновения другого события; то есть между двумя событиями существует причинно-следственная связь. Это также называется причиной и следствием.
Теоретически разницу между двумя типами отношений легко идентифицировать — действие или событие может вызвать другое (например, курение вызывает увеличение риска развития рака легких), или оно может коррелировать с другим ( например, курение связано с алкоголизмом, но не вызывает алкоголизма).Однако на практике по-прежнему сложно четко установить причину и следствие по сравнению с установлением корреляции.
Почему важны корреляция и причинно-следственная связь?
Целью многих исследований или научного анализа является определение степени связи одной переменной с другой. Например:
- Есть ли связь между уровнем образования человека и его здоровьем?
- Связано ли владение домашним животным с увеличением продолжительности жизни?
- Увеличила ли маркетинговая кампания компании объем продаж ее продукции?
Эти и другие вопросы исследуют, существует ли корреляция между двумя переменными, и если есть корреляция, то это может направить дальнейшие исследования для выяснения того, вызывает ли одно действие другое.Понимая корреляцию и причинно-следственную связь, он позволяет более целенаправленно проводить политику и программы, направленные на достижение желаемого результата.
Как измеряется корреляция?
Для двух переменных статистическая корреляция измеряется с помощью коэффициента корреляции, представленного символом (r), который представляет собой одно число, которое описывает степень взаимосвязи между двумя переменными.
Числовое значение коэффициента находится в диапазоне от +1,0 до –1,0, что указывает на силу и направление взаимосвязи.
Если коэффициент корреляции имеет отрицательное значение (ниже 0), это указывает на отрицательную взаимосвязь между переменными. Это означает, что переменные движутся в противоположных направлениях (то есть, когда одна увеличивается, другая уменьшается, или когда одна уменьшается, другая увеличивается).
Если коэффициент корреляции имеет положительное значение (выше 0), это указывает на положительную взаимосвязь между переменными, означающую, что обе переменные движутся в тандеме, то есть, когда одна переменная уменьшается, другая также уменьшается, или когда одна переменная увеличивается, другая также увеличивается.
Если коэффициент корреляции равен 0, это указывает на отсутствие связи между переменными (одна переменная может оставаться постоянной, в то время как другая увеличивается или уменьшается).
Хотя коэффициент корреляции является полезным показателем, у него есть свои ограничения:
Коэффициенты корреляции обычно связаны с измерением линейной зависимости.
Например, если вы сравниваете отработанные часы и доход, полученный торговцем, который взимает почасовую оплату за свою работу, существует линейная (или прямая) зависимость, поскольку с каждым дополнительным отработанным часом доход будет увеличиваться на постоянную величину.
Если, однако, торговец взимает плату на основе первоначальной платы за вызов и почасовой оплаты, которая постепенно уменьшается с увеличением продолжительности работы, связь между отработанными часами и доходом будет нелинейной, и коэффициент корреляции может быть более близким. на 0.
Следует проявлять осторожность при интерпретации значения ‘r’. Можно найти корреляции между многими переменными, однако эти отношения могут быть обусловлены другими факторами и не имеют ничего общего с двумя рассматриваемыми переменными.
Например, продажи мороженого и солнцезащитных кремов могут увеличиваться и уменьшаться в течение года систематическим образом, но это будет взаимосвязь, которая будет зависеть от сезона (т. Е. Более жаркая погода приводит к увеличению количества людей использовать солнцезащитный крем, а также есть мороженое), а не из-за какой-либо прямой связи между продажами солнцезащитного крема и мороженого.
Коэффициент корреляции не должен использоваться, чтобы ничего сказать о причинно-следственной связи. Изучая значение «r», мы можем заключить, что две переменные связаны, но это значение «r» не говорит нам, была ли одна переменная причиной изменения другой.
Как установить причинно-следственную связь?
Причинность — это область статистики, которую обычно неправильно понимают и неправильно используют люди, ошибочно полагая, что, поскольку данные показывают корреляцию, обязательно существует лежащая в основе причинная связь
Использование контролируемого исследования является наиболее эффективным способом установления причинно-следственная связь между переменными. В контролируемом исследовании выборка или популяция делятся на две части, причем обе группы сопоставимы почти во всех отношениях.Затем две группы получают разное лечение, и оцениваются результаты каждой группы.
Например, в медицинских исследованиях одна группа может получать плацебо, а другая группа — новый тип лекарства. Если две группы имеют заметно разные результаты, разный опыт мог вызвать разные результаты.
По этическим причинам существуют ограничения на использование контролируемых исследований; было бы нецелесообразно использовать две сопоставимые группы и допускать, чтобы одна из них подвергалась вредной деятельности, а другая — нет.Чтобы преодолеть эту ситуацию, часто используются обсервационные исследования для изучения корреляции и причинно-следственной связи для исследуемой популяции. В исследованиях можно изучить поведение и результаты групп, а также увидеть любые изменения с течением времени.
Целью этих исследований является предоставление статистической информации для добавления к другим источникам информации, которая может потребоваться для процесса установления наличия или отсутствия причинно-следственной связи между двумя переменными.
Вернуться на главную страницу статистического языка
Дополнительная информация
ABS:
1500.0 — Руководство по использованию статистики для разработки политики, основанной на фактах
Срочно необходим коррелят защиты для вакцин против SARS-CoV-2
Недавние исследования показывают, что нейтрализующие антитела могут служить коррелятом защиты вакцин против SARS-CoV-2 у людей.
Адаптивные гуморальные и клеточные иммунные ответы на инфекцию обычно специфичны для патогена и защищают от повторного заражения в будущем.В вакцинах наука нашла способ, позволяющий людям приобретать эти защитные иммунные ответы без первоначальной инфекции. Иммунные ответы, индуцированные вакциной, часто многогранны, но отдельные компоненты, такие как ответы антител, могут коррелировать с уровнем защиты. Фактически, большинство принятых в настоящее время коррелятов защиты основано на измерениях антител 1,2 . Во многих случаях они могут быть не единственным коррелятом защиты, но их часто намного легче измерить, чем клеточные реакции, и поэтому они более полезны с клинической точки зрения.Примечательно, что корреляты могут различаться в зависимости от используемой конечной точки, такой как защита от инфекции, от болезни, от тяжелой болезни или от смертности. Два исследования Khoury et al. 3 (опубликовано в этом выпуске журнала Nature Medicine ) и Earle et al. 4 , теперь связывают ответы нейтрализующих антител на SARS-CoV-2 с эффективностью вакцины и приближают исследователей и клиницистов к корреляции защиты вакцин от COVID-19.
Фото: Андрей Водолажский / Alamy Stock Photo
Чтобы поместить эти исследования в контекст, важно сначала понять, почему срочно необходимы коррелят защиты, а точнее, «абсолютный коррелят» (то есть защитный порог) 2 .Во-первых, необходимо больше вакцин для глобальной защиты от SARS-CoV-2, особенно в странах с низким и средним уровнем доходов. Лицензированные в настоящее время вакцины не могут производиться в достаточно больших количествах, чтобы своевременно удовлетворить эту потребность; следовательно, необходимо лицензировать больше вакцин. Многие кандидаты находятся на продвинутой стадии клинической разработки, но проведение исследований эффективности фазы 3 затруднительно по этическим причинам (необходимость в исследованиях не меньшей эффективности с использованием компаратора стандарта медицинской помощи вместо плацебо) и из-за уменьшения количество случаев (что означает, что испытания могут занять больше времени или могут потребовать большего количества участников).Многие вакцины-кандидаты, которые все еще находятся в стадии разработки, разрабатываются небольшими компаниями или производителями в странах с низким и средним уровнем доходов, которые могут оказаться не в состоянии провести крупные испытания фазы 3, необходимые для получения лицензии на их продукты. Наличие корреляции защиты, позволяющей лицензирование на основе результатов иммунного считывания, позволило бы обойти эти проблемы и, несомненно, повысило бы доступность вакцины.
Многие люди с ослабленной иммунной системой, в том числе пациенты с трансплантатами, пациенты с онкологическими заболеваниями и люди, принимающие иммунодепрессанты, не проявляют сильного ответа на вакцины, в том числе против SARS-CoV-2 5,6,7,8 .В настоящее время в сообщениях регулирующих органов говорится, что «тесты на антитела не должны использоваться для оценки уровня иммунитета или защиты человека от COVID-19». 9 Если после вакцинации нет определяемого ответа антител, вакцины могут по-прежнему обеспечивать защиту посредством клеточного иммунитета. Хотя в некоторых случаях это может быть правдой, клеточные иммунные ответы и ответы антител часто в некоторой степени коррелируют 10 . Механически индукция сильных ответов антител зависит от ответов Т-лимфоцитов CD4 + , и есть предварительные сообщения о лицах с ослабленным иммунитетом, которые не проявили антительный ответ на вакцинацию против SARS-CoV-2 и впоследствии скончались от инфекции 5 .Наличие установленного корреляции защиты позволило бы поставщикам медицинских услуг более эффективно управлять вакцинацией лиц с ослабленным иммунитетом, например, рекомендуя ревакцинацию, если титры антител слишком низкие, или рекомендуя нефармацевтические вмешательства для защиты, если иммунный ответ не обнаружен.
Наличие корреляции защиты также позволило бы органам здравоохранения и руководящим органам эффективно определять, какой процент населения защищен. Несмотря на то, что распространенность серотипов в настоящее время используется как грубая мера иммунитета сообщества, наличие корреляции защиты позволило бы более точные оценки, которые затем могли бы инициировать такие вмешательства, как кампании вакцинации, если процент иммунных индивидов окажется слишком низким.
Исследования Khoury et al. 3 и Earle et al. 4 сделать первый и важный шаг на пути к соответствующему уровню защиты. Авторы использовали данные опубликованных клинических исследований нескольких вакцин против SARS-CoV-2 и оценили взаимосвязь между эффективностью и титрами нейтрализующих антител. Это было непросто, потому что анализы нейтрализации сильно различались в исследованиях, проанализированных обеими группами, а международный стандарт для облегчения прямого перекрестного сравнения не был доступен до конца 2020 года (см. 11 ). Однако во многих исследованиях использовались панели сыворотки выздоравливающих в качестве средства сравнения для титров антител, индуцированных вакциной, поэтому авторы нормализовали титры нейтрализации вакцинированных к титрам выздоравливающих людей. Несмотря на свои ограничения, этот подход позволил провести прямое сравнение исследований «нормализованных» титров нейтрализации. Результаты обеих команд показали значительную корреляцию между эффективностью вакцины и индуцированной вакциной активностью нейтрализующих антител.Даже титры связывающих антител (например, измеренные с помощью иммуноферментных анализов, которые намного проще выполнять в больших масштабах, чем анализы нейтрализации), по-видимому, хорошо коррелируют с эффективностью 4 . Эти данные предполагают, что антитела могут обеспечивать коррелят защиты, что подтверждается исследованиями на животных 12 и когортами естественной инфекции 13 .
Опора на соответствующий тип защиты — хотя и чрезвычайно полезна во многих отношениях — также сопряжена с определенными рисками.Хотя некоторые корреляты могут быть немеханистическими 1 , что означает иммунный маркер, который указывает на защиту, но не вызывает ее, антитела часто являются механистическими коррелятами 1 защиты, особенно если они способны нейтрализовать рассматриваемый патоген. Корреляты могут быть специфичными для платформы вакцины или даже специфичными для вакцины. Некоторые вакцины могут обладать высокой защитой, но могут не индуцировать тип иммунитета, установленный как коррелят, и, наоборот, вакцина может вызывать иммунный ответ, используемый как коррелят, но все же не может обеспечивать защиту, особенно когда немеханистический коррелят защиты является использовал.Тем не менее, надежные доклинические и клинические исследования делают эти сценарии маловероятными; Разработчики вакцин понимают тип иммунитета, который вызывают их вакцины, и эксперименты на животных 12 (и терапевтические препараты с моноклональными антителами у людей) показывают, что антитела действительно участвуют в защите (и поэтому, вероятно, являются механистическим коррелятом защиты) 10 .
Более надежный порог защиты, основанный на данных отдельных людей вместо объединенных данных об эффективности, может быть получен на основе передовых случаев в исследованиях фазы 3 и наблюдательных исследованиях.Следовательно, быстрый обмен данными и сотрудничество для установления абсолютного соотношения защиты должны быть приоритетом номер один для производителей вакцин, научных исследователей и регулирующих органов. Хотя маловероятно, что такие усилия приведут к безупречной абсолютной корреляции, которая может быть применена ко всем кандидатам вакцин, всем вирусным вариантам и всем группам пациентов, это, безусловно, было бы чрезвычайно полезно для ускорения лицензирования большего количества вакцин, руководства лечением пациентов и информирование о решениях общественного здравоохранения.
Ссылки
- 1.
Plotkin, S. A. & Gilbert, P. B. Clin. Заразить. Дис. 54 , 1615–1617 (2012).
Артикул Google ученый
- 2.
Плоткин, С.А. Клин. Вакцина Иммунол. 17 , 1055–1065 (2010).
CAS Статья Google ученый
- 3.
Хури, Д.S. et al. Нат. Мед . https://doi.org/10.1038/s41591-021-01377-8 (2021 г.).
- 4.
Earle, K.A., et al. Вакцина https://doi.org/10.1016/j.vaccine.2021.05.063 (2021 г.).
- 5.
Алеман, А. и др .. Препринт на сайте medRxiv https://doi.org/10.1101/2021.05.15.21256814 (2021).
- 6.
Боярский, Б. Дж. И др. J. Am. Med. Доц. 325 , 1784–1786 (2021).
CAS Статья Google ученый
- 7.
Ага, М., Блейк, М., Чиллео, К., Уэллс, А. и Хайдар, Г. Препринт на medRxiv https://doi.org/10.1101/2021.04.06.21254949 (2021).
- 8.
Deepak, P., et al. Препринт: medRxiv https://doi.org/10.1101/2021.04.05.21254656 (2021 г.).
- 9.
Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США. https://www.fda.gov/medical-devices/safety-communications/antibody-testing-not-currently-recommended-assess-immunity-after-covid-19-vaccination-fda-safety (2021 г.).
- 10.
Grifoni, A. et al. Ячейка 181 , 1489–1501.e1415 (2020).
CAS Статья Google ученый
- 11.
Kristiansen, P.A. et al. Ланцет 397 , 1347–1348 (2021).
CAS Статья Google ученый
- 12.
McMahan, K. et al. Nature 590 , 630–634 (2021).
CAS Статья Google ученый
- 13.
Krammer, F. Lancet 397 , 1421–1423 (2021).
CAS Статья Google ученый
Скачать ссылки
Благодарности
Работа над SARS-CoV-2 в лаборатории Краммера финансируется Центрами инновационных разработок совместных вакцин против гриппа NIAID (контракт 75N93019C00051), Центром передового опыта NIAID по исследованиям и надзору за гриппом14HS00008C27220 (контракт) при щедрой поддержке Фонда JPB и Open Philanthropy Project (исследовательский грант 2020-215611 (5384)), а также анонимных доноров.
Информация об авторе
Принадлежности
-
Отделение микробиологии Медицинской школы Икана на горе Синай, Нью-Йорк, Нью-Йорк, США
Флориан Краммер
-
Отделение патологии Медицинской школы Икана на горе Синай, штат Нью-Йорк Йорк, Нью-Йорк, США
Флориан Краммер
Автор, ответственный за переписку
Для корреспонденции Флориан Краммер.
Декларации этики
Конкурирующие интересы
Медицинская школа Икана на горе Синай подала заявки на патенты, относящиеся к серологическим тестам на SARS-CoV-2 и вакцины на основе вируса болезни Ньюкасла против SARS-CoV-2, в которых перечислены F.К. как соавтор. На горе Синай появилась компания Kantaro, которая занимается маркетингом серологических тестов на SARS-CoV-2. F.K. консультировал Merck и Pfizer (до 2020 года) и в настоящее время консультирует Pfizer, Seqirus и Avimex. Лаборатория Краммера также сотрудничает с Pfizer над моделями SARS-CoV-2 на животных.
Об этой статье
Цитируйте эту статью
Krammer, F. Срочно необходим коррелят защиты для вакцины против SARS-CoV-2. Nat Med 27, 1147–1148 (2021).https://doi.org/10.1038/s41591-021-01432-4
Ссылка для скачивания
Поделиться этой статьей
Все, с кем вы поделитесь следующей ссылкой, смогут прочитать это содержание:
Получить ссылкуИзвините, Ссылка для совместного использования в настоящее время недоступна для этой статьи.
Предоставлено инициативой по обмену контентом Springer Nature SharedIt
В чем разница между корреляцией и линейной регрессией? — FAQ 1141
При исследовании взаимосвязи между двумя или более числовыми переменными важно знать разницу между корреляцией и регрессией.Сходства / различия и преимущества / недостатки этих инструментов обсуждаются здесь вместе с примерами каждого из них.
Корреляция количественно определяет направление и силу взаимосвязи между двумя числовыми переменными, X и Y, и всегда находится между -1,0 и 1,0. Простая линейная регрессия связывает X с Y посредством уравнения вида Y = a + bX.
Ключевые сходства
- Оба показателя определяют направление и силу взаимосвязи между двумя числовыми переменными.
- Когда корреляция (r) отрицательная, наклон регрессии (b) будет отрицательным.
- Если корреляция положительная, наклон регрессии будет положительным.
- Квадрат корреляции (r2 или R2) имеет особое значение в простой линейной регрессии. Он представляет собой долю вариации Y, объясняемую X.
Ключевые отличия
- Регрессия пытается установить, как X вызывает изменение Y, и результаты анализа изменятся, если поменять местами X и Y.При корреляции переменные X и Y взаимозаменяемы.
- Регрессия предполагает, что X зафиксирован без ошибок, таких как количество дозы или установка температуры. При корреляции X и Y обычно являются случайными величинами *, такими как рост и вес или артериальное давление и частота сердечных сокращений.
- Корреляция — это отдельная статистика, тогда как регрессия дает целое уравнение.
Prism поможет вам сэкономить время и сделать более подходящий выбор анализа.Попробуйте Prism бесплатно.
* Переменная X может быть зафиксирована с помощью корреляции, но доверительные интервалы и статистические тесты больше не подходят. Обычно регрессия используется, когда X фиксирован.
Узнайте больше о корреляционном и регрессионном анализе из этого видео от 365 Data Science
Ключевые преимущества корреляции
-
Корреляция — это более краткое (однозначное) резюме взаимосвязи между двумя переменными, чем регрессия.В результате многие парные корреляции можно одновременно просматривать в одной таблице.
Ключевое преимущество регрессии
В качестве примера рассмотрим учебник Prism по корреляционной матрице, который содержит набор данных по автомобилям с переменными Стоимость в долларах США, MPG, лошадиные силы и вес в фунтах. Вместо того, чтобы просто смотреть на корреляцию между одним X и одним Y, мы можем сгенерировать все парные корреляции, используя корреляционную матрицу Prism.Если у вас нет доступа к Prism, загрузите бесплатную 30-дневную пробную версию здесь. Это шаги в Prism:
- Откройте призму и выберите «Несколько переменных» на левой боковой панели.
- Выберите «Начать с образца данных», чтобы следовать руководству, и выберите «Матрица корреляции».
- Щелкните «Создать».
- Щелкните «Анализировать».
- Выберите Анализ нескольких переменных> Корреляционная матрица.
- Дважды нажмите «ОК».
- На левой боковой панели дважды щелкните график под названием Pearson r: Correlation of Data 1.
Корреляционная матрица Prism отображает все попарные корреляции для этого набора переменных.
- Красные прямоугольники представляют переменные, имеющие отрицательную взаимосвязь.
- Синие прямоугольники представляют переменные, которые имеют положительную взаимосвязь
- Чем темнее поле, тем ближе корреляция к отрицательной или положительной 1.
- Игнорируйте синие диагональные прямоугольники, так как они всегда будут иметь корреляцию 1.00.
Основные выводы:
- Лошадиные силы и MPG имеют сильную отрицательную взаимосвязь (r = -0,74), автомобили с более высокой мощностью имеют более низкую MPG.
- Мощность и стоимость имеют сильную положительную взаимосвязь (r = 0,88), автомобили с более высокой мощностью стоят дороже.
Обратите внимание, что матрица симметрична. Например, корреляция между «весом в фунтах» и «стоимостью в долларах США» в нижнем левом углу (0,52) такая же, как корреляция между «стоимостью в долларах США» и «весом в фунтах» в правом верхнем углу (0 .52). Это подтверждает тот факт, что X и Y взаимозаменяемы в отношении корреляции. Корреляция по диагонали всегда будет 1,00, и переменная всегда идеально коррелирует сама с собой.
При интерпретации корреляций вы должны знать четыре возможных объяснения сильной корреляции:
- Изменения в переменной X вызывают изменение значения переменной Y.
- Изменения в переменной Y вызывают изменение значения переменной X.
- Изменения другой переменной влияют как на X, так и на Y.
- X и Y на самом деле вообще не коррелируют, и вы случайно наблюдали такую сильную корреляцию. Значение P определяет вероятность того, что это может произойти.
Сила УФ-лучей зависит от широты. Чем выше широта, тем меньше на солнце, что соответствует более низкому риску рака кожи. Таким образом, место вашего проживания может повлиять на риск рака кожи. Две переменные, уровень смертности от рака и широта, были введены в таблицу XY Prism.График с призмой (справа) показывает взаимосвязь между уровнем смертности от рака кожи (Y) и широтой в центре штата (X). Имеет смысл вычислить корреляцию между этими переменными, но, сделав еще один шаг, давайте проведем регрессионный анализ и получим прогнозное уравнение.
Взаимосвязь между X и Y резюмируется с помощью подобранной линии регрессии на графике с уравнением: коэффициент смертности = 389,2 — 5,98 * широта. Исходя из наклона -5.98, увеличение широты на 1 градус снижает смертность от рака кожи примерно на 6 на 10 миллионов человек.
Поскольку регрессионный анализ дает уравнение, в отличие от корреляции, его можно использовать для прогнозирования. Например, в городе на широте 40 ожидается 389,2 — 5,98 * 40 = 150 смертей на 10 миллионов из-за рака кожи каждый год. Регрессия также позволяет интерпретировать коэффициенты модели:
- Наклон: каждый градус широты снижает смертность на 5.98 смертей на 10 миллионов.
- Intercept: на 0 градусе широты (экваторе) модель прогнозирует 389,2 смертей на 10 миллионов. Хотя, поскольку в точке пересечения данных нет, это предсказание в значительной степени зависит от отношения, сохраняющего свою линейную форму до 0.
Улучшите свою линейную регрессию с помощью Prism. Начните бесплатную пробную версию сегодня.
Таким образом, корреляция и регрессия имеют много общего и некоторые важные различия.Регрессия в основном используется для построения моделей / уравнений для прогнозирования ключевого ответа Y на основе набора переменных-предикторов (X). Корреляция в основном используется для быстрого и лаконичного резюмирования направления и силы взаимосвязей между набором из 2 или более числовых переменных.
В таблице ниже приведены основные сходства и различия между корреляцией и регрессией.
Тема |
Корреляция |
Регрессия |
Когда использовать |
Для быстрого и простого обзора направления и силы парных отношений между двумя или более числовыми переменными. |
Предсказать, оптимизировать или объяснить числовой ответ Y от X, числовой переменной, которая, как считается, влияет на Y. |
Количественно определяет направление взаимосвязи |
Есть |
Есть |
Количественно определяет силу взаимоотношений |
Есть |
Есть |
X и Y взаимозаменяемы |
Есть |
№ |
Y Случайный |
Есть |
Есть |
X Случайное |
Есть |
№ |
Прогнозирование и оптимизация |
№ |
Есть |
Уравнение |
№ |
Есть |
Удлинитель для криволинейных приспособлений |
№ |
Есть |
Причина и следствие |
№ |
Попытки установить |
Узнайте больше о том, как выбирать между регрессией и корреляцией в Prism Academy
Какой инструмент, корреляция или регрессия, вы бы использовали в каждом из этих сценариев:
- У вас есть две измерительные системы, и вы хотите увидеть, насколько хорошо они согласуются друг с другом.Таким образом, вы измеряете одни и те же 20 деталей каждой измерительной системой.
- Вы хотите спрогнозировать артериальное давление для разных доз лекарства.
- Клиническое испытание имеет несколько конечных точек, и вы хотите знать, какая пара конечных точек имеет наиболее сильную линейную взаимосвязь.
- Вы хотите знать, насколько изменяется ответ (Y) на каждую единицу увеличения (X).
Ответы :
- Эти две переменные являются взаимозаменяемыми ответами, поэтому корреляция будет наиболее подходящей.
- Регрессия — правильный инструмент для прогнозирования.
- Корреляционная матрица позволит вам легко найти наиболее сильную линейную связь между всеми парами переменных.
- Наклон в регрессионном анализе предоставит вам эту информацию.
Начните бесплатную пробную версию Prism сегодня
Обзор, формула и практический пример
Что такое корреляция?
Корреляция — это статистическая мера отношения между двумя переменными.Эту меру лучше всего использовать в переменных, которые демонстрируют линейную зависимость друг от друга. Соответствие данных можно визуально представить на диаграмме рассеяния. Используя диаграмму рассеяния, мы обычно можем оценить взаимосвязь между переменными и определить, коррелированы они или нет.
Коэффициент корреляции — это значение, которое указывает на силу взаимосвязи между переменными. Коэффициент может принимать любые значения от -1 до 1.Интерпретации значений:
- -1: Идеальная отрицательная корреляция. Переменные имеют тенденцию двигаться в противоположных направлениях (т.е. когда одна переменная увеличивается, другая уменьшается).
- 0: Нет корреляции. Переменные не связаны друг с другом.
- 1: Идеальная положительная корреляция. Переменные имеют тенденцию двигаться в одном направлении (т.е. когда одна переменная увеличивается, другая переменная также увеличивается).
Одно из основных применений концепции в финансах — это управление портфелем. Управление портфелем. Профиль карьеры. Управление портфелем — это управление инвестициями и активами клиентов, включая пенсионные фонды, банки, хедж-фонды, семейные офисы. Управляющий портфелем несет ответственность за поддержание надлежащего состава активов и инвестиционной стратегии, которая соответствует потребностям клиента. Заработная плата, навыки ,. Тщательное понимание этой статистической концепции необходимо для успешной оптимизации портфеля.
Корреляция и причинность
Корреляцию не следует путать с причинностью. Известное выражение «корреляция не означает причинную связь» имеет решающее значение для понимания двух статистических концепций.
Если две переменные коррелированы, это не означает, что одна переменная вызывает изменения в другой переменной. Корреляция оценивает только отношения между переменными, и могут быть разные факторы, которые приводят к отношениям. Причинно-следственная связь может быть причиной корреляции, но это не единственное возможное объяснение.
Курс CFI «Математика для корпоративных финансов» исследует концепции финансовой математики, необходимые для финансового моделирования. Что такое «Финансовое моделирование». Финансовое моделирование выполняется в Excel для прогнозирования финансовых показателей компании. Обзор того, что такое финансовое моделирование, как и зачем его создавать.
Как найти корреляцию?
Коэффициент корреляции, указывающий на силу связи между двумя переменными, можно найти по следующей формуле:
Где:
- r xy — коэффициент корреляции линейной связи между переменными x и y
- x i — значения переменной x в выборке
- x̅ — среднее значение значений переменной x
- y i — значения y-переменной в выборке
- ȳ — среднее значение y-переменной
Чтобы рассчитать коэффициент корреляции по приведенной выше формуле, необходимо выполнить следующее шаги:
- Получите выборку данных со значениями переменной x и переменной y.
- Вычислите средние (средние) x̅ для переменной x и ȳ для переменной y.
- Для переменной x вычтите среднее значение из каждого значения переменной x (назовем эту новую переменную «a»). Сделайте то же самое для переменной y (назовем эту переменную «b»).
- Умножьте каждое значение a на соответствующее значение b и найдите сумму этих умножений (конечное значение — числитель в формуле).
- Возвести в квадрат каждое значение a и вычислить сумму результата.
- Найдите квадратный корень из значения, полученного на предыдущем шаге (это знаменатель в формуле).
- Разделите значение, полученное на шаге 4 , на значение, полученное на шаге 7 .
Вы можете видеть, что вычисление коэффициента корреляции вручную — чрезвычайно утомительный процесс, особенно если выборка данных большая. Однако существует множество программных инструментов, которые помогут вам сэкономить время при расчете коэффициента. Функция CORREL Функция CORREL Функция CORREL относится к статистическим функциям Excel.Он рассчитает коэффициент корреляции между двумя переменными. Как финансовый аналитик, функция CORREL очень полезна, когда мы хотим найти корреляцию между двумя переменными, например, корреляция между двумя переменными в Excel — один из самых простых способов быстро вычислить корреляцию между двумя переменными для большого набора данных.
Пример корреляции
Джон — инвестор. Его портфель в основном отслеживает динамику S&P 500, и Джон хочет добавить акции Apple Inc.Прежде чем добавить Apple в свой портфель, он хочет оценить корреляцию между акциями и S&P 500S & P — Standard and Poor’s Standard & Poor’s — американская компания финансовой разведки, которая действует как подразделение S&P Global. S&P является лидером рынка в области обеспечения того, чтобы добавление акций не увеличивало систематический риск его портфеля. Чтобы найти коэффициент, Джон собирает следующие цены за последние пять лет ( Шаг 1 ):
Используя приведенную выше формулу, Джон может определить корреляцию между ценами индекса S&P 500 и Apple. Inc.
Сначала Джон вычисляет средние цены каждой ценной бумаги за указанные периоды ( Шаг 2 ):
После расчета средних цен мы можем найти другие значения. Сводка расчетов приведена в таблице ниже:
Используя полученные числа, Джон может рассчитать коэффициент:
Коэффициент показывает, что цены S&P 500 и Apple Inc.имеют высокую положительную корреляцию. Это означает, что их соответствующие цены имеют тенденцию двигаться в одном направлении. Следовательно, добавление Apple к его портфелю фактически повысило бы уровень систематического риска.
Ссылки по теме
Спасибо за то, что прочитали объяснение корреляции CFI. CFI является официальным поставщиком услуг по финансовому моделированию и оценке (FMVA) ™. Стань сертифицированным аналитиком финансового моделирования и оценки (FMVA). Сертификат CFI «Финансовый аналитик по моделированию и оценке» (FMVA) ® поможет вам обрести необходимую уверенность в своих финансах. карьера.Запишитесь сегодня! программа сертификации, призванная превратить любого в финансового аналитика мирового уровня.
Чтобы продолжить изучение и развитие своих знаний в области финансового анализа, мы настоятельно рекомендуем дополнительные ресурсы CFI, указанные ниже:
- Якорение смещения смещения Смещение смещения смещения возникает, когда люди слишком полагаются на уже существующую информацию или первую информацию, которую они находят при принятии решений. Якоря — важное понятие в поведенческих финансах.
- Динамический финансовый анализДинамический финансовый анализЭто руководство научит вас выполнять динамический финансовый анализ в Excel с использованием расширенных формул и функций.INDEX, MATCH и INDEX MATCH Функции MATCH, объединение CELL, COUNTA, MID и OFFSET в формуле. При использовании эти функции Excel делают анализ финансовой отчетности более динамичным.
- Проверка гипотез Проверка гипотез Проверка гипотез — это метод статистического вывода. Он используется для проверки правильности утверждения относительно параметра совокупности. Проверка гипотез
- Распределение Пуассона Распределение Пуассона Распределение Пуассона — это инструмент, используемый в статистике теории вероятностей для прогнозирования величины отклонения от известной средней частоты встречаемости в пределах
Понимание различий для вашего продукта
Корреляция и причинно-следственная связь могут показаться обманчиво похожими .Но признание их различий может быть решающим фактором между потерей усилий на малоценные функции и созданием продукта, которым ваши клиенты не могут перестать восторгаться.
В этой статье мы сосредоточимся на корреляции и причинно-следственной связи, поскольку они относятся конкретно к созданию цифровых продуктов и пониманию поведения пользователей. Менеджеры по продуктам, специалисты по обработке данных и аналитики сочтут это полезным для использования правильной информации для роста продукта, например, влияют ли определенные функции на удержание или вовлеченность пользователей.
Прочитав эту статью, вы:
- Знаете ключевые различия между корреляцией и причинно-следственной связью
- Ключевые различия между корреляцией и причинно-следственной связью
- Два надежных решения, которые ваша команда может использовать для проверки причинно-следственной связи
В чем разница между корреляцией и причинно-следственной связью?
Хотя причинно-следственная связь и корреляция могут существовать одновременно, корреляция не подразумевает причинной связи. Причинность явно применяется к случаям, когда действие A вызывает результат B.С другой стороны, корреляция — это просто взаимосвязь. Действие A относится к действию B, но одно событие не обязательно вызывает другое событие.
Корреляцию и причинно-следственную связь часто путают, потому что человеческий разум любит находить закономерности, даже если они не существуют. Мы часто придумываем эти паттерны, когда две переменные кажутся настолько тесно связанными, что одна зависит от другой. Это будет означать причинно-следственную связь, когда зависимое событие является результатом независимого события.
Однако мы не можем просто предположить причинно-следственную связь, даже если видим два события, происходящие, по-видимому, вместе на наших глазах. Во-первых, наши наблюдения носят чисто анекдотический характер. Во-вторых, существует множество других возможностей для ассоциации, в том числе:
- Верно и обратное: B на самом деле вызывает A.
- Эти две взаимосвязаны, но это еще не все: A и B взаимосвязаны, но на самом деле они вызваны C.
- Есть еще одна переменная: A действительно вызывает B — пока происходит D.
- Существует цепная реакция: A вызывает E, что приводит к тому, что E вызывает B (но вы только своими глазами видели, что A вызывает B).
Пример корреляции и причинно-следственной связи в аналитике продукта
Можно ожидать, что вы обнаружите причинно-следственную связь в своем продукте, когда определенные действия или поведение пользователя приводят к определенному результату.
Представьте себе: вы только что запустили новую версию своего мобильного приложения. Вы делаете ключевую ставку на то, что удержание пользователей вашего продукта связано с социальным поведением в приложении.Вы просите свою команду разработать новую функцию, которая позволит пользователям присоединяться к «сообществам».
Через месяц после того, как вы выпустите и объявите о своей новой функции сообществ, около 20% всех пользователей приняли ее. Интересно, влияют ли сообщества на удержание, вы создаете две когорты одинакового размера со случайно выбранными пользователями. В одной когорте есть только пользователи, присоединившиеся к сообществам, а в другой — только пользователи, которые не присоединились к сообществам.
Ваш анализ показывает шокирующий результат: пользователи, которые присоединились хотя бы к одному сообществу, удерживаются гораздо чаще, чем средний пользователь.
Почти 90% тех, кто присоединился к сообществам, все еще находятся в Дне 1 по сравнению с 50% тех, кто этого не сделал. К 7 дню вы увидите 60% удержания среди присоединившихся к сообществу и около 18% удержания среди тех, кто не присоединился. Это похоже на массовый переворот.
Источник
Но подождите. Вы знаете, что у вас недостаточно информации, чтобы сделать вывод о том, приводит ли присоединение к сообществам к лучшему удержанию. Все, что вы знаете, это то, что они взаимосвязаны.
ПРОГРАММА УДЕРЖАНИЯ
Чтобы развивать свой продукт, вам нужна сильная стратегия удержания.
Прочтите наше руководство, чтобы получить советы экспертов по инструментам, стратегиям и реальным примерам для повышения удержания пользователей.
📚 Загрузить руководство >>
Как проверить причинно-следственную связь в вашем продукте
Причинно-следственные связи не возникают случайно.
Может возникнуть соблазн связать две переменные как «причину и следствие». Но выполнение этого без подтверждения причинности в надежном анализе может привести к ложноположительному результату, когда причинно-следственная связь, кажется, существует, но на самом деле ее нет.Это может произойти, если вы не тщательно проверяете взаимосвязь между зависимой и независимой переменной.
Ложные срабатывания проблематичны для получения информации о продукте, потому что они могут ввести вас в заблуждение, заставив думать, что вы понимаете связь между важными результатами и поведением пользователей. Например, вы можете подумать, что знаете, какое конкретное событие активации ключа приводит к долгосрочному удержанию пользователей, но без тщательного тестирования вы рискуете принять важные решения о продукте на основе неправильного поведения пользователя.
Проведите надежные эксперименты для определения причинно-следственной связи
Как только вы найдете корреляцию, вы можете проверить ее, запустив эксперименты, которые «контролируют другие переменные и измеряют разницу».
Два таких эксперимента или анализа, которые вы можете использовать для выявления причинно-следственной связи с вашим продуктом:
- Проверка гипотез
- A / B / n эксперименты
1. Проверка гипотез
Самая основная проверка гипотез будет включать H0 (нулевая гипотеза) и h2 (ваша основная гипотеза) .Вы также можете иметь вторичную гипотезу, третичную гипотезу и так далее.
Нулевая гипотеза противоположна вашей первичной гипотезе . Почему? Потому что, хотя вы не можете доказать свою основную гипотезу со 100% уверенностью (самое близкое, что вы можете получить, составляет 99%), вы можете опровергнуть свою нулевую гипотезу.
Первичная гипотеза указывает на причинно-следственную связь, которую вы исследуете, и должна идентифицировать независимую переменную и зависимую переменную.
Лучше сначала создать свой h2, затем определить его противоположность и использовать его для H0. Ваш h2 должен определять отношения, которые вы ожидаете между независимыми и зависимыми переменными. Итак, если мы воспользуемся предыдущим примером влияния социальных функций в приложении на удержание, ваша независимая переменная будет присоединяться к сообществам, а ваша зависимая переменная — удержанию. Итак, ваши гипотезы могут быть такими:
h2: Если пользователь присоединится к сообществу в рамках нашего продукта в первый месяц, он останется клиентом более одного года.
Затем отвергните свой h2, чтобы сгенерировать нулевую гипотезу:
H0: Нет никакой связи между присоединением к сообществу внутри приложения и удержанием пользователей.
Цель состоит в том, чтобы увидеть любые фактические различия между вашими гипотезами. Если вы можете отклонить нулевую гипотезу со статистической значимостью (в идеале с достоверностью минимум 95%), вы ближе к пониманию взаимосвязи между вашими независимыми и зависимыми переменными.В приведенном выше примере, если вы можете отклонить нулевую гипотезу, обнаружив, что присоединение к сообществу привело к более высоким показателям удержания (с поправкой на смешанные переменные, которые могут повлиять на ваши результаты), то вы, вероятно, можете сделать вывод, что существует некоторая связь между сообществами и пользователем. удержание.
Чтобы проверить эту гипотезу, составьте уравнение, которое точно отражает взаимосвязь между ожидаемой причиной (независимая переменная) и следствием (переменная результата). Если ваша модель позволяет вам подставлять значение для вашей переменной воздействия и последовательно возвращать результат, который отражает фактические наблюдаемые данные, вы, вероятно, на чем-то натолкнулись.
Когда использовать проверку гипотез:
Проверка гипотез полезна, когда вы пытаетесь определить, действительно ли существует связь между двумя переменными, вместо того, чтобы смотреть на отдельные свидетельства. Возможно, вам захочется посмотреть на исторические данные, чтобы запустить продольный анализ , который отслеживает изменения во времени. Например, вы можете выяснить, являются ли первые участники запуска продукта вашими крупнейшими промоутерами. Вы можете посмотреть на шаблоны рефералов, а также сравнить эту связь с запуском продукта с течением времени.
Или вы можете запустить перекрестный анализ , который анализирует моментальный снимок данных. Это полезно, когда вы смотрите на эффекты конкретного воздействия и результата, а не на изменения в тенденциях за период. В качестве примера вы можете изучить взаимосвязь между праздничными рекламными акциями и продажами.
2. Эксперименты с A / B / n
В качестве альтернативы, тестирование A / B / n может привести вас от корреляции к причинно-следственной связи. Посмотрите на каждую из ваших переменных, измените одну и посмотрите, что произойдет.Если ваш результат постоянно меняется (с той же тенденцией), вы нашли переменную, которая имеет значение.
Эндрю Чен говорит об этом так: «После того, как вы нашли модель, которая вам подходит, следующим шагом будет попытка провести A / B-тестирование. Сделайте что-нибудь, что отдает приоритет входной переменной и увеличивает ее, возможно, за счет чего-то еще ». Он продолжает: «Посмотрим, станут ли в результате эти пользователи более успешными. Если вы видите большую разницу в своей метрике успеха, значит, вы на правильном пути.Если нет, то, может быть, это не очень удачная модель ».
Когда дело доходит до доказательства того, что присоединение к сообществам приводит к более высокому уровню удержания, вы должны исключить все другие переменные, которые могут повлиять на результат. Например, пользователи могли пойти другим путем, что в конечном итоге повлияло на удержание.
Чтобы проверить, существует ли причинно-следственная связь, вам нужно найти прямую связь между присоединением пользователей к сообществам и долгосрочным использованием вашего приложения.
Начните с процесса адаптации.Для следующих 1000 пользователей, которые зарегистрируются, разделите их на две группы. Половина будет вынуждена присоединиться к сообществам при первой регистрации, а другая половина — нет.
Запустите эксперимент в течение 30 дней, а затем сравните уровни удержания между двумя группами.
Если вы обнаружите, что группа, которая была вынуждена присоединиться к сообществам, имеет относительно более высокий уровень удержания, тогда у вас есть доказательства, необходимые для подтверждения наличия причинно-следственной связи между присоединением к сообществам и удержанием.Эти отношения, вероятно, стоит изучить глубже, чтобы понять, почему сообщества стимулируют удержание.
Вы не будете уверены в родстве, пока не проведете эксперименты такого типа.
Когда использовать A / B / n-тестирование:
A / B / n, или сплит-тестирование, идеально подходит, когда вы сравниваете влияние различных вариантов (это может быть кампания, функция продукта или контент). стратегия). Например, сплит-тест процесса адаптации вашего продукта может сравнить эффективность различных стратегий на основе определенных характеристик, в том числе:
- Варианты копирования
- Различная графика
- Использование стороннего приложения для автоматического распознавания названия и компании ваши пользователи
- Уменьшение количества полей в вашей форме регистрации, если у вас есть одно
После запуска нескольких вариантов адаптации продукта вы можете взглянуть на результаты, чтобы сравнить такие показатели, как процент прерывания, конверсия и т.