Коэффициент Сёренсена
Мера Сёренсена — бинарная мера сходства, предложенная датским учёным Торвальдом Сёренсеном в 1948 году. Фамилия автора коэффициента в литературе переводится самыми различными способами: Съёренсен, Съеренсен, Соренсен, Серенсен. Вариант «Сёренсен» приводится в известной работе X.X.Трасса.
Мера Сёренсена эквивалентна (связаны одной монотонно возрастающей зависимостью) мере Жаккара и мере Сокала-Снита для конечных множеств (множественная интерпретация). На основе индекса Сёренсена получен индекс Маарела: K M = 2 K S − 1 {displaystyle K_{M}=2K_{S}-1} .
K 0 , − 1 = 2 n ( A ∩ B ) n ( A ) + n ( B ) {displaystyle K_{0,-1}={frac {2n(Acap B)}{n(A)+n(B)}}}Для случая дескриптивных множеств (дескриптивная интерпретация), в экологии это выборки по обилию, аналогом указанной меры является мера Чекановского:
K 0 , − 1 = 2 ∑ i = 1 r m i n ( A i , B i ) ( ∑ i = 1 r ( A i ) + ∑ i = 1 r ( B i ) ) {displaystyle K_{0,-1}={2sum _{i=1}^{r}min(A_{i},B_{i}) over (sum _{i=1}^{r}(A_{i})+sum _{i=1}^{r}(B_{i}))}}Если сравнивается встречаемость видов (вероятностная интерпретация), то есть учитываются вероятности встреч признаков, то аналогом меры Сёренсена будет симметричная мера Дайса (coincidence index), предложенная Л.Дайсом в 1945 году, в дальнейшем использовался Р.Бреем. Поэтому меру часто называют индексом Дайса-Брея. В некоторых работах используется под названием индекса Дайса или индекса Брея-Кёртиса (реже индекса Ланса-Вильямса):
K 0 , − 1 = 2 P ( A ∩ B ) P ( A ) + P ( B ) {displaystyle K_{0,-1}={frac {2P(Acap B)}{P(A)+P(B)}}}Для информационной аналитической интерпретации мера взаимозависимости была независимо предложена Б. И. Сёмкиным и чешскими авторами. Мера применяется в научных исследованиях для определения степени взаимозависимости двух признаков.
K 0 , − 1 = 2 I ( A , B ) H ( A ) + H ( B ) {displaystyle K_{0,-1}={frac {2I(A,B)}{H(A)+H(B)}}}
Добавить комментарий!