Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Коэффициент линейной корреляции множества выданных и истинно релевантных документов



Коэффициент линейной корреляции R выдачи и релевантности документов представляет собой корреляционный момент двух случайных величин:

С – «быть выданным документом» (формально релевантным с точки зрения системы);

И – «быть релевантным» (истинно релевантным с точки зрения пользователя).

Каждая из велечин может иметь значения 0 и 1 в зависимости от конкретного документа.

Математические ожидания С и И:

  M [C] = P(C=1) = a + b   ; M[И] = a + c
a + b + с + d a + b + с + d

Дисперсии определяются:

σ²с = (a + b) · (с + d) ;σ²и = (a + c) · (b + d) ;covси = M[C x И] – M[C] x M[И]= ad – bc
(a + b + с + d) ² (a + b + с + d) ² (a + b + с + d) ²

Окончательно:

R = COVси = ad - bc
√σ²с σ²и √ (a + b)(a + c)(b + d)(c + d)

В различных точках координат <n,x> значения (знаки) R следующие:

R(0) = 0, R(p 0) = 0, R(И) = +1, R(Д) = -1, R(1) > 0, R(2) > 0, R(3) < 0

R = 0 повсюду на линии 0 – p0

Для этого достаточно показать, что: ad – bc = n0(x - n p 0)

На линии 0 p 0 справедливо: x = n·(X0/ n0) = n p 0 => ad – bc = 0

Обозначая: |L ∩ L© | = L, |Lи| = Lи, |Lc| = Lc, |L0| = L0

Перепишем R в координатах <L>:

R = LL0 – LиLc
√LиLc(L0 – Lи)(L0 – Lc)





Дата публикования: 2015-01-26; Прочитано: 191 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.005 с)...