Академический Документы
Профессиональный Документы
Культура Документы
2016/2017
Projeto Final
Cranfield
Foi a coleção pioneira do teste, permitindo medidas quantitativas precisas de
eficácia da recuperação da informação, mas hoje em dia é muito pequena para
qualquer outra coisa, exceto as experiências piloto mais elementares.
Recolhido no Reino Unido a partir do final da década de 1950, contém 1398
resumos de artigos de revistas aerodinâmicas, um conjunto de 225 consultas e
julgamentos de relevância exaustiva de todos os pares (consulta, documento).
GOV2
Uma coleção TREC/NIST de 25 milhões de páginas web é a maior coleção da
Web facilmente disponível para fins de pesquisa. No entanto, GOV2 é menor
em índice do que das coleções de documentos indexadas pelas grandes
empresas de pesquisa na web como a Google/Yahoo/MSN em 3 ordens de
magnitude.
Relevante Não-Relevante
Relevante Não-Relevante
# Recuperado 20 40 60
80 1,000,040 1,000,120
Tabela 2
Combined Measures
100
80 Minimum
Maximum
60
Arithmetic
40 Geometric
Harmonic
20
0
0 50 100
Precision (Recall fixed at 70%)
1,0
0,8
Precision
0,6
0,4
0,2
0,0
0,0 0,2 0,4 0,6 0,8 1,0
Recall
Figura 3
Retorno Precision
Interpolado
0.0 1.00
0.1 0.67
0.2 0.63
0.3 0.55
0.4 0.45
0.5 0.41
0.6 0.36
0.7 0.29
0.8 0.13
0.9 0.10
1.0 0.08
Tabela 3 – Cálculo da Precisão Médica Interpolada de 11 pontos. Isto é para o Curva
de recuperação de precisão mostrada na Figura 2.
0,8
0,6
Precision
0,4
0,2
0
0 0,2 0,4 0,6 0,8 1
Recall
Precisão R
Exige ter um conjunto de documentos conhecidos Rel, a partir do qual
calculamos a precisão dos principais documentos Rel retornados. (O conjunto
Rel pode estar incompleto, como quando o Rel é formado criando julgamentos
de relevância para os resultados superiores agrupados de conjuntos de sistemas
específicos em um conjunto de experiências). A precisão R ajusta o tamanho
do conjunto de documentos relevantes: um sistema perfeito pode pontuar 1.0
nesta métrica para cada consulta.