Быстрое Хорошее
Хорошая
выполнение качество,
точность, но
Поиск ближайшего запроса, но быстрая
медленная
соседа низкая скорость, но
работа
точность дорого!
результата
RAM 128 гб (для вычислений) • Алгоритм IVFPQ из FAISS • Алгоритм IVF1048576, SQ8 из
Метрики
Пропускная Точность поиска Мощность и
способность стоимость
энергопотребления
Кол-во запросов в секунду (QPS) Для k-NN 10-recall@10 Мощность энергопотребления в
киловатт-час/запрос (или
Для Range поиска средний precision джоуль/запрос)
при фиксированном recall
Стоимость энергопотребления для
обеспечения пропускной способности
100 000 запросов в секунду в течение 4
лет
Алгоритм метода
Факультет компьютерных наук приближенных ближайших Обзор результатов 7
соседей в масштабах больших соревнования
данных
Обзор результатов
Всего представлено 13 команд:
• 5 команд представлено для стандартизированного аппаратного носителя T1
• 3 команд представлено для стандартизированного аппаратного носителя T2
• 5 команд представлено для стандартизированного аппаратного носителя T3
Особенности T1:
• Основная задача – процесс сжатия, для того, чтобы уместить в ограниченное число памяти
Особенности T2:
• позволяет хранить SSD, достаточно большой̆ для хранения исходных векторов – ему не нужно
проводить сжатие – у него больше времени на разработку алгоритма.
Особенности T3:
• Использование алгоритмов разработанных различными компаниями: Intel - OptaNNE GraphNN, Nvidia,
Meta – алгоритм на PCI-ускорителе IN-SRAM, Microsoft - DiskANN, разработанный̆ на сервере от DELL .
Алгоритм метода
Факультет компьютерных наук приближенных ближайших Обзор результатов 8
соседей в масштабах больших соревнования
данных
Обзор
Алгоритм MS Turning от команды puck-t1 показал наилучший̆
результатов результат со значением Recall = 0.7938
по Треку 1
Алгоритм метода
Факультет компьютерных наук приближенных ближайших Обзор результатов 9
соседей в масштабах больших соревнования
данных
результатов
по Треку 2
Обзор
результатов
по Треку 3
Алгоритм метода
Факультет компьютерных наук приближенных ближайших Обзор результатов 11
соседей в масштабах больших соревнования
данных
Выводы
Было выяснено, что разработка и реализация алгоритмов требовало больше времени, чем было
предложено. Требуется дополнительная разработка программного обеспечения для дальнейшей
автоматизации работы. Создание индексов в облаке представляет собой сдерживание для повторного
(частого) запуска процесса.
В конце авторы предложили возможные треки для дальнейших исследований, исходя из полученных
результатов. А именно:
1. Поддержка запросов ANNS, которые также допускают фильтры, такие как диапазон дат, автор, язык,
цвет изображения или некоторая комбинация таких атрибутов.
2. Разработка алгоритмов, точность и производительность которых будут устойчивы к вставкам и
удалениям.
3. Разработка алгоритмов, устойчивых к наборам данных с запросами, например, возникающими при
кросс-модальных имбеддингах.
4. Сжатие c меньшей потерей информации, возможно, засчет более дорогого декодинга.