Главная
Новости
Статьи
Ремонт
Каркасный дом
Несущие конструкции
Металлические конструкции
Прочность дорог
Дорожные материалы
Стальные конструкции
Грунтовые основания
Опорные сооружения




16.09.2021


16.09.2021


15.09.2021


14.09.2021


14.09.2021


13.09.2021


13.09.2021





Яндекс.Метрика

Locality-sensitive hashing

04.09.2021

Locality-sensitive hashing (LSH) — вероятностный метод понижения размерности многомерных данных. Основная идея состоит в таком подборе хеш-функций для некоторых измерений, чтобы похожие объекты с высокой степенью вероятности попадали в одну корзину. Один из способов борьбы с «проклятием размерности» при поиске и анализе многомерных данных — при росте размерности исходных данных поиск по индексу ведет себя хуже чем последовательный просмотр. Метод позволяет строить структуру для быстрого приближенного (вероятностного) поиска n-мерных векторов, «похожих» на искомый шаблон.

LSH является, наверное, наиболее популярным на сегодняшний день среди предложенных приближенных алгоритмов поиска ближайших соседей (Approximate Nearest Neighbor, ANN). LSH в этом подходе отображает множество точек в высокоразмерном пространстве в множество бинов, т. е. в хеш-таблицу. В отличие от традиционных хэшей, LSH обладает свойством чувствительности к местоположению (locality-sensitive hash), благодаря чему способен помещать соседние точки в один и тот же бин.

Преимуществами LSH являются: 1) простота использования; 2) строгая теория, подтверждающая хорошую производительность алгоритма; 3) LSH совместим с любой нормой L p {displaystyle L_{p}} при 0 < p ≤ 2 {displaystyle 0<pleq 2} . LSH можно использовать с евклидовой метрикой, с манхэттенским расстоянием. Существуют также варианты для расстояния Хэмминга и косинусного коэффициента.