docs/html/ProductQuantizer_8cpp_source.html

 /**

  * Copyright (c) Facebook, Inc. and its affiliates.

  *

  * This source code is licensed under the MIT license found in the

  * LICENSE file in the root directory of this source tree.

  */


 // -*- c++ -*-


 #include "ProductQuantizer.h"


 #include <cstddef>

 #include <cstring>

 #include <cstdio>

 #include <memory>


 #include <algorithm>


 #include "FaissAssert.h"

 #include "VectorTransform.h"

 #include "IndexFlat.h"

 #include "utils.h"


 extern "C" {


 /* declare BLAS functions, see http://www.netlib.org/clapack/cblas/ */


 int sgemm_ (const char *transa, const char *transb, FINTEGER *m, FINTEGER *

             n, FINTEGER *k, const float *alpha, const float *a,

             FINTEGER *lda, const float *b, FINTEGER *

             ldb, float *beta, float *c, FINTEGER *ldc);


 }


 namespace faiss {


 /* compute an estimator using look-up tables for typical values of M */

 template <typename CT, class C>

 void pq_estimators_from_tables_Mmul4 (int M, const CT * codes,

                                       size_t ncodes,

                                       const float * __restrict dis_table,

                                       size_t ksub,

                                       size_t k,

                                       float * heap_dis,

                                       long * heap_ids)

 {


     for (size_t j = 0; j < ncodes; j++) {

         float dis = 0;

         const float *dt = dis_table;


         for (size_t m = 0; m < M; m+=4) {

             float dism = 0;

             dism  = dt[*codes++]; dt += ksub;

             dism += dt[*codes++]; dt += ksub;

             dism += dt[*codes++]; dt += ksub;

             dism += dt[*codes++]; dt += ksub;

             dis += dism;

         }


         if (C::cmp (heap_dis[0], dis)) {

             heap_pop<C> (k, heap_dis, heap_ids);

             heap_push<C> (k, heap_dis, heap_ids, dis, j);

         }

     }

 }


 template <typename CT, class C>

 void pq_estimators_from_tables_M4 (const CT * codes,

                                    size_t ncodes,

                                    const float * __restrict dis_table,

                                    size_t ksub,

                                    size_t k,

                                    float * heap_dis,

                                    long * heap_ids)

 {


     for (size_t j = 0; j < ncodes; j++) {

         float dis = 0;

         const float *dt = dis_table;

         dis  = dt[*codes++]; dt += ksub;

         dis += dt[*codes++]; dt += ksub;

         dis += dt[*codes++]; dt += ksub;

         dis += dt[*codes++];


         if (C::cmp (heap_dis[0], dis)) {

             heap_pop<C> (k, heap_dis, heap_ids);

             heap_push<C> (k, heap_dis, heap_ids, dis, j);

         }

     }

 }


 template <typename CT, class C>

 static inline void pq_estimators_from_tables (const ProductQuantizer& pq,

                                               const CT * codes,

                                               size_t ncodes,

                                               const float * dis_table,

                                               size_t k,

                                               float * heap_dis,

                                               long * heap_ids)

 {


     if (pq.M == 4)  {


         pq_estimators_from_tables_M4<CT, C> (codes, ncodes,

                                              dis_table, pq.ksub, k,

                                              heap_dis, heap_ids);

         return;

     }


     if (pq.M % 4 == 0) {

         pq_estimators_from_tables_Mmul4<CT, C> (pq.M, codes, ncodes,

                                                 dis_table, pq.ksub, k,

                                                 heap_dis, heap_ids);

         return;

     }


     /* Default is relatively slow */

     const size_t M = pq.M;

     const size_t ksub = pq.ksub;

     for (size_t j = 0; j < ncodes; j++) {

         float dis = 0;

         const float * __restrict dt = dis_table;

         for (int m = 0; m < M; m++) {

             dis += dt[*codes++];

             dt += ksub;

         }

         if (C::cmp (heap_dis[0], dis)) {

             heap_pop<C> (k, heap_dis, heap_ids);

             heap_push<C> (k, heap_dis, heap_ids, dis, j);

         }

     }

 }


 template <class C>

 static inline void pq_estimators_from_tables_generic(const ProductQuantizer& pq,

                                                      size_t nbits,

                                                      const uint8_t *codes,

                                                      size_t ncodes,

                                                      const float *dis_table,

                                                      size_t k,

                                                      float *heap_dis,

                                                      long *heap_ids)

 {

   const size_t M = pq.M;

   const size_t ksub = pq.ksub;

   for (size_t j = 0; j < ncodes; ++j) {

     faiss::ProductQuantizer::PQDecoderGeneric decoder(

       codes + j * pq.code_size, nbits

     );

     float dis = 0;

     const float * __restrict dt = dis_table;

     for (size_t m = 0; m < M; m++) {

       uint64_t c = decoder.decode();

       dis += dt[c];

       dt += ksub;

     }


     if (C::cmp(heap_dis[0], dis)) {

       heap_pop<C>(k, heap_dis, heap_ids);

       heap_push<C>(k, heap_dis, heap_ids, dis, j);

     }

   }

 }


 /*********************************************

  * PQ implementation

  *********************************************/


 ProductQuantizer::ProductQuantizer (size_t d, size_t M, size_t nbits):

     d(d), M(M), nbits(nbits), assign_index(nullptr)

 {

     set_derived_values ();

 }


 ProductQuantizer::ProductQuantizer ()

     : ProductQuantizer(0, 1, 0) {}


 void ProductQuantizer::set_derived_values () {

     // quite a few derived values

     FAISS_THROW_IF_NOT (d % M == 0);

     dsub = d / M;

     code_size = (nbits * M + 7) / 8;

     ksub = 1 << nbits;

     centroids.resize (d * ksub);

     verbose = false;

     train_type = Train_default;

 }


 void ProductQuantizer::set_params (const float * centroids_, int m)

 {

   memcpy (get_centroids(m, 0), centroids_,

             ksub * dsub * sizeof (centroids_[0]));

 }


 static void init_hypercube (int d, int nbits,

                             int n, const float * x,

                             float *centroids)

 {


     std::vector<float> mean (d);

     for (int i = 0; i < n; i++)

         for (int j = 0; j < d; j++)

             mean [j] += x[i * d + j];


     float maxm = 0;

     for (int j = 0; j < d; j++) {

         mean [j] /= n;

         if (fabs(mean[j]) > maxm) maxm = fabs(mean[j]);

     }


     for (int i = 0; i < (1 << nbits); i++) {

         float * cent = centroids + i * d;

         for (int j = 0; j < nbits; j++)

             cent[j] = mean [j] + (((i >> j) & 1) ? 1 : -1) * maxm;

         for (int j = nbits; j < d; j++)

             cent[j] = mean [j];

     }


 }


 static void init_hypercube_pca (int d, int nbits,

                                 int n, const float * x,

                                 float *centroids)

 {

     PCAMatrix pca (d, nbits);

     pca.train (n, x);


     for (int i = 0; i < (1 << nbits); i++) {

         float * cent = centroids + i * d;

         for (int j = 0; j < d; j++) {

             cent[j] = pca.mean[j];

             float f = 1.0;

             for (int k = 0; k < nbits; k++)

                 cent[j] += f *

                     sqrt (pca.eigenvalues [k]) *

                     (((i >> k) & 1) ? 1 : -1) *

                     pca.PCAMat [j + k * d];

         }

     }


 }


 void ProductQuantizer::train (int n, const float * x)

 {

     if (train_type != Train_shared) {

         train_type_t final_train_type;

         final_train_type = train_type;

         if (train_type == Train_hypercube ||

             train_type == Train_hypercube_pca) {

             if (dsub < nbits) {

                 final_train_type = Train_default;

                 printf ("cannot train hypercube: nbits=%ld > log2(d=%ld)\n",

                         nbits, dsub);

             }

         }


         float * xslice = new float[n * dsub];

         ScopeDeleter<float> del (xslice);

         for (int m = 0; m < M; m++) {

             for (int j = 0; j < n; j++)

                 memcpy (xslice + j * dsub,

                         x + j * d + m * dsub,

                         dsub * sizeof(float));


             Clustering clus (dsub, ksub, cp);


             // we have some initialization for the centroids

             if (final_train_type != Train_default) {

                 clus.centroids.resize (dsub * ksub);

             }


             switch (final_train_type) {

             case Train_hypercube:

                 init_hypercube (dsub, nbits, n, xslice,

                                 clus.centroids.data ());

                 break;

             case  Train_hypercube_pca:

                 init_hypercube_pca (dsub, nbits, n, xslice,

                                     clus.centroids.data ());

                 break;

             case  Train_hot_start:

                 memcpy (clus.centroids.data(),

                         get_centroids (m, 0),

                         dsub * ksub * sizeof (float));

                 break;

             default: ;

             }


             if(verbose) {

                 clus.verbose = true;

                 printf ("Training PQ slice %d/%zd\n", m, M);

             }

             IndexFlatL2 index (dsub);

             clus.train (n, xslice, assign_index ? *assign_index : index);

             set_params (clus.centroids.data(), m);

         }


     } else {


         Clustering clus (dsub, ksub, cp);


         if(verbose) {

             clus.verbose = true;

             printf ("Training all PQ slices at once\n");

         }


         IndexFlatL2 index (dsub);


         clus.train (n * M, x, assign_index ? *assign_index : index);

         for (int m = 0; m < M; m++) {

             set_params (clus.centroids.data(), m);

         }


     }

 }


 template<class PQEncoder>

 void compute_code(const ProductQuantizer& pq, const float *x, uint8_t *code) {

   float distances [pq.ksub];

   PQEncoder encoder(code, pq.nbits);

   for (size_t m = 0; m < pq.M; m++) {

     float mindis = 1e20;

     uint64_t idxm = 0;

     const float * xsub = x + m * pq.dsub;


     fvec_L2sqr_ny(distances, xsub, pq.get_centroids(m, 0), pq.dsub, pq.ksub);


     /* Find best centroid */

     for (size_t i = 0; i < pq.ksub; i++) {

       float dis = distances[i];

       if (dis < mindis) {

         mindis = dis;

         idxm = i;

       }

     }


     encoder.encode(idxm);

   }

 }


 void ProductQuantizer::compute_code(const float * x, uint8_t * code) const {

   switch (nbits) {

     case 8:

       faiss::compute_code<PQEncoder8>(*this, x, code);

       break;


     case 16:

       faiss::compute_code<PQEncoder16>(*this, x, code);

       break;


     default:

       faiss::compute_code<PQEncoderGeneric>(*this, x, code);

       break;

   }

 }


 template<class PQDecoder>

 void decode(const ProductQuantizer& pq, const uint8_t *code, float *x)

 {

   PQDecoder decoder(code, pq.nbits);

   for (size_t m = 0; m < pq.M; m++) {

     uint64_t c = decoder.decode();

     memcpy(x + m * pq.dsub, pq.get_centroids(m, c), sizeof(float) * pq.dsub);

   }

 }


 void ProductQuantizer::decode (const uint8_t *code, float *x) const

 {

   switch (nbits) {

     case 8:

       faiss::decode<PQDecoder8>(*this, code, x);

       break;


     case 16:

       faiss::decode<PQDecoder16>(*this, code, x);

       break;


     default:

       faiss::decode<PQDecoderGeneric>(*this, code, x);

       break;

   }

 }


 void ProductQuantizer::decode (const uint8_t *code, float *x, size_t n) const

 {

     for (size_t i = 0; i < n; i++) {

         this->decode (code + code_size * i, x + d * i);

     }

 }


 void ProductQuantizer::compute_code_from_distance_table (const float *tab,

                                                          uint8_t *code) const

 {

   PQEncoderGeneric encoder(code, nbits);

   for (size_t m = 0; m < M; m++) {

     float mindis = 1e20;

     uint64_t idxm = 0;


     /* Find best centroid */

     for (size_t j = 0; j < ksub; j++) {

       float dis = *tab++;

       if (dis < mindis) {

         mindis = dis;

         idxm = j;

       }

     }


     encoder.encode(idxm);

   }

 }


 void ProductQuantizer::compute_codes_with_assign_index (

                 const float * x,

                 uint8_t * codes,

                 size_t n)

 {

     FAISS_THROW_IF_NOT (assign_index && assign_index->d == dsub);


     for (size_t m = 0; m < M; m++) {

         assign_index->reset ();

         assign_index->add (ksub, get_centroids (m, 0));

         size_t bs = 65536;

         float * xslice = new float[bs * dsub];

         ScopeDeleter<float> del (xslice);

         idx_t *assign = new idx_t[bs];

         ScopeDeleter<idx_t> del2 (assign);


         for (size_t i0 = 0; i0 < n; i0 += bs) {

             size_t i1 = std::min(i0 + bs, n);


             for (size_t i = i0; i < i1; i++) {

                 memcpy (xslice + (i - i0) * dsub,

                         x + i * d + m * dsub,

                         dsub * sizeof(float));

             }


             assign_index->assign (i1 - i0, xslice, assign);


             if (nbits == 8) {

               uint8_t *c = codes + code_size * i0 + m;

               for (size_t i = i0; i < i1; i++) {

                 *c = assign[i - i0];

                 c += M;

               }

             } else if (nbits == 16) {

               uint16_t *c = (uint16_t*)(codes + code_size * i0 + m * 2);

               for (size_t i = i0; i < i1; i++) {

                 *c = assign[i - i0];

                 c += M;

               }

             } else {

               for (size_t i = i0; i < i1; ++i) {

                 uint8_t *c = codes + code_size * i + ((m * nbits) / 8);

                 uint8_t offset = (m * nbits) % 8;

                 uint64_t ass = assign[i - i0];


                 PQEncoderGeneric encoder(c, nbits, offset);

                 encoder.encode(ass);

               }

             }


         }

     }


 }


 void ProductQuantizer::compute_codes (const float * x,

                                       uint8_t * codes,

                                       size_t n)  const

 {

   // process by blocks to avoid using too much RAM

     size_t bs = 256 * 1024;

     if (n > bs) {

         for (size_t i0 = 0; i0 < n; i0 += bs) {

             size_t i1 = std::min(i0 + bs, n);

             compute_codes (x + d * i0, codes + code_size * i0, i1 - i0);

         }

         return;

     }


     if (dsub < 16) { // simple direct computation


 #pragma omp parallel for

         for (size_t i = 0; i < n; i++)

             compute_code (x + i * d, codes + i * code_size);


     } else { // worthwile to use BLAS

         float *dis_tables = new float [n * ksub * M];

         ScopeDeleter<float> del (dis_tables);

         compute_distance_tables (n, x, dis_tables);


 #pragma omp parallel for

         for (size_t i = 0; i < n; i++) {

             uint8_t * code = codes + i * code_size;

             const float * tab = dis_tables + i * ksub * M;

             compute_code_from_distance_table (tab, code);

         }

     }

 }


 void ProductQuantizer::compute_distance_table (const float * x,

                                                float * dis_table) const

 {

     size_t m;


     for (m = 0; m < M; m++) {

         fvec_L2sqr_ny (dis_table + m * ksub,

                        x + m * dsub,

                        get_centroids(m, 0),

                        dsub,

                        ksub);

     }

 }


 void ProductQuantizer::compute_inner_prod_table (const float * x,

                                                  float * dis_table) const

 {

     size_t m;


     for (m = 0; m < M; m++) {

         fvec_inner_products_ny (dis_table + m * ksub,

                                 x + m * dsub,

                                 get_centroids(m, 0),

                                 dsub,

                                 ksub);

     }

 }


 void ProductQuantizer::compute_distance_tables (

            size_t nx,

            const float * x,

            float * dis_tables) const

 {


     if (dsub < 16) {


 #pragma omp parallel for

         for (size_t i = 0; i < nx; i++) {

             compute_distance_table (x + i * d, dis_tables + i * ksub * M);

         }


     } else { // use BLAS


         for (int m = 0; m < M; m++) {

             pairwise_L2sqr (dsub,

                             nx, x + dsub * m,

                             ksub, centroids.data() + m * dsub * ksub,

                             dis_tables + ksub * m,

                             d, dsub, ksub * M);

         }

     }

 }


 void ProductQuantizer::compute_inner_prod_tables (

            size_t nx,

            const float * x,

            float * dis_tables) const

 {


     if (dsub < 16) {


 #pragma omp parallel for

         for (size_t i = 0; i < nx; i++) {

             compute_inner_prod_table (x + i * d, dis_tables + i * ksub * M);

         }


     } else { // use BLAS


         // compute distance tables

         for (int m = 0; m < M; m++) {

             FINTEGER ldc = ksub * M, nxi = nx, ksubi = ksub,

                 dsubi = dsub, di = d;

             float one = 1.0, zero = 0;


             sgemm_ ("Transposed", "Not transposed",

                     &ksubi, &nxi, &dsubi,

                     &one, &centroids [m * dsub * ksub], &dsubi,

                     x + dsub * m, &di,

                     &zero, dis_tables + ksub * m, &ldc);

         }


     }

 }


 template <class C>

 static void pq_knn_search_with_tables (

       const ProductQuantizer& pq,

       size_t nbits,

       const float *dis_tables,

       const uint8_t * codes,

       const size_t ncodes,

       HeapArray<C> * res,

       bool init_finalize_heap)

 {

     size_t k = res->k, nx = res->nh;

     size_t ksub = pq.ksub, M = pq.M;


 #pragma omp parallel for

     for (size_t i = 0; i < nx; i++) {

         /* query preparation for asymmetric search: compute look-up tables */

         const float* dis_table = dis_tables + i * ksub * M;


         /* Compute distances and keep smallest values */

         long * __restrict heap_ids = res->ids + i * k;

         float * __restrict heap_dis = res->val + i * k;


         if (init_finalize_heap) {

             heap_heapify<C> (k, heap_dis, heap_ids);

         }


         switch (nbits) {

           case 8:

               pq_estimators_from_tables<uint8_t, C> (pq,

                                                      codes, ncodes,

                                                      dis_table,

                                                      k, heap_dis, heap_ids);

               break;


           case 16:

               pq_estimators_from_tables<uint16_t, C> (pq,

                                                       (uint16_t*)codes, ncodes,

                                                       dis_table,

                                                       k, heap_dis, heap_ids);

               break;


           default:

               pq_estimators_from_tables_generic<C> (pq,

                                                     nbits,

                                                     codes, ncodes,

                                                     dis_table,

                                                     k, heap_dis, heap_ids);

               break;

         }


         if (init_finalize_heap) {

             heap_reorder<C> (k, heap_dis, heap_ids);

         }

     }

 }


 void ProductQuantizer::search (const float * __restrict x,

                                size_t nx,

                                const uint8_t * codes,

                                const size_t ncodes,

                                float_maxheap_array_t * res,

                                bool init_finalize_heap) const

 {

     FAISS_THROW_IF_NOT (nx == res->nh);

     std::unique_ptr<float[]> dis_tables(new float [nx * ksub * M]);

     compute_distance_tables (nx, x, dis_tables.get());


     pq_knn_search_with_tables<CMax<float, long>> (

       *this, nbits, dis_tables.get(), codes, ncodes, res, init_finalize_heap);

 }


 void ProductQuantizer::search_ip (const float * __restrict x,

                                size_t nx,

                                const uint8_t * codes,

                                const size_t ncodes,

                                float_minheap_array_t * res,

                                bool init_finalize_heap) const

 {

     FAISS_THROW_IF_NOT (nx == res->nh);

     std::unique_ptr<float[]> dis_tables(new float [nx * ksub * M]);

     compute_inner_prod_tables (nx, x, dis_tables.get());


     pq_knn_search_with_tables<CMin<float, long> > (

       *this, nbits, dis_tables.get(), codes, ncodes, res, init_finalize_heap);

 }


 static float sqr (float x) {

     return x * x;

 }


 void ProductQuantizer::compute_sdc_table ()

 {

     sdc_table.resize (M * ksub * ksub);


     for (int m = 0; m < M; m++) {


         const float *cents = centroids.data() + m * ksub * dsub;

         float * dis_tab = sdc_table.data() + m * ksub * ksub;


         // TODO optimize with BLAS

         for (int i = 0; i < ksub; i++) {

             const float *centi = cents + i * dsub;

             for (int j = 0; j < ksub; j++) {

                 float accu = 0;

                 const float *centj = cents + j * dsub;

                 for (int k = 0; k < dsub; k++)

                     accu += sqr (centi[k] - centj[k]);

                 dis_tab [i + j * ksub] = accu;

             }

         }

     }

 }


 void ProductQuantizer::search_sdc (const uint8_t * qcodes,

                      size_t nq,

                      const uint8_t * bcodes,

                      const size_t nb,

                      float_maxheap_array_t * res,

                      bool init_finalize_heap) const

 {

     FAISS_THROW_IF_NOT (sdc_table.size() == M * ksub * ksub);

     FAISS_THROW_IF_NOT (nbits == 8);

     size_t k = res->k;


 #pragma omp parallel for

     for (size_t i = 0; i < nq; i++) {


         /* Compute distances and keep smallest values */

         long * heap_ids = res->ids + i * k;

         float *  heap_dis = res->val + i * k;

         const uint8_t * qcode = qcodes + i * code_size;


         if (init_finalize_heap)

             maxheap_heapify (k, heap_dis, heap_ids);


         const uint8_t * bcode = bcodes;

         for (size_t j = 0; j < nb; j++) {

             float dis = 0;

             const float * tab = sdc_table.data();

             for (int m = 0; m < M; m++) {

                 dis += tab[bcode[m] + qcode[m] * ksub];

                 tab += ksub * ksub;

             }

             if (dis < heap_dis[0]) {

                 maxheap_pop (k, heap_dis, heap_ids);

                 maxheap_push (k, heap_dis, heap_ids, dis, j);

             }

             bcode += code_size;

         }


         if (init_finalize_heap)

             maxheap_reorder (k, heap_dis, heap_ids);

     }


 }


 ProductQuantizer::PQEncoderGeneric::PQEncoderGeneric(uint8_t *code, int nbits,

                                                      uint8_t offset)

     : code(code), offset(offset), nbits(nbits), reg(0) {

   assert(nbits <= 64);

   if (offset > 0) {

     reg = (*code & ((1 << offset) - 1));

   }

 }


 void ProductQuantizer::PQEncoderGeneric::encode(uint64_t x) {

   reg |= (uint8_t)(x << offset);

   x >>= (8 - offset);

   if (offset + nbits >= 8) {

     *code++ = reg;


     for (int i = 0; i < (nbits - (8 - offset)) / 8; ++i) {

       *code++ = (uint8_t)x;

       x >>= 8;

     }


     offset += nbits;

     offset &= 7;

     reg = (uint8_t)x;

   } else {

     offset += nbits;

   }

 }


 ProductQuantizer::PQEncoderGeneric::~PQEncoderGeneric() {

   if (offset > 0) {

     *code = reg;

   }

 }


 ProductQuantizer::PQEncoder8::PQEncoder8(uint8_t *code, int nbits)

     : code(code) {

   assert(8 == nbits);

 }


 void ProductQuantizer::PQEncoder8::encode(uint64_t x) {

   *code++ = (uint8_t)x;

 }


 ProductQuantizer::PQEncoder16::PQEncoder16(uint8_t *code, int nbits)

     : code((uint16_t *)code) {

   assert(16 == nbits);

 }


 void ProductQuantizer::PQEncoder16::encode(uint64_t x) {

   *code++ = (uint16_t)x;

 }


 ProductQuantizer::PQDecoderGeneric::PQDecoderGeneric(const uint8_t *code,

                                                      int nbits)

     : code(code),

       offset(0),

       nbits(nbits),

       mask((1ull << nbits) - 1),

       reg(0) {

   assert(nbits <= 64);

 }


 uint64_t ProductQuantizer::PQDecoderGeneric::decode() {

   if (offset == 0) {

     reg = *code;

   }

   uint64_t c = (reg >> offset);


   if (offset + nbits >= 8) {

     uint64_t e = 8 - offset;

     ++code;

     for (int i = 0; i < (nbits - (8 - offset)) / 8; ++i) {

       c |= ((uint64_t)(*code++) << e);

       e += 8;

     }


     offset += nbits;

     offset &= 7;

     if (offset > 0) {

       reg = *code;

       c |= ((uint64_t)reg << e);

     }

   } else {

     offset += nbits;

   }


   return c & mask;

 }


 ProductQuantizer::PQDecoder8::PQDecoder8(const uint8_t *code, int nbits)

     : code(code) {

   assert(8 == nbits);

 }


 uint64_t ProductQuantizer::PQDecoder8::decode() {

   return (uint64_t)(*code++);

 }


 ProductQuantizer::PQDecoder16::PQDecoder16(const uint8_t *code, int nbits)

     : code((uint16_t *)code) {

   assert(16 == nbits);

 }


 uint64_t ProductQuantizer::PQDecoder16::decode() {

   return (uint64_t)(*code++);

 }


 }  // namespace faiss

faiss::ProductQuantizer::set_params
void set_params(const float *centroids, int m)
Define the centroids for subquantizer m.
Definition: ProductQuantizer.cpp:198

faiss::ProductQuantizer::Train_hypercube_pca
intialize centroids with nbits-D hypercube
Definition: ProductQuantizer.h:44

faiss::ProductQuantizer::nbits
size_t nbits
number of bits per quantization index
Definition: ProductQuantizer.h:29

faiss::ProductQuantizer::decode
void decode(const uint8_t *code, float *x) const
decode a vector from a given code (or n vectors if third argument)
Definition: ProductQuantizer.cpp:380

faiss::Index::reset
virtual void reset()=0
removes all elements from the database.

faiss::ProductQuantizer::Train_hypercube
intialize centroids with nbits-D hypercube
Definition: ProductQuantizer.h:43

faiss::Index::assign
void assign(idx_t n, const float *x, idx_t *labels, idx_t k=1)
Definition: Index.cpp:34

faiss::ProductQuantizer::set_derived_values
void set_derived_values()
compute derived values when d, M and nbits have been set
Definition: ProductQuantizer.cpp:187

faiss::ProductQuantizer::sdc_table
std::vector< float > sdc_table
Symmetric Distance Table.
Definition: ProductQuantizer.h:165

faiss::ProductQuantizer::Train_shared
share dictionary accross PQ segments
Definition: ProductQuantizer.h:42

faiss::ScopeDeleter
Definition: FaissException.h:45

faiss::ProductQuantizer::dsub
size_t dsub
dimensionality of each subvector
Definition: ProductQuantizer.h:32

faiss::ProductQuantizer::compute_distance_tables
void compute_distance_tables(size_t nx, const float *x, float *dis_tables) const
Definition: ProductQuantizer.cpp:546

faiss::ProductQuantizer::PQDecoderGeneric
Definition: ProductQuantizer.h:209

faiss::ProductQuantizer::compute_code_from_distance_table
void compute_code_from_distance_table(const float *tab, uint8_t *code) const
Definition: ProductQuantizer.cpp:406

faiss::ProductQuantizer::compute_codes
void compute_codes(const float *x, uint8_t *codes, size_t n) const
same as compute_code for several vectors
Definition: ProductQuantizer.cpp:482

faiss::Index::d
int d
vector dimension
Definition: Index.h:66

faiss::ProductQuantizer::compute_distance_table
void compute_distance_table(const float *x, float *dis_table) const
Definition: ProductQuantizer.cpp:517

faiss::ProductQuantizer::search
void search(const float *x, size_t nx, const uint8_t *codes, const size_t ncodes, float_maxheap_array_t *res, bool init_finalize_heap=true) const
Definition: ProductQuantizer.cpp:659

faiss::ProductQuantizer::code_size
size_t code_size
byte per indexed vector
Definition: ProductQuantizer.h:33

faiss::Index::add
virtual void add(idx_t n, const float *x)=0

faiss::ProductQuantizer::assign_index
Index * assign_index
Definition: ProductQuantizer.h:52

faiss::ProductQuantizer::PQEncoderGeneric::nbits
const int nbits
number of bits per subquantizer index
Definition: ProductQuantizer.h:180

faiss::ProductQuantizer::ksub
size_t ksub
number of centroids for each subquantizer
Definition: ProductQuantizer.h:34

faiss::HeapArray
Definition: Heap.h:349

faiss::ProductQuantizer::search_ip
void search_ip(const float *x, size_t nx, const uint8_t *codes, const size_t ncodes, float_minheap_array_t *res, bool init_finalize_heap=true) const
Definition: ProductQuantizer.cpp:674

faiss::pairwise_L2sqr
void pairwise_L2sqr(long d, long nq, const float *xq, long nb, const float *xb, float *dis, long ldq, long ldb, long ldd)
Definition: utils.cpp:1021

faiss::ProductQuantizer::compute_code
void compute_code(const float *x, uint8_t *code) const
Quantize one vector with the product quantizer.
Definition: ProductQuantizer.cpp:354

faiss::ProductQuantizer::Train_hot_start
the centroids are already initialized
Definition: ProductQuantizer.h:41

faiss::ProductQuantizer::cp
ClusteringParameters cp
parameters used during clustering
Definition: ProductQuantizer.h:48

faiss::HeapArray::nh
size_t nh
number of heaps
Definition: Heap.h:353

faiss::ProductQuantizer::M
size_t M
number of subquantizers
Definition: ProductQuantizer.h:28

faiss::ProductQuantizer::PQEncoderGeneric
Definition: ProductQuantizer.h:177

faiss::ProductQuantizer::compute_codes_with_assign_index
void compute_codes_with_assign_index(const float *x, uint8_t *codes, size_t n)
Definition: ProductQuantizer.cpp:427

faiss::ProductQuantizer
Definition: ProductQuantizer.h:23

faiss::ProductQuantizer::get_centroids
float * get_centroids(size_t m, size_t i)
return the centroids associated with subvector m
Definition: ProductQuantizer.h:58

faiss::ProductQuantizer::d
size_t d
size of the input vectors
Definition: ProductQuantizer.h:27

faiss::ProductQuantizer::verbose
bool verbose
verbose during training?
Definition: ProductQuantizer.h:35

faiss::ProductQuantizer::centroids
std::vector< float > centroids
Centroid table, size M * ksub * dsub.
Definition: ProductQuantizer.h:55

faiss::ProductQuantizer::train_type_t
train_type_t
initialization
Definition: ProductQuantizer.h:39