Màquina vectorial de rellevància

En matemàtiques, una màquina vectorial de rellevància (RVM) és una tècnica d'aprenentatge automàtic que utilitza la inferència bayesiana per obtenir solucions parsimonioses per a la regressió i la classificació probabilística.[1] El RVM té una forma funcional idèntica a la màquina vectorial de suport, però proporciona una classificació probabilística.[2]

En realitat és equivalent a un model de procés gaussià amb funció de covariància:

on és la funció del nucli (generalment gaussiana), són les variàncies de l'a priori sobre el vector pes , i són els vectors d'entrada del conjunt d'entrenament.[3]

En comparació amb les màquines de vectors de suport (SVM), la formulació bayesiana de la RVM evita el conjunt de paràmetres lliures de la SVM (que normalment requereixen post-optimitzacions basades en validació creuada). Tanmateix, els RVM utilitzen un mètode d'aprenentatge semblant a la maximització de les expectatives (EM) i, per tant, corren el risc de tenir mínims locals. Això és a diferència dels algorismes estàndard basats en l'optimització mínima seqüencial (SMO) utilitzats per les SVM, que es garanteixen trobar un òptim global (del problema convex).[4]

La màquina vectorial de rellevància va ser patentada als Estats Units per Microsoft (la patent va caducar el 4 de setembre de 2019).

Referències

[modifica]
  1. Tipping, Michael E. Journal of Machine Learning Research, 1, 2001, pàg. 211–244.
  2. «Relevance Vector Machines: An Introduction» (en anglès). [Consulta: 13 febrer 2024].
  3. Learning with Uncertainty - Gaussian Processes and Relevance Vector Machines (Tesi) (en anglès), 2004. 
  4. Jabbari, Mohammad Reza; Dorafshan, Mohammad Mahdi; Eslamian, Saeid. Chapter 22 - Relevance vector machine (RVM) (en anglès). Elsevier, 2023, p. 365–384. ISBN 978-0-12-821285-1.