La mineria de patrons seqüencials és un tema de mineria de dades que s'ocupa de trobar patrons estadísticament rellevants entre exemples de dades on els valors s'entreguen en una seqüència.[1][2] Normalment es pressuposa que els valors són discrets i, per tant, la mineria de sèries temporals està estretament relacionada, però normalment es considera una activitat diferent. La mineria de patrons seqüencials és un cas especial de mineria de dades estructurades.
Hi ha diversos problemes computacionals tradicionals clau abordats en aquest camp. Aquests inclouen la creació de bases de dades i índexs eficients per a la informació de la seqüència, l'extracció dels patrons que es produeixen amb freqüència, la comparació de seqüències per a la similitud i la recuperació dels membres de la seqüència que falten. En general, els problemes de mineria de seqüències es poden classificar com a mineria de cadenes que normalment es basa en algorismes de processament de cadenes i mineria de conjunts d'elements que normalment es basa en l'aprenentatge de regles d'associació. Els models de processos locals [3] estenen la mineria de patrons seqüencials a patrons més complexos que poden incloure eleccions (exclusives), bucles i construccions de concurrència a més de la construcció d'ordenació seqüencial.
La mineria de cadenes normalment tracta d'un alfabet limitat per als elements que apareixen en una seqüència, però la seqüència en si pot ser molt llarga. Exemples d'alfabet poden ser els del conjunt de caràcters ASCII utilitzats en el text en llenguatge natural, les bases de nucleòtids "A", "G", "C" i "T" en seqüències d'ADN o aminoàcids per a seqüències de proteïnes. En aplicacions de biologia, l'anàlisi de la disposició de l'alfabet en cadenes es pot utilitzar per examinar seqüències de gens i proteïnes per determinar-ne les propietats. Conèixer la seqüència de lletres d'un ADN o d'una proteïna no és un objectiu final en si mateix. Més aviat, la tasca principal és entendre la seqüència, en termes de la seva estructura i funció biològica. Això normalment s'aconsegueix primer identificant regions individuals o unitats estructurals dins de cada seqüència i després assignant una funció a cada unitat estructural. En molts casos, això requereix comparar una seqüència determinada amb les estudiades prèviament. La comparació entre les cadenes es complica quan es produeixen insercions, supressions i mutacions en una cadena.
Abouelhoda i Ghanem (2010) presenta una enquesta i taxonomia dels algorismes clau per a la comparació de seqüències per a la bioinformàtica, que inclou: [4]
Amb una gran variació de productes i comportaments de compra dels usuaris, la prestatgeria on es mostren els productes és un dels recursos més importants de l'entorn minorista. Els minoristes no només poden augmentar els seus beneficis, sinó també reduir els costos mitjançant una gestió adequada de l'assignació de l'espai de prestatge i la visualització dels productes. Per resoldre aquest problema, George i Binu (2013) han proposat un enfocament per a la mineria dels patrons de compra dels usuaris mitjançant l'algorisme PrefixSpan i col·locar els productes a les prestatgeries en funció de l'ordre dels patrons de compra extrets.[5]