Секвенцијално претраживање је тема анализе података усмерена ка проналажењу статистички релевантних образаца између примера података где су подаци достављени у секвенци.[1] Обично се претпоставља да су вредности дискретне, тако да анализа временских серија (енгл. time series) тесно повезана, али обично сматрана за другчију активност. Секвенцијално претраживање је специјалан вид структурне анализе података. Постоје неколико кључних традиционалних рачунарских проблема везана за ово поље. Она укључују израду ефикасних база података и индекса за секвенце информација, издвајање образаца који се често извршавају, поређење сличности секвенци, и повратити недостајале чланове секвенци. Генерално, проблеми секвенцијалне анализе се могу сврстати као анализирање ниски које је обично засновано на алгоритмима за обраду ниски и анализу колекције ставки која је обично заснована на асоцијативном учењу по правилима.
Анализа ниски се обично бави ограниченим алфабетом за објекте који се појављују у низу, али сам низ обично може бити веома дугачак. Примери алфабета могу бити у ASCII сету знакова који се користе у природним језичким текстовима, нуклеотида базе „А“,“Г“, „Ц“ и „Т“ ДНК низу или амино-киселине у протеинским низовима. У биологији апликационе анализе распореда алфабета у нискама могу се користити да испитају генетске и протеинске низове како би им се одредиле особине. Познавање низа слова ДНК протеина није коначан циљ сам по себи. Уместо тога, главни задатак је разумети низ, у смислу структуре и биолошке функције. Ово се обично постиже најпре идентификацијом појединачне регионе или структурне јединице сваког низа и затим додељивањем функције свакој структурној јединици. У многим случајевима ово захтева упоређивање датог низа са претходно проучаваним низовима. Упоређивање ниски постаје компликованије када се убацивање, брисање и мутација појаве у ниски.
Истраживање и класификација кључних алгоритама за поређење низова за биоинформатику је представљено од стране Абуелхода и Ганема(2010), које укључује:[2]
Неке проблеме у секвенцијалној анализи откривају честе колекције стваки и ред у коме се јављају, на пример, неко тражи правила форме "ако {муштерија купу кола}, он или она ће вероватно {купити осигурање} у року од недељу дана", или у контексту цена берзе, " Ако це {Нокија и Ериксон унапреде}, веома је вероватно да ће се {Моторола и Самсунг унапредити} у року од 2 дана“. Традиционално, анализа колекције ставки се користи у трговинским апликацијама за откривање правилности између учесталих истовремених изврашавања ставки у великим трансакцијама. На пример, анализирањем трансакција или муштеријине корпе за куповину у продавници, може се извести правило које каже "ако муштерија купи црни лук и кромпир заједно, он или она ће вероватно купити месо за пљескавице у истој куповини.
Истраживање кључних алгоритама за колекције ставки је представљено од стране "Han et al." (2007).[3]
Две честе технике које се примењују секвенцама база података за учесталу анализу колекција ставки су утицајни "априори" алгоритми и скорија {јез-енг|FP-Growth}} техника.
Традиционална секвенцијална анализа образаца је уређена укључујући и нека ограничења и неко понашање. Џорџ и Бину (2012) су интегрисали три значајна маркетиншка сценарија за анализу промотивно-оријентисаних секвенцијалних образаца.[4] Промотивно засновани тржишни сценарији у свом истраживању узимају у обзир 1) Пад производа, 2) Ревизију производа и 3) Пуштање у промет производа енгл. DRL(Downturn-Revision-Launch). Разматрањем овога, они су развили енгл. DRL-Prefix Span алгоритам (израђен од Prefix Span) за анализирање DRL образаца свих дужина.
Са великим варијацијама производа и одлика купаца, полица на којој је производ постављен је једна од најважнијих ствари у трговинском окружењу. Трговци не само да могу да повећају сопствен добит него, такође могу да снизе цену се правилним управљањем обезбеђеног простора на полицама и излагањем производа. Да би решио овај проблем, Џорџ и Бину (2013) су предложили приступ да анализирају корисничке обрасце куповине користећи енгл. PrefixSpan алгоритме и смештају производе на полице у односу на анализу образаца куповине.[5]
Commonly used algorithms include:
Имплементација