spaCy është një librari softuerësh me burim të hapur për përpunim të avancuar të gjuhës natyrore, e shkruar në gjuhët e programimit Python dhe Cython . [1] [2] Libraria është botuar nën licencën MIT dhe zhvilluesit kryesorë të saj janë Matthew Honnibal dhe Ines Montani, themeluesit e kompanisë së softuerit Explosion.
Ndryshe nga NLTK, e cila përdoret gjerësisht për mësimdhënie dhe kërkime akademike, spaCy fokusohet në ofrimin e softuerit për përdorim në prodhim. [3] [4] spaCy gjithashtu mbështet rrjedhat e punës të mësimit të thellë që lejojnë lidhjen e modeleve statistikore të trajnuara nga libraritë e njohura të mësimit të makinerive si TensorFlow, PyTorch ose MXNet përmes librarisë së saj të mësimit të makinës, Thinc. [5] [6] Duke përdorur Thinc për backend-in e tij, spaCy përmban modele të rrjetit nervor të thurur për etiketimin e pjesës së të folurit, shkoqitjen e varësisë, kategorizimin e tekstit dhe njohjen e entitetit të emërtuar (NER) . Modelet e parandërtuara të rrjetave nervore statistikore për të kryer këto detyra janë të gatshme në 23 gjuhë mes të tjerave anglisht, portugalisht, spanjisht, rusisht dhe kinezisht, dhe ekziston gjithashtu një model NER shumë-gjuhësh. Mbështetja shtesë për tokenizimin për më shumë se 65 gjuhë i lejon përdoruesit të trajnojnë modelet e personalizuara edhe në grupet e tyre të të dhënave. [7]
spaCy vjen me disa shtesa dhe vizualizime që janë të gatshme si librari falas, me burim të hapur :
{{cite web}}
: Mungon ose është bosh parametri |language=
(Ndihmë!)
{{cite journal}}
: Mungon ose është bosh parametri |language=
(Ndihmë!)
{{cite web}}
: Mungon ose është bosh parametri |language=
(Ndihmë!)
{{cite web}}
: Mungon ose është bosh parametri |language=
(Ndihmë!)
{{cite web}}
: Mungon ose është bosh parametri |language=
(Ndihmë!)