Scrapy software | |
---|---|
Genere | Web Crawler (non in lista) |
Sviluppatore | Scrapinghub, Ltd. |
Data prima versione | 26 Giugno 2008 |
Ultima versione | 1.8.0 (28 Ottobre 2019) |
Sistema operativo | Microsoft Windows macOS Linux |
Linguaggio | Python |
Licenza | Licenza BSD (licenza libera) |
Sito web | scrapy.org |
Da non confondersi con Scrapie
Scrapy (/ˈskreɪpaɪ/ SKRAY-PEYE ) è un framework open source per web-crawling scritto in Python. Originariamente creato per web scraping può essere anche utilizzato per estrarre dati usando delle API oppure come un web-crawler general-purpose[1]. È mantenuto da Scrapinghub Ltd., uno sviluppatore di web-scrapers e compagnia di servizi.
L'architettura del progetto di Scrapy consiste in "ragni", che sono web-crawler che sono dati un set di istruzioni. Seguendo lo spirito di framework don't repeat yourself, come Django[2], rende semplice costruire e scalare progetti di crawling grandi, concedendo agli sviluppatori di riutilizzare il loro codice. Scrapy offre anche una shell per web-crawling, che può essere usata dagli sviluppatori per testare delle assunzioni su un comportamento di un sito[3]. Alcune compagnie conosciute utilizzano Scrapy come: Lyst[4][5], Parse.ly[6], Sayone Technologies[5], Sciences Po Medialab[7], Data.gov.uk.
Scrapy fu creato dalla compagnia francese Mydeco, dove fu sviluppato e mantenuto dagli impiegati di Mydeco e Insophia (una compagnia consulente in Montevideo, Uruguay). La prima versione pubblica venne rilasciata nell'agosto 2008 con la Licenza BSD, con il rilascio della versione 1.0 nel giugno 2015. Nel 2011, Scrapinghub divenne il mantenitore ufficiale[8][9].