Υπευθ. ανάπτυξης | Zyte (πρώην Scrapinghub) | |
---|---|---|
Aρχική έκδοση | 26 Ιουνίου 2008 | |
Σταθερή έκδοση | 2.6.1[1]
/ 1 Μαρτίου 2022
| |
Αποθετήριο | ||
Γραμμένο σε | Python | |
Λειτουργικό σύστημα | Windows, macOS, Linux | |
Κατηγορία | Web crawler | |
Άδεια Λογισμικού | BSD | |
Ιστοσελίδα | scrapy.org |
Το Scrapy (SKRAY-peye ) είναι ένα δωρεάν και ανοιχτού κώδικα πλαίσιο λογισμικού για ανίχνευση ιστοσελίδων γραμμένο σε Python. Αρχικά σχεδιασμένο για απόξεση ιστού, μπορεί επίσης να χρησιμοποιηθεί για εξαγωγή δεδομένων χρησιμοποιώντας API ή ως πρόγραμμα ανίχνευσης ιστού γενικής χρήσης. [2] Αυτή τη στιγμή διατηρείται από τη Zyte πρώην Scrapinghub, μια εταιρεία ανάπτυξης και υπηρεσιών web-scraping.
Η αρχιτεκτονική του Scrapy project είναι ανεπτυγμένη γύρω από "αράχνες", οι οποίες είναι αυτόνομα ερπυστριοφόρα προγράμματα που λαμβάνουν ένα σύνολο οδηγιών. Διευκολύνει τη δημιουργία και την κλιμάκωση μεγάλων έργων ανίχνευσης, επιτρέποντας στους προγραμματιστές να επαναχρησιμοποιήσουν τον κώδικά τους.
Το πλαίσιο Scrapy παρέχει ισχυρές δυνατότητες, όπως auto-throttle , περιστρεφόμενους διακομιστές μεσολάβησης και πράκτορες χρήστη, επιτρέποντάς το σχεδόν απαρατήρητο scraping στο διαδίκτυο. Το Scrapy παρέχει επίσης ένα κέλυφος ανίχνευσης ιστού, το οποίο μπορεί να χρησιμοποιηθεί από προγραμματιστές προκειμένου να δοκιμάσουν τυχούσες υποθέσεις τους σχετικά με τη συμπεριφορά ενός ιστότοπου. [3]
Κάποιοι δημοφιλείς οργανισμοί και προϊόντα που χρησιμοποιούν το Scrapy είναι: Lyst, [4] [5] Parse.ly, [6] Sayone Technologies, [7] Sciences Po Medialab, [8] Data.gov.uk 's World Government Data Data . [9] [1] Αρχειοθετήθηκε 2018-08-16 στο Wayback Machine.