Interesujące linki [2021.01.09]
-
Web Scraping Sandbox stworzony przez Scrapinghub
Fikcyjna księgarnia, która desperacko chce być zeskrapowana. To bezpieczne miejsce dla początkujących uczących się we scrapingu, jak również dla deweloperów sprawdzających swoje umiejętności scrapingu
Dostępne na: books.toscrape.com
Strona, która wyświetla cytaty znanych ludzi. Ma wiele odmian strony, które pokazują cytaty na wiele różnych sposobów a każdy z nic stanowi nowe wyzwaniem. - Default - mikro dane i stronicowanie - Scroll - nieskończone stronicowanie podczas przewijania - JavaScript - zawartość generowana przez JavaScript - Delayed - jak w wersji JavaScript ale z opóźnieniem (?delay=10000) - Tableful - układ strony za pomocą tablic - Login - logowanie z tokenem CSRF (działa z dowolną parą user/passwd) - ViewState - formularz z fitrem opartym na AJAX z wykorzystaniem ViewStates - Random - pojedyńcza strona z losowym cytatem
Dostępne na: quotes.toscrape.com
-
An open source and collaborative framework for extracting the data you need from websites. In a fast, simple, yet extensible way. Maintained by Scrapinghub and many other contributors
Dokumentacja: Scrapy
-
Darmowy tutoriale Scrapy do nauki web scrapingu stworzone przez Scrapinghub
