Forum >> Programmazione Python >> Web e Reti >> Web scraping

Pagina: 1

Volevo gentilmente chiedere, come si può fare, magari con la libreria Scrapy, o Selenium; a prendere delle informazioni, quali: testo, ed immagini, di un sito web.
Grazie
Ciao caro. :birrame:

Volevo gentilmente chiedere, come si può fare, magari con la libreria Scrapy, o Selenium; a prendere delle informazioni, quali: testo, ed immagini, di un sito web.

Cosa ti serve sapere con esattezza? Quasi tutto quello che ti serve sapere lo trovi qui, punto di partenza obbligatorio.

Cya
import scrapy

class ExampleSpider(scrapy.Spider):
    name = 'example_spider'
    start_urls = ['https://www.example.com']  # Inserisci qui l'URL da cui fare scraping

    def parse(self, response):
        # Estrai il testo
        titolo = response.css('h1::text').get()  # Estrae il testo dell'elemento <h1>
        paragrafi = response.css('p::text').getall()  # Estrae tutti i testi nei paragrafi <p>

        # Estrai le immagini
        immagini = response.css('img::attr(src)').getall()  # Estrae gli URL delle immagini

        yield {
            'titolo': titolo,
            'paragrafi': paragrafi,
            'immagini': immagini
Hi!
For static sites , use Scrapy:
Install:pip install scrapyWrite a spider to extract text ( response.css('p::text')) and images ( response.css('img::attr(src)')).For dynamic sites , use Selenium:
Install:pip install seleniumUse a browser driver to load the page, then extract text ( element.text) and images ( img.get_attribute('src')).Choose Scrapy for speed and Selenium for handling JavaScript.


Thank you :)


Pagina: 1



Esegui il login per scrivere una risposta.