FAW MULTI è un tool che permette l’acquisizione automatica di un elenco di pagine web.

La barra superiore (Fig. 1) contiene i seguenti elementi:


Fig. 1

(1) Menu a discesa
mostra l’elenco degli URL delle pagine web che devono essere acquisite.

(2) Pulsante cancella URL
Con questo pulsante è possibile cancellare l’URL selezionato nel menù a discesa.

(3) Add web pages from file
Questo pulsante permette di importare un elenco di pagine web precedentemente salvate in un file xml.

(4) Add URL
Cliccando questo pulsante viene aperta una finestra in cui è possibile inserire un elenco di URL manualmente.

(5) Acquire
Pulsante per iniziare l’acquisizione automatica delle pagine contenute nell’elenco del menu a discesa.

(6) Stop
Interrompe il processo di acquisizione.

 

FAW MULTI può acquisire in automatico pagine web impostando anche l’altezza della Gold Box, un tempo di attesa iniziale, ed eventualmente eseguire due acquisizioni della stessa pagina ad un determinato intervallo (con le stesse modalità del tool FAW STOP).

Per automatizzare queste funzioni oltre all’URL della pagina da acquisire deve essere indicato anche l’altezza della pagina web da acquisire e due intervalli di tempo espressi in secondi.

Questi tre parametri sono così impostati:

https://www.testurl.com/contacts/,{p1},{p2},{p3}

 

Dove:

p1 = è l’altezza della pagina espressa in pixel

p2 = è il tempo dopo il quale inizia la prima acquisizione espresso in secondi

p3 = è il tempo dopo il quale inizia la seconda acquisizione espresso in secondi

Se i parametri p2 e p3 sono uguali verrà effettuata una sola acquisizione.

Se non viene indicato alcun parametro l’acquisizione della pagina web viene effettuata con l’altezza di default del browser e immediatamente al caricamento della stessa.

Ricordarsi che per eseguire una doppia acquisizione il tempo del parametro p3 deve essere sempre superiore al tempo del parametro p2 ed è consigliabile avere una differenza di almeno 30” (tempo necessario al software per acquisire tutti gli elementi della pagina prima di passare alla seconda acquisizione).

Il primo parametro di tempo p1 è riferito al termine di caricamento della pagina web, mentre il secondo parametro p2 è il tempo che deve trascorrere dal termine della prima acquisizione prima di iniziare la seconda.

Lo schema seguente (Fig. 2) mostra il funzionamento dei due parametri p1 e p2.

Fig. 2

Nell’esempio mostrato qui sopra p1 è stato impostato a 10 secondi, mentre p2 è impostato a 60 secondi. Il workflow di FAW MULTI è il seguente: dopo l’attesa di 10 secondi viene avviata la prima acquisizione che impiega 30 secondi, al termine dell’acquisizione inizia la seconda attesa di 60 secondi alla fine della quale viene eseguita la seconda acquisizione.

Da questo schema si può dunque capire che il tempo indicato dal parametro p2 inizia dal termine della prima acquisizione.

Se i parametri p1, p2 e p3 non vengono indicati, FAW MULTI li imposta a zero, in questo modo eseguirà l’acquisizione con l’altezza della Gold Box predefinita e immediatamente al termine di caricamento della pagina web.

L’inserimento degli URL da acquisire si può fare in due modi: inserendoli manualmente o importando il file xml generato dal tool FAW BOT.

 

Inserimento manuale degli URL da acquisire

Per inserire una lista di URL da acquisire in modo automatico cliccate sul pulsante [Add URL], si aprirà una finestra (Fig. 3) contenente un campo testo dove è possibile inserire tutti gli URL da acquisire, uno per ogni riga.


Fig. 3

Cliccate quindi sul pulsante [Validate], gli URL verranno verificati e se sono corretti si attiverà il pulsante [OK].

Se viene inserito un URL senza indicare il protocollo http o https, FAW MULTI lo completerà mettendoci davanti http:// – se avete la necessità di acquisire pagine con protocollo https dovete inserire un URL preceduto da https://.

A questo punto cliccando sul pulsante [OK] la lista degli URL verrà importata nel menù a discesa delle pagine che devono essere acquisite. Come si vede dalla Fig. 4 per ogni URL sono stati aggiunti i tre parametri descritti in precedenza.


Fig. 15

Ovviamente non avendo indicato i parametri p1, p2 e p3 il software di default li mette a zero.

 

Inserimento elenco URL da file XML

L’elenco degli URL da acquisire si può anche importare da un file XML cliccando sul pulsante [Add web pages from file].

Il file XML deve rispettare la struttura di quello generato dal tool FAW BOT; qui di seguito si riporta un esempio:

<?xml version="1.0" encoding="UTF-8"?>
<CrawlerResults>
<CrawlerResult>
<Height>Altezza Gold Box (pixel)</Height>
<Url>URL da acquisire<Url>
<TimeSecondsFrom>parametro p1 (secondi)</TimeSecondsFrom>
<TimeSecondsTo> parametro p2 (secondi)</TimeSecondsTo>
</CrawlerResult>
<CrawlerResult>
<Height>Altezza Gold Box (pixel)</Height>
<Url>URL da acquisire<Url>
<TimeSecondsFrom>parametro p1 (secondi)</TimeSecondsFrom>
<TimeSecondsTo> parametro p2 (secondi)</TimeSecondsTo>
</CrawlerResult>
</CrawlerResults>

 

Avvio delle acquisizioni

Una volta caricata la lista degli URL da acquisire è sufficiente cliccare sul pulsante [Acquire] per dare inizio alle acquisizioni automatiche.

Se per qualsiasi motivi è necessario fermare il processo di acquisizione si può premere il pulsante [Stop].