NOME

perlthrtut - tutorial sui thread in Perl

DESCRIZIONE

NOTA: questo tutorial descrive il nuovo stile di threading introdotto con il Perl 5.6.0, i cosiddetti thread dell'interprete o ithreads per brevità. In questo modello ogni thread viene eseguito nel suo personale interprete Perl, e ogni convidisione di dati tra i thread deve essere esplicita.

C'è un altro stile di threading, chiamato il modello 5.005, che, come è facile immaginare, appartiene alla versione 5.005 del Perl, ed è dunque più vecchio. Questo vecchio modello ha dei problemi, è sconsigliato, e sarà probabilmente rimosso intorno alla versione 5.10. Siete fortemente incoraggiati a migrare qualsiasi codice esistente basato sui thread 5.005 al nuovo modello il prima possibile.

Potete vedere quale stile di threading avete (se lo avete) lanciando perl -V e guardando nella sezione Platform. Se avete useithreads=define allora avete ithread, se avete use5005threads=define allora avete i thread 5.005. Se non avete nessuno dei due, il vostro interprete Perl non è compilato con alcun supporto per i thread. Se avete entrambi, siete nei guai.

L'interfaccia utente dei thread 5.005 si serviva della classe Threads, mentre gli ithread usano la classe threads. Notate il cambiamente da maiuscolo a minuscolo (NdT: della prima lettera).

Stato

Il codice degli ithread è disponibile sin dal Perl 5.6.0, ed è considerato stabile. L'interfaccia utente agli ithread (le classi threads) è apparsa nella release 5.8.0, ed al momento è considerata stabile, anche se andrebbe maneggiata con cura come tutte le nuove caratteristiche.

Comunque, Cos'è Un Thread?

Un thread è un flusso di controllo attraverso un programma con un singolo punto di esecuzione.

Suona molto simile ad un processo, no? Beh, deve. I thread sono uno dei pezzi di uno processo. Ogni processo ha almeno un thread e, fino adesso, ogni processo in cui veniva eseguito Perl aveva solo un thead. Con la versione 5.8, tuttavia, potete creare dei thread aggiuntivi. Ora vi diremo come, quando, e perché.

Modelli Di Programma Threaded

Ci sono tre modi fondamentali in cui potete strutturare un programma threaded. Il modello che sceglierete dipende da cosa vi serve che il vostro programma faccia. Per molti programmi threaded non banali dovrete scegliere diversi modelli per le diverse parti del vostro programma.

Capo/Operaio

Il modello capo/operaio ha solitamente un thread `capo' e uno o più thread `operai'. Il thread capo raccoglie o genera i compiti che devono essere fatti, e poi consegna quei compiti al thread operaio appropriato.

Questo modello è comune in programmi che fanno da server o che creano una GUI, nei quali un thread principale attende per qualche evento e poi trasmette tale avento al thread operaio appropriato affinché venga processato. Una volta che l'evento è stato trasmesso, il thread capo torna ad attendere un altro evento.

Il thread capo lavora relativamente poco. Mentre i compiti non sono per forza eseguiti più velocemente che con un qualsiasi altro metodo, questo tende ad avere i migliori tempi di risposta all'utente.

Gruppo di Lavoro

Nel modello del gruppo di lavoro, vengono creati svariati thread che essenzialmente fanno la stessa cosa su dati diversi. Assomiglia da vicino all'elaborazione parallela classica ed ai processori vettoriali, dove un grande array di processori fa esattamente la stessa cosa su molti dati diversi.

Questo modello è particolarmente utile se il sistema su cui viene eseguito il programma distribuisce i vari thread su diversi processori. Può inoltre essere utile in motori di ray tracing o di rendering, dove i thread individuali possono trasmettere risultati intermedi per fornire all'utente un riscontro visivo.

Pipeline

Il modello a pipeline divide un compito in una serie di passi, e trasmette i risultati di un passo al thread che si occupa di quello successivo. Ogni thread fa una cosa a ciascun dato e trasmette i risultati al successivo thread sulla linea.

Questo modello ha senso soprattutto se si hanno a disposizione più processori, cosicché uno o più thread verranno eseguiti in parallelo, anche se spesso ha senso anche in altri contesti. Questo modello tende a mantenere i compiti indivisuali piccoli e semplici, e a permettere ad alcune parti della pipeline di bloccarsi (ad esempio per via dell'IO o di chiamate di sistema) mentre altre parti continuano la loro esecuzione. Se fate eseguire diverse parti della pipeline su processori diversi potete anche avvantaggiavi della cache di ciascun processore.

Questo modello è inoltre comodo per una forma di programmazione ricorsiva dove, anziché avere una subroutine che chiama se stessa, se ne ha uno che crea un altro thread. Sia i generatori di numeri primi che quelli di serie di Fibonacci si avvantaggiano molto di questo modello a pipeline. (Più tardi verrà presentato un programma che genera numeri primi.)

Thread Nativi

Esistono molti metodi diversi per implementare i thread su un sistema. Il modo in cui i thread sono implementati dipende sia dal venditore sia, in alcuni casi, dalla versione del sistema operativo. Spesso la prima implementazione è relativamente semplice, ma versioni successive del sistema operativo sono più sofisticate.

Benché le informazioni di questa sezione siano utili, non sono necessarie, quindi le potete saltare se non avete voglia di leggerle.

Ci sono tre categorie di base per i thread: thread utente, thread del kernel, e thread del kernel multiprocessore.

I thread utente sono thread che vivono interamente in un programma e nelle sue librerie. Con questo modello, il Sistema Operativo non sa nulla dei thread. Per quanto lo riguarda, il vostro processo è semplicemente un processo.

Questa è la via più semplice per implementare i thread, ed è la via che imboccano molti sistemi operativi. Il grande svantaggio è che, siccome il sistema operativo non conosce nulla dei thread, se uno di essi si blocca allora si bloccano tutti. Le tipiche attività di blocco includono la maggior parte delle chiamate di sistema, la quasi totalità dell'I/O, e cose come sleep().

I thread del kernel costituiscono il passo successivo nell'evoluzione dei thread. Il sistema sperativo è a conoscenza dei thread del kernel, e fa concessioni ad essi. La differenza principale tra un thread del kernel e uno utente è il blocco. Con i thread del kernel, ciò che blocca un singolo thread non blocca gli altri. Non è questo il caso con i thread utente, dove il kernel blocca a livello di processo e non a livello di thread.

Questo è un grande passo in avanti, e può fornire ad un programma threaded un bell'incremento prestazionale rispetto ai programmi non threaded. I thread che si bloccano poiché fanno dell'I/O, ad esempio, non bloccano i thread che stanno facendo altro. Tuttavia, ogni processo ha comunque un thread alla volta in esecuzione, indipendentemente da quante CPU un sistema può avere.

Dal momento che il threading del kernel può interrompere un kernel in qualsiasi momento, verranno allo scoperto alcune delle assunzioni implicite relative al locking che potreste fare nei vostri programmi. Ad esempio, qualcosa di semplice come $a = $a + 2 può comportarsi in maniera imprevedibile con i thread del kernel se $a è visibile per gli altri thread, in quanto un altro thread può aver cambiato $a nel tempo compreso tra quando il suo valore è stato ottenuto nella parte destra dell'espressione e quando il nuovo valore è stato memorizzato.

I thread del kernel multiprocessore rappresentano in passo finale nel supporto ai thread. Con i thread del kernel multiprocessore, su una macchina con CPU multiple, il sistema operativo può programmare uno o più thread affinché vengano eseguiti contemporaneamente su CPU diverse.

Ciò può fornire un importante incremento di prestazioni al vostro programma threaded, dato che più di un thread verrà eseguito nello stesso momento. Come pegno da pagare, tuttavia, faranno la loro tragica comparsa tutte quelle fastidiose questioni di sincronizzazione che potevano non essersi presentate con i normali thread del kernel.

I sistemi con multitasking cooperativo richiedono che i thread cedano il controllo se accade qualcosa. Se un thread chiama una yield function, cede il controllo. Lo cede anche se fa qualcosa che ne causerebbe il blocco, come fare dell'I/O. In un'implementazione cooperativa del multitasking, un thread, se lo desidera, può causare starvation a tutti gli altri per quanto riguarda il tempo della CPU.

I sistemi con multitasking preempitivo interrompono i thread ad intervalli regolari mentre il sistema decide quale sarà il prossimo thread a dover eseguire. In un sistema di multitasking preempitivo, di solito un thread non monopolizza la CPU.

Su alcuni sistemi, ci possono essere thread cooperativi e preempitivi che vengono eseguiti simultaneamente. (I thread con priorità di tempo reale spesso si comportano cooperativamente, per esempio, mentre i thread con priorità normali si comportano preempitivamente.)

Che tipo di thread sono i thread del Perl?

Se avete esperienza con altre implementazioni dei thread, potreste notare che le cose non sono esattamente come ve le aspettavate. Quando si lavora con i thread in Perl, è molto importante ricordare che i Thread Perl Non Sono I Thread X, qualunque valore X possa assumere. Non sono thread POSIX, o DecThreads, o thread Green di Java, o thread Win32. Ci sono affinità, ed il concetto generale è lo stesso, ma se iniziate a cercare i dettagli dell'implementazione rimarrete delusi oppure confusi. Probabilmente entrambe le cose.

Ciò non significa che i thread Perl sono completamente differenti da qualsiasi cosa esistita prima--non lo sono. Il modello di threading del Perl deve molto ad altri modelli, soprattutto il POSIX. Tuttavia, così come Perl non è C, i thread Perl non sono thread POSIX. Dunque, se vi ritrovate a cercare mutex, o priorità dei thread, è il momento di tornare un po' indietro e pensare a cosa volete fare e a come Perl può farlo.

È in ogni caso importante ricordare che i thread Perl non possono fare le cose magicamente a meno che i thread del vostro sistema operativo non lo permettano. Quindi, se il vostro sistema blocca l'intero processo in caso di chiamata a sleep(), di solito così farà anche il Perl.

I Thread Perl Sono Diversi.

Moduli Thread-Safe

L'aggiunta dei thread ha cambiato sostanzialmente gli internal del Perl. Ciò porta a conseguenze per le persone che scrivono moduli con codice XS per librerie esterne. Comunque, dato che i dati del perl non sono condivisi di default tra i thread, i moduli Perl hanno una grossa chance di essere thread-safe (NdT: compatibili con il threading) o di poterlo diventare facilmente. I moduli non marcati come thread-safe devono essere testati oppure riveduti prima di essere usati nel codice da rilasciare.

Non tutti i moduli che potreste usare sono thread-safe, e dovreste sempre assumere che un modulo non lo sia, a meno che la documentazione non dica diversamente. Questa considerazione include i moduli distribuiti direttamente con l'interprete. I thread sono una caratteristica nuova, e persino alcuni dei moduli standard non sono thread-safe.

Anche se un modulo è thread-safe, ciò non significa che esso sia ottimizzato per lavorare bene con i thread. Un modulo potrebbe essere riscritto per utilizzare le nuove caratteristiche disponibili nel Perl threaded così da aumentare le prestazioni in un ambiente threaded.

Se per qualche ragione state usando un modulo non thread-safe, potete proteggervi utilizzandolo unicamente da un thread. Se avete bisogno di più thread da cui accedere a tale modulo, potete utilizzare i semafori e molta disciplina di programmazione per controllare l'accesso ad esso. I semafori sono trattati in "Semafori semplici".

Consultate inoltre "Thread-Safety Delle Librerie Di Sistema".

Concetti Di Base Sui Thread

Il core module threads fornisce le funzioni di base necessari per scrivere programmi threaded. Nelle prossime sezioni tratteremo i concetti di base, spiegandovi di cosa avete bisogno per creare un programma threaded. Fatto questo, passeremo alle caratteristiche del modulo threads che rendono la programmazione threaded più facile.

Supporto Di Base Ai Thread

Il supporto ai thread è un'opzione di compilazione del Perl - è qualcosa che è che attivato o disattivato quando il Perl è compilato sul vostro sistema, piuttosto che quando i vostri programmi sono compilati. Se il vostro Perl non è stato compilato con il supporto ai thread attivato, allora qualsiasi tentativo di usare i thread fallirà.

I vostri programmi possono servirsi del modulo Config per controllare se i thread sono attivati. Se il vostro programma non può funzionare senza di essi, potete tentare qualcosa come:

$Config{useithreads} or die "Ricompila il Perl con i thread per eseguire questo programma.";

Un programma forse-threaded che usa un modulo forse-threaded può avere codice come questo:

use Config;
use MyMod;

BEGIN {
    if ($Config{useithreads}) {
       # Abbiamo i thread
       require MyMod_threaded;
       import MyMod_threaded;
    } else {
       require MyMod_unthreaded;
       import MyMod_unthreaded;
    }
}

Dato che il codice che viene eseguito sia con i thread che senza è di solito piuttosto confuso, è meglio isolare il codice specifico per i thread in un suo modulo. Nel nostro esempio qua sopra, questo è il motivo per cui MyMod_threaded esiste, ed è importato solo se il programma è in esecuzione su un Perl threaded.

Una Nota Sugli Esempi

Benché il supporto ai thread sia considerato stabile, ci sono ancora alcune bizzarrie che possono sorprendervi quanto provate uno degli esempi riportati sotto. In una situazione reale è necessario assicurarsi che tutti i thread abbiano terminato l'esecuzione prima di uscire dal programma. In questi esempi <B>non ci si è assicurati di ciò a favore di una maggiore semplicità. L'esecuzione di questi esempi 'così come sono' produrrà messaggi di errore, solitamente causati dal fatto che ci sono ancora thread in esecuzione quando il programm esce. Non dovrete allarmarvi di ciò. Versioni future del Perl potrebbero correggere questo errore.

Creazione Di Thread

Il package threads fornisce gli strumenti necessari per creare nuovi thread. Come per qualsiasi altro modulo, dovete dire al Perl che lo volete usare. use threads importa tutti i pezzi di cui avete bisogno per creare thread di base.

La via più breve e semplice per creare un thread prevede l'uso di new():

use threads; 

$thr = threads->new(\&sub1);

sub sub1 { 
    print "Nel thread\n"; 
}

Il metodo new() prende una reference ad una subroutine e crea un nuovo thread, che inizia l'esecuzione nella subroutine passata. Il controllo poi passa sia alla subroutine che al chiamante.

Se ne avete bisogno, il vostro programma può passare parametri alla subroutine come parte dell'avvio del thread. È sufficiente includere la lista dei parametri come parte della chiamata a threads::new, come di seguito:

use threads; 

$Param3 = "foo"; 
$thr = threads->new(\&sub1, "Param 1", "Param 2", $Param3); 
$thr = threads->new(\&sub1, @ParamList); 
$thr = threads->new(\&sub1, qw(Param1 Param2 Param3));

sub sub1 { 
    my @InboundParameters = @_; 
    print "Nel thread\n"; 
    print "parametri ricevuti >", join("<>", @InboundParameters), "<\n"; 
}

L'ultimo esempio illustra un'altra caratteristica dei thread. Potete creare molti thread utilizzando la stessa subroutine. Ogni thread esegue la stessa subroutine, ma in un thread diverso con ambiente diverso e parametri potenzialmente diversi.

create() è un sinonimo di new().

Cedere il controllo

Ci sono momenti in cui può essere utile far si che un thread ceda esplicitamente la CPU ad un altro. Il vostro package di threading potrebbe non supportare il multitasking preempitivo per i thread, per esempio, oppure potreste trovarvi a fare qualche cosa di processor-intensive (NdT: che occupa molto tempo del processore) e quindi volete assicurarvi che il thread dell'interfaccia utente sia chiamato frequentemente. In ogni caso, ci sono momenti in cui potreste desiderare che un thread ceda il processore.

A questo scopo il package di threading del Perl fornisce la funzione yield(). yield() è piuttosto semplice, e funziona così:

    use threads; 

    sub loop {
	    my $thread = shift;
	    my $foo = 50;
	    while($foo--) { print "nel thread $thread\n" }
	    threads->yield;
	    $foo = 50;
	    while($foo--) { print "nel thread $thread\n" }
    }

    my $thread1 = threads->new(\&loop, 'first');
    my $thread2 = threads->new(\&loop, 'second');
    my $thread3 = threads->new(\&loop, 'third');

È importante ricordare che yield() è solamente un suggerimento a cedere la CPU. Ciò che accade realmente dipende dal vostro hardware, sistema operativo e librerie di threading. È pertanto importante notare che non bisognerebbe costruire lo scheduling (NdT: programmazione temporale) dei thread attorno alle chiamate a yield(). Potrebbe funzionare sul vostro sistema ma non funzionerà su un altro.

Attendere L'Uscita Di Un Thread

Dato che i thread sono anche subroutine, possono ritornare del valori. Per attendere l'uscita di un thread e per estrarre i valori che potrebbe tornare, potete usare il metodo join:

use threads; 

$thr = threads->new(\&sub1);

@ReturnData = $thr->join; 
print "Il thread ha ritornato @ReturnData"; 

sub sub1 { return "Fifty-six", "foo", 2; }

Nell'esempio di cui sopra, il metodo join() ritorna quando il thread finisce. Oltre ad attendere la fine del thread e raccogliere i valori che esso potrebbe aver ritornato, join() effettua anche le operazioni di pulizia del sistema operativo necessario per il thread. Tale pulizia può essere improtante, specialmente per programmi di lunga esecuzione che creano molti thread. Se non desiderate i valori di ritorno e non volete attendere la fine del thread, dovete invece chiamare il metodo detach(), come spiegato di seguito.

Ignorare Un Thread

join() fa tre cose: attende l'uscita di un thread, effettua le necessarie operazioni di pulizia dopo essa, e ritorna qualsiasi dato che il thread può aver prodotto. Ma se non siete interessati ai valori di ritorno, e non vi interessa quando il thread finisce? Tutto ciò che volete è che vengano effettuate le operazioni di pulizia quando l'esecuzione è finita.

In questo caso, dovete usare il metodo detach(). Una volta che un thread è detached (NdT: separato), sarà eseguito sino alla fine, e poi Perl effettuerà automaticamente le operazioni di pulizia.

use threads; 

$thr = threads->new(\&sub1); # Crea il thread

$thr->detach; # Ora ufficialmente non ci interessa piE<ugrave>

sub sub1 {
    $a = 0; 
    while (1) { 
        $a++; 
        print "\$a E<egrave> $a\n"; 
        sleep 1; 
    } 
}

Una volta che un thread è separato, non può più essere unito chiamando join(), ed ogni dato di ritorno che esso possa aver prodotto (come se fosse stato fatto ed in attesa di essere unito) viene perso.

Thread E Dati

Ora che abbiamo trattato le basi dei thread, è tempo del nostro nuovo argomento: i dati. I thread introducono un paio di complicazioni per quanto riguarda l'accesso ai dati, di cui i programmi non-threaded non hanno mai bisogno di preoccuparsi.

Dati Condivisi E Non Condivisi

La più grande differenza tra gli ithreads di Perl ed il vecchio threading 5.005 o, se è per questo, la maggior parte degli altri sistemi di threading disponibili, è che di default nessun dato viene condiviso. Quando viene creato un nuovo thread perl, tutti i dati associati al thread corrente vengono copiati in quello nuovo, e diventano privati per il nuovo thread! Questo comportamente è simile a quello che si ha con il fork dei processi sotto UNIX, tranne che in questo caso i dati sono semplicemente copiati in una diversa zona della memoria aoppartenente allo stesso processo invece che avvenga un vero forking.

Per usare il threading, comunque, one di solito desidera che i thread condividano almeno alcuni dati tra loro. Ciò si ottiene con il modulo threads::shared e l'attributo : shared.

use threads;
use threads::shared;

my $foo : shared = 1;
my $bar = 1;
threads->new(sub { $foo++; $bar++ })->join;

print "$foo\n";  #stampa 2 poichE<eacute> $foo E<egrave> condiviso
print "$bar\n";  #stampa 1 poichE<eacute> $foo non E<egrave> condiviso

Nel caso di un array condiviso, tutti i suoi elementi vengono condivisi, e per un hash condiviso, tutto le chiavi ed i valori vengono condivisi. Ciò pone delle restrizioni a cosa può essere assegnato agli elementi di un array e di un hash condiviso: solo valori semplici o reference a variabili condivise sono permessi - questo è necessario in modo che una variabile private non possa diventare condivisa per errore. Un assegnamento errato causerà la morte del thread. Per esempio:

    use threads;
    use threads::shared;

    my $var           = 1;
    my $svar : shared = 2;
    my %hash : shared;

    ... crea alcuni thread ...

    $hash{a} = 1;	# tutti i thread vedono exists($hash{a})
			# e $hash{a} == 1
    $hash{a} = $var	# okay - copia-per-valore: stesso effetto di prima
    $hash{a} = $svar	# okay - copia-per-valore: stesso effetto di prima
    $hash{a} = \$svar	# okay - una reference ad una variabile condivisa
    $hash{a} = \$var	# Questo causa la morte del thread
    delete $hash{a}	# okay - tutti i thread vedranno !exists($hash{a})

Notate che una variabile condivisa garantisce che se due o più thread tentano di modificarla nello stesso momento, lo stato interno della variabile non subirà danni. Comunque, non ci sono garanzie a parte questa, come speigato nella prossima sezione.

Insidie dei Thread: Race

Sebbene i thread portino una serie di nuovi ed utili tool, portano anche un certo numero di insidie. Una di esse è la race condition:

use threads; 
use threads::shared;

my $a : shared = 1; 
$thr1 = threads->new(\&sub1); 
$thr2 = threads->new(\&sub2); 

$thr1->join;
$thr2->join;
print "$a\n";

sub sub1 { my $foo = $a; $a = $foo + 1; }
sub sub2 { my $bar = $a; $a = $bar + 1; }

Cosa pensate che conterrà $a? La risposta, sfortunatamente, è "dipende". Sia sub1() che sub2() accedono alla variabile globale $a, una volta per leggerla ed una volta per scriverla. In base di fattori che vanno dall'algoritmo di scheduling dell'implementazione dei vostri thread alle fasi della luna, $a può valere 2 o 3.

Le race condition sono causate da un accesso non sincronizzato ai dati condivisi. Senza esplicita sincronizzazione, non c'è modo di essere sicuri che niente sia successo ai dati condivisi nel tempo trascorso tra quando si accede ad essi e quando li si aggiorna. Persino questo semplice frammento di codice può essere soggetto all'errore:

use threads; 
my $a : shared = 2;
my $b : shared;
my $c : shared;
my $thr1 = threads->create(sub { $b = $a; $a = $b + 1; }); 
my $thr2 = threads->create(sub { $c = $a; $a = $c + 1; });
$thr1->join;
$thr2->join;

I due thread accedono entrambi a $a. Ciascun thread può potenzialmente essere interrotto a qualsiasi punto, o eseguito in qualsiasi order. Alla fine, $a potrebbe contenere 3 o 4, e sia $b che $c possono contenere 2 o 3.

Non è nemmeno garantito che $a += 5 or $a++ siano operazioni atomiche.

Quando il vostro programma accede a dati o risorse che possono essere acceduti da altri thread, dovete prendere delle misure per coordinare tale accesso, o rischierete dati inconsistenti e race condition. Notate che Perl protegge i suoi internal dalle vostre race condition, ma non proteggerà voi da voi stessi.

Sincronizzazione e controllo

Perl fornisce una serie di meccanismi per coordinare le interazioni tra loro stessi ed i loro dati, per evitare race condition e cose simili. Alcuni di questi sono progettati per somigliare alle tecniche comuni usate nelle librerie di thread come pthreads; altri sono specifici del Perl. Spesso, le tecniche standard sono mal costruite e difficile da utilizzare correttamente (come ad esempio le condition wait). Ove possibile, è solitamente più facile usare le tecniche specifiche del Perl, come le code, che rimuovono parte del duro lavoro implicato.

Controllare l'accesso: lock()

La funzione lock() prende una variabile condivisa e mette un lock (NdT: lucchetto) su di essa. Nessun altro thread può mettere un lock sulla variabile finché il thread che ha messo il primo lock non lo toglie. Il lock viene tolto automaticamente quando il thread che lo ha messo esce dal blocco più esterno contenente la funzione lock(). L'uso di lock() è semplice: in questo esempio ci sono molti thread che svolgono alcuni calcoli in parallelo, ed occasionalmente aggiornano un totale corrente:

    use threads;
    use threads::shared;

    my $total : shared = 0;

    sub calc {
	for (;;) {
	    my $result;
	    # (... esegue alcuni calcoli ed imposta $result ...)
	    {
		lock($total); # blocca finchE<eacute> non otteniamo il lock
		$total += $result;
	    } # lock rilasciato implicitamente a fine scope
	    last if $result == 0;
	}
    }

    my $thr1 = threads->new(\&calc);
    my $thr2 = threads->new(\&calc);
    my $thr3 = threads->new(\&calc);
    $thr1->join;
    $thr2->join;
    $thr3->join;
    print "total=$total\n";

lock() blocca il thread fino a quando la variabile su cui si vuole porre il lock non è disponibile. Quando lock() ritorna, il vostro thread può essere sicuro che nessun altro thread può mettere un lock su quella variabile finché il blocco più esterno contenete lock() esce.

È importante notare che i lock non prevengono l'accesso alla variabile in questione, ma solo i tentativi di metterci un lock. Questo è in accordo con la lunga tradizione del Perl di programmazione cortese, e con il file locking consultivo che flock() vi offre.

Così come sugli scalari, potete mettere il lock anche su array ed hash. Mettere il lock su un array, tuttavia, non bloccherà successivi lock sugli elementi dell'array, ma solo sull'array stesso.

I lock sono ricorsivi, il che significa che ad un thread è permesso effettuare il lock di una variabile più di una volta. Il lock durerà finché il più esterno lock() sulla variabile non va fuori dallo scope. Per esempio:

    my $x : shared;
    doit();

    sub doit {
	{
	    {
		lock($x); # attende il lock
		lock($x); # NOOP - abbiamo giE<agrave> il lock
		{
		    lock($x); # NOOP
		    {
			lock($x); # NOOP
			lockit_some_more();
		    }
		}
	    } # *** unlock implicito qui ***
	}
    }

    sub lockit_some_more {
	lock($x); # NOOP
    } # qui non succede nulla

Va notato che non esiste alcuna funzione unlock() - l'unico modo per togliere il lock da una variabile e di permettergli di finire fuori dallo scope.

Un lock può sia essere usato per proteggere i dati contenuti nella variabile su cui è posto, oppure può essere utilizzato proteggere qualcos'altro, come una sezione di codice. In quest'ultimo caso, la variabile in questione non contiene alcun dato utile, ed esiste solo perché vi sia posto il lock. In questo caso, la variabile si comporta come i mutex ed i semafori semplici delle librerie di thread tradizionali.

Un'Insidia Dei Thread: Stallo

I lock sono un pratico strumento per sincronizzare l'accesso ai dati, ed utilizzarli correttamente è la chiave verso dei dati condivisi in maniera sicura. Sfortunatamente, i lock non sono privi dei loro pericoli, specialmente quando sono coinvolti lock multipli. Considerate il seguente codice:

use threads; 

my $a : shared = 4; 
my $b : shared = "foo"; 
my $thr1 = threads->new(sub { 
    lock($a); 
    threads->yield; 
    sleep 20; 
    lock($b); 
}); 
my $thr2 = threads->new(sub { 
    lock($b); 
    threads->yield; 
    sleep 20; 
    lock($a); 
});

Questo programma probabilmente si bloccherà finché non lo uccidete. L'unico caso in cui non si bloccherà è se uno dei thread riesce ad ottenere entrambi i lock per primo. Una versione della quale il bloccarsi sia garantito è più complessa, ma il principio è lo stesso.

Il primo thread pone un lock su $a e poi, dopo una pausa durante la quale il secondo thread ha probabilmente avuto il tempo di fare del lavoro, prova a porre un lock su $b. Nel frattempo, il secondo thread pone un lock su $b, e più tardi prova a porne uno su $a. Per entrambi i thread, il secondo tentativo di lock causa il loro blocco, in quanto ciascuno attende che l'altro tolga il lock.

Questa condizione è chiamata stallo, e capita quando due o più thread cercano di ottenere dei lock su risorse che appartengono agli altri. Ogni thread si blocca, attendendo che l'altro tolga il lock su una risorsa. Ciò in realtà non accade mai, poiché il thread con la risorsa è esso stesso in attesa del rilascio di un lock.

Ci sono alcune vie per gestire questo tipo di problema. La migliore è quella di far si che tutti i thread acquisiscano i lock nello stesso identico ordine. Se, per esempio, ponete i lock su $a, $b e $c, ponete sempre il lock prima su $a che su $b, e prima su $b che su $c. È anche meglio tenere i lock per un breve periodo di temo, così da minimizzare il rischio di stallo.

The altre primitive di sincronizzazione, descritte di seguito, possono soffrire di problemi simili.

Code: Passare I Dati In Giro

Una coda è uno speciale oggetto thread-safe che permette di inserire dei dati in una sua estremità e di estrarli dall'altra senza bisogno di preoccuparsi di questioni di sincronizzazione. L'uso delle code è piuttosto semplice, e si presenta così:

use threads; 
use Thread::Queue;

my $DataQueue = Thread::Queue->new; 
$thr = threads->new(sub { 
    while ($DataElement = $DataQueue->dequeue) { 
        print "Estratto $DataElement dalla coda\n";
    } 
}); 

$DataQueue->enqueue(12); 
$DataQueue->enqueue("A", "B", "C"); 
$DataQueue->enqueue(\$thr); 
sleep 10; 
$DataQueue->enqueue(undef);
$thr->join;

Anzitutto dovete creare la coda con new Thread::Queue. Fatto ciò, potete aggiungere liste di scalari alla fine di essa con enqueue(), ed estrarli dalla testa di essa con dequeue(). Una coda non ha una dimensione fissa, e può crescere quanto necessario per contenere qualsiasi cosa venga accodata.

Se la cosa è vuota, dequeue() rimane bloccato finché un altro thread accoda qualcosa. Questo rende le code ideali per loop di eventi ed altre comunicazioni tra thread.

Semafori: Sincronizzare L'Accesso Ai Dati

I semafori sono una sorta di generico meccanismo di locking. Nella loro forma più semplice, essi si comportano molto come scalari su cui è possibile mettere un lock, tranne che per il fatto che non possono contenere dati, e che il lock deve essere tolto esplicitamente. Nella loro forma avanzata, essi funzionano come una specie di contatore, e possono permettere a più thread di averne il 'lock' nello stesso momento.

Semafori semplici

I semafori dispongono di due metodi, down() e up(): down() decrementa il contatore, mentre up() lo incrementa. Le chiamate a down causeranno il blocco se il contatore del semaforo scende sotto lo zero. Il seguente programma fornisce una veloce dimostrazione:

use threads qw(yield); 
use Thread::Semaphore; 

my $semaphore = new Thread::Semaphore; 
my $GlobalVariable : shared = 0;

$thr1 = new threads \&sample_sub, 1; 
$thr2 = new threads \&sample_sub, 2; 
$thr3 = new threads \&sample_sub, 3;

sub sample_sub { 
    my $SubNumber = shift @_; 
    my $TryCount = 10; 
    my $LocalCopy; 
    sleep 1; 
    while ($TryCount--) { 
        $semaphore->down; 
        $LocalCopy = $GlobalVariable; 
        print   "$TryCount tentativi rimasti per la sub $SubNumber "
              . "(\$GlobalVariable E<egrave> $GlobalVariable)\n"; 
        yield; 
        sleep 2; 
        $LocalCopy++; 
        $GlobalVariable = $LocalCopy; 
        $semaphore->up; 
    } 
}

$thr1->join;
$thr2->join;
$thr3->join;

Le tre chiamate alla subroutine operano in sincornia. Il semaforo, tuttavia, fa si che solo un thread alla volta acceda alla variabile globale.

Semafori Avanzati

Normalmente i semafori si comportano come i lock, permettendo solo ad un thread alla volta di chiamare un down() su di essi. Tuttavia, ci sono altri usi per i semafori.

Ogni semaforo ha un contatore incluso in esso. Normalmente, i semafori vengono creati con il contatore impostato a uno, down() lo decrementa di una unità, up() lo incrementa di una unità. È tuttavia possibile forzare questi valori di default semplicemente passando valori diversi:

use threads;
use Thread::Semaphore;
my $semaphore = Thread::Semaphore->new(5);
                # Crea un sefamoro con il contatore impostato a 5

$thr1 = threads->new(\&sub1);
$thr2 = threads->new(\&sub1);

sub sub1 {
    $semaphore->down(5); # Decrementa il contatore di 5
    # Do stuff here
    $semaphore->up(5); # Incrementa il contatore di 5
}

$thr1->detach;
$thr2->detach;

Se down() tenta di decrementare il contatore sotto lo zero, si blocca fino a che il contatore non è grande abbastanza. Si noti che, mentre è possibile creare un semaforo con un contatore iniziale impostato a zero, qualsiasi chiamata a up() o down() cambia il contatore di almeno una unità, e dunque $semaphore->down(0) è uguale a $semaphore->down(1).

La questione, naturalmente, è perché si dovrebbe desiderare un comportamento del genere. Perché creare un semaforo con un contatore con valore iniziale diverso da uno, o perché decrementare/incrementare per più di una unità? La risposta è nella disponibilità delle risorse. Molte delle risorse di cui volete gestire l'accesso possono essere usate in modo sicuro da più di un thread alla volta.

Per esempio, prendiamo un programma che utilizzi la GUI. Esso dispone di un semaforo che usa per sincronizzare l'accesso al display, cosicché solo un thread alla volta possa disegnare. Comodo, ma ovviamente non vorrete che qualsiasi thread inizi a disegnare finché le cose non sono state propriamente impostate. In questo caso, potete creare un semaforo con un contatore impostato a zero, e alzarlo quando è tutto pronto perché i thread possano disegnare.

I semafori con un contatore impostato ad un valore più grande di uno sono, tra l'altro, utili per definire le quota. Ponete, ad esempio, di avere un certo numero di thread che possono fare I/O simultaneamente. Tuttavia, non vorrete sicuramente che tutti questi thread leggano o scrivano nello stesso momento, poiché ciò potrebbe potenzialmente impantanare i vostri canali di I/O, o esaurire la quota di filehandle del vostro processo. Potete utilizzare un semaforo inizializzato al numero di richieste di I/O concorrenti (o file aperti) che desiderate avere simultaneamente, e far così sì che i vostri thread si blocchino e sblocchino da soli in silenzio.

Incrementi o decrementi più grandi sono comodi in quei casi in cui un thread ha bisogno di controllare o di ritornare un certo numero di risorse contemporaneamente.

cond_wait() e cond_signal()

Queste due funzioni pososno essere usate assieme ai lock per notificare i thread cooperanti che una risorsa è divenuta disponibile. Esse, per quanto riguarda l'uso, sono molto simili alle funzioni che si trovano in pthreads. Comunque, per la maggior parte degli scopi, le code sono più semplici da usare e più intuitive. Consultate threads::shared per ulteriori dettagli.

Routine Di Utilità Generale Per I Thread

Abbiamo trattato le parti fondamentali del package di threading del Perl, e con questi strumenti dovreste essere ampiamente in grado di scrivere codice e package threaded. Ci sono alcuni piccoli pezzi che non trovavano veramente posto da altre parti.

In Quale Thread Mi Trovo?

Il metodo di classe threads->self fornisce al vostro programma un modo per ottenere un oggetto che rappresenta il thread in cui ci si trova al momento. Potete usare questo oggetto nello stesso modo degli altri ritornati al momento della crazione dei thread.

ID Dei Thread

tid() è un metodo dell'oggetto thread che ritorna l'ID del thread che l'oggetto rappresenta. Gli ID dei thread sono numeri interi, ed il thread principale di un programma ha ID 0. Allo stato attuale Perl assegna un tid unico a ciascun thread creato nel vostro proramma, assegnando il tid 1 al primo thread creato, ed aumentando il tid di 1 per ciascun nuovo thread che viene creato.

Questi Due Oggetti Sono Lo Stesso Thread?

Il metodo equal() prende come argomenti due oggetti thread e ritorna verso se essi rappresentano lo stesso thread, o falso in caso contrario.

Gli oggetti thread dispongono anche di una comparazione == su cui è stato compiuto un overload, e quindi la si può usare per compararli così come si fa con i normali oggetti.

Quali Thread Sono In Esecuzione?

threads->list ritorna una lista di oggetti thread, uno per ciascun thread in esecuzione al momento e non detached. È comodo per una serie di cose, incluse le operazioni di pulizia al termine del vostro programma:

# Loop attraverso tutti i thread
foreach $thr (threads->list) { 
    # Non unire il thread principale o quello corrente
    if ($thr->tid && !threads::equal($thr, threads->self)) { 
        $thr->join; 
    } 
}

Se alcuni thread non hanno ancora terminato l'esecuzione quando il thread Perl principale finisce, Perl vi avvertirà di ciò e morirà, poiché per il Perl è impossibile effetturare operazioni di pulizia su se stesso mentre altri thread sono in esecuzione.

Un Esempio Completo

Siete ancora confusi? È ora di un programma di esempio che mostri alcuni degli argomenti che abbiato trattato. Questo programma trova i numeri primi utilizzando i thread.

1  #!/usr/bin/perl -w
2  # prime-pthread, cortesia di Tom Christiansen
3
4  use strict;
5
6  use threads;
7  use Thread::Queue;
8
9  my $stream = new Thread::Queue;
10 my $figlio    = new threads(\&controlla_num, $stream, 2);
11
12 for my $i ( 3 .. 1000 ) {
13     $stream->enqueue($i);
14 } 
15
16 $stream->enqueue(undef);
17 $figlio->join;
18
19 sub controlla_num {
20     my ($upstream, $cur_prime) = @_;
21     my $figlio;
22     my $downstream = new Thread::Queue;
23     while (my $num = $upstream->dequeue) {
24         next unless $num % $cur_prime;
25         if ($figlio) {
26            $downstream->enqueue($num);
27          	} else {
28            print "Trovato il numero primo $num\n";
29	              $figlio = new threads(\&controlla_num, $downstream, $num);
30         }
31     } 
32     $downstream->enqueue(undef)	if $figlio;
33     $figlio->join		if $figlio;
34 }

Questo programma usa il modello a pipeline per generare numeri primi. Ogni thread della pipeline ha una coda di input che fornisce numeri da controllare, un numero di primo di cui è responsabile, ed una cosa di output in cui accoda i numeri che hanno fallito il controllo. Se il thread ha un numero che ha fallito il suo controllo e non c'è un thread figlio, allora il thread deve aver trovato un nuovo numero primo. In questo caso, un nuovo thread figlio viene creato per il numero primo e aggiunto alla fine della pipeline.

Questo probabilmente appare un pò più confuso di quanto realmente sia, quindi analizziamo questo programma pezzo per pezzo e vediamo cosa fa realmente. (Per quelli di voi che stanno cercando di ricordare cosa sia esattamente un numero primo, si tratta di un numero che è divisibile solamente per se stesso e per 1)

Il grosso del lavoro è compiuto dalla subroutine controlla_num(), che prende una reference alla sua coda di input ed un numero primo di cui è responsabile. Dopo aver ottenuto la coda di input ed il numero primo che la subroutine sta controllando (linea 20), creiamo una nuova coda (linea 22) e riserviamo uno scalare per il thread che probabilmente creeremo in seguito (linea 22).

I ciclo while dalla linea 23 alle linea 31 prende uno scalare dalla coda di input e lo confronta con il primo di cui questo thread è resposabile. La linea 24 controlla se c'è un resto quando calcoliamo il modulo del numero nei confronti del nostro numero primo. Se c'è, il numero non è divisibile per il nostro primo, e dunque dobbiamo passarlo al prossimo thread se ne abbiamo creato uno (linea 26) o creare un nuovo thread se non l'abbiamo fatto prima.

La creazione del nuovo thread è alla linea 29. Passiamo ad esso una reference alla coda che abbiamo creato, ed il numero primo trovato.

Infine, quando il loop termina (poiché abbiamo trovato uno 0 o undef nella coda, che serve come avviso per terminare), se abbiamo creato un thread fglio gli passiamo tale notifica e poi attendiamo che esso termini la sua esecuzione (linee 32 e 37).

Nel frattempo, nel thread principale, creiamo una coda (linea 9) ed il primo thread figlio (linea 10), e gli passiamo il primo numero primo: 2. Fatto ciò, accodiamo tutti i numeri da 3 a 1000 affinché vengano controllati (linee 12-14) e poi accodiamo un avviso che permetta al ciclo controllo di terminare (linea 17). Siccome un thread figlio non uscirà finché il suo thread figlio non è uscito, sappiamo che avremo finito la ricerca quando la chiamata a join ritorna.

Questo è tutto per quanto riguarda il funzionamento del programma. È piuttosto semplice; come accade per molti programmi Perl, la spiegazione è molto più lunga del programma stesso.

Considerazioni sulle prestazioni

La cosa principale da tenere a mente quando si confrontano gli ithread con altri modelli di thread è il fatto che, per ciascun nuovo thread creato, deve essere fatta una copia completa di tutte le variabili e dei dati del thread genitore. Questa creazione del thread può essere alquanto costosa, sia in termini di memoria che di tempo. Il modo ideale per ridurre questi costi e di avere un numero relativamente piccolo di thread con una vita lunga, tutti creati prima che il thread di base abbia accumulato troppi dati. Chiaramente, ciò può non essere sempre possibile, quindi è necessario scendere a dei compromessi. Comunque, dopo che un thread è stato creato, le sue prestazioni e l'utilizzo di memoria dovrebbero essere un po' diverse rispetto al codice normale.

Tenete inoltre a mente che, nell'implementazione corrente, le variabili condivise usano un po' di memoria in più e sono un po' più lente rispetto alle variabili normali.

Cambiamenti A Livello Di Processo

È importante notare che, sebbene i thread siano separati l'uno dall'altro, ed i dati del Perl siano privati a livello di thread (a meno che non siano condivisi esplicitamente), i thread possono effettuare cambiamenti a livello di processo, influenzando tutti i thread.

L'esempio più comune di ciò è il cambiamento della directory di lavoro corrente tramite chdir(). Un thread chiama chdir(), e la directory di lavoro di tutti i thread cambia.

Un esempio persino più drastico di cambiamento a livello di processo è chroot(): la directory principale di tutti i thread cambia, e nessun thread può annullare tale cambiamento (a differenza di chdir()).

Ulteriori esempi di di cambiamenti a livello di processo includono umask() ed il cambiamento di uid/gid.

State pensando di mescolare fork() ed i thread? Per favore mettetevi comodi ed attendate finché non ve ne passa la voglia-- ma in caso lo vogliate davvero sapere, la semantica è che fork() duplica tutti i thread. (In UNIX almeno, altri sistemi faranno qualcosa di diverso.)

Similarmente, mescolare segnali e thread è un'operazione che non andrebbe tentata. Le implementazioni dipendono dal sistema, e persino le semantiche POSIX possono non essere quelle che vi attendete (e Perl non vi offre nemmeno l'API POSIX completa).

Thread-Safety Delle Librerie Di Sistema

Se le varie chiamate alle librerie siano thread-safe o meno è fuori dal controllo del Perl. Le chiamate che in molti casi non sono thread-safe includono: localtime(), gmtime(), get{{gr,host,net,proto,serv,pw}*(), readdir(), rand(), e srand() -- in generale, tutte le chiamate che dipendono da una situazione globale esterna.

Se il sistema in cui Perl è stato compilato dispone di varianti thread-safe di tali chiamate, esse verrano usate. A parte quello, Perl è alla mercé della thread-safety o thread-unsafety delle chiamate. Consultate la documentazione delle chiamate della vostra liberia C per ulteriori informazioni.

In alcuni sistemi le intefacce thread-safe possono non funzionare se il buffer per il risultato è troppo piccolo (per esempio getgrent() può ritornare un gran numero di liste di membri di un gruppo). Perl proverà a far crescere il buffer alcune volte, ma solo fino a 64k (per ragioni di sicurezza).

Conclusioni

Un tutorial completo sui thread può riempire un libro (e lo ha fatto, molte volte) ma, con ciò che abbiamo trattato in questa introduzione, dovreste essere ampiamente in grado di diventare esperti di Perl threaded.

Bibliografia

Qui di seguito è riportata una breve bibliografia, per cortesia di Jürgen Christoffel:

Testi Introduttivi

Birrell, Andrew D. An Introduction to Programming with Threads. Digital Equipment Corporation, 1989, DEC-SRC Research Report #35 disponibile online su http://gatekeeper.dec.com/pub/DEC/SRC/research-reports/abstracts/src-rr-035.html (fortemente raccomandato)

Robbins, Kay. A., e Steven Robbins. Practical Unix Programming: A Guide to Concurrency, Communication, and Multithreading. Prentice-Hall, 1996.

Lewis, Bill, e Daniel J. Berg. Multithreaded Programming with Pthreads. Prentice Hall, 1997, ISBN 0-13-443698-9 (una introduzione ai thread ben scritta).

Nelson, Greg (editore). Systems Programming with Modula-3. Prentice Hall, 1991, ISBN 0-13-590464-1.

Nichols, Bradford, Dick Buttlar, e Jacqueline Proulx Farrell. Pthreads Programming. O'Reilly & Associates, 1996, ISBN 156592-115-1 (tratta i thread POSIX).

Riferimenti Relativi Ai Sistemi Operativi

Boykin, Joseph, David Kirschen, Alan Langerman, e Susan LoVerso. Programming under Mach. Addison-Wesley, 1994, ISBN 0-201-52739-1.

Tanenbaum, Andrew S. Distributed Operating Systems. Prentice Hall, 1995, ISBN 0-13-219908-4 (grandioso libro di testo).

Silberschatz, Abraham, e Peter B. Galvin. Operating System Concepts, 4th ed. Addison-Wesley, 1995, ISBN 0-201-59292-4

Altri Riferimenti

Arnold, Ken e James Gosling. The Java Programming Language, 2nd ed. Addison-Wesley, 1998, ISBN 0-201-31006-6.

le FAQ di comp.programming.threads, http://www.serpentine.com/~bos/threads-faq/

Le Sergent, T. e B. Berthomieu. "Incremental MultiThreaded Garbage Collection on Virtually Shared Memory Architectures" in Memory Management: Proc. of the International Workshop IWMM 92, St. Malo, France, September 1992, Yves Bekkers and Jacques Cohen, eds. Springer, 1992, ISBN 3540-55940-X (real-life thread applications).

Artur Bergman, "Where Wizards Fear To Tread", June 11, 2002, http://www.perl.com/pub/a/2002/06/11/threads.html

Ringraziamenti

Grazie (in nessun ordine particolare) a Chaim Frenkel, Steve Fink, Gurusamy Sarathy, Ilya Zakharevich, Benjamin Sugard, Jurgen Chrisoffel, Joshua Pritikin, e Alan Burlison, per il loro aiuto nel controllo e nell'affinamento di questo articolo. Molte grazie a Tom Christiansen per la sua riscrittura del generatore di numeri primi.

AUTORE

Dan Sugalski <dan@sidhe.org>

Leggermente modificato da Arthur Bergman per adattarlo al nuovo modello/modulo dei thread.

Rielaborato lievemente da Jörg Walter <jwalt@cpan.org> affinché la parte sulla thread-safety del codice perl risultasse più concisa.

Copyright

La versione originale di questo articolo è apparsa originariamente in The Perl Journal #10, ed il copyright è di The Perl Journal (1998). Appare qui per cortesia di Jon Orwant e di The Perl Journal. Questo documento può essere distribuito sotto la stessa licenza del Perl stesso.

Per maggiori informazioni si vedano threads and threads::shared.

TRADUZIONE

Versione

La versione su cui si basa questa traduzione è ottenibile con:

perl -MPOD2::IT -e print_pod perlthrtut

Per maggiori informazioni sul progetto di traduzione in italiano si veda http://pod2it.sourceforge.net/ .

Traduttore

Traduzione a cura di Michele Beltrame.

Revisore

Revisione a cura di Michele Beltrame.

1 POD Error

The following errors were encountered while parsing the POD:

Around line 1113:

Non-ASCII character seen before =encoding in 'Jürgen'. Assuming CP1252