Small Language Model: un modello più sostenibile di GenAI

Compatibilità
Salva(0)
Condividi

Focus

Ma, se da un lato i large language model aprono a nuove opportunità, siamo sicuri che gli utenti abbiano sempre bisogno di strumenti tanto potenti quanto energivori? Sono molte le aziende e gli individui per cui sono sufficienti modelli più compatti ma non per questo meno intelligenti. È qui che entrano in gioco di small language model (SLM).

Piccolo è bello

Gli SLM sono modelli linguistici con un numero di parametri significativamente inferiore rispetto ai LLM. Se questi ultimi possono arrivare a centinaia di miliardi di parametri, gli SLM ne utilizzano spesso poche decine di milioni o, al massimo, qualche miliardo. Già questo è un risultato importante in termini di impiego di risorse ma il vero valore degli SLM sta nella loro capacità di svolgere compiti specifici con maggiore efficienza e rapidità e in un costo significativamente più contenuto.

Dall’Edge ai personal assistant

Quali sono le applicazioni per cui gli SLM risultano particolarmente adatti? E dove eccellono rispetto ai LLM? Gli SLM brillano nelle applicazioni edge, che richiedono di eseguire carichi di lavoro AI direttamente su dispositivi come smartphone, tablet, robot domestici, droni o sensori IoT.

La loro agilità permette di integrarli dove la potenza di calcolo è limitata e la connessione a Internet non sempre garantita. Pensiamo agli assistenti vocali negli smartphone di ultima generazione: grazie agli SLM, le risposte vocali possono essere generate direttamente sul dispositivo, senza inviare dati sensibili al cloud, aumentando privacy e velocità di risposta.

Un altro campo in forte espansione riguarda i chatbot e i sistemi di customer service. Non sempre l’interazione con l’utente richiede la potenza di un LLM; per rispondere a domande frequenti, gestire prenotazioni o fornire supporto tecnico di base, un SLM risulta non solo sufficiente ma anche più sicuro e controllabile.

Sostenibilità e privacy

La questione ambientale è probabilmente il maggiore punto di forza degli SLM. L’addestramento e il funzionamento quotidiano dei LLM richiedono enormi quantità di energia elettrica e acqua, utilizzata nel raffreddamento delle server farm, con impatti ambientali significativi. Un recente studio di Google e della University of California, Riverside, ha stimato che l’addestramento di GPT-3 ha richiesto centinaia di megawattora di energia e milioni di litri d’acqua per il raffreddamento dei data center.

Gli SLM, al contrario, possono essere addestrati e fatti funzionare con consumi molto più contenuti. Infatti, la possibilità di eseguire operazioni in locale limita anche la necessità di continui scambi di dati con server remoti, riducendo i consumi associati al traffico internet e al mantenimento dei data center. La riduzione dei consumi non riguarda solo l’energia elettrica: anche il fabbisogno di acqua si riduce drasticamente quando i modelli sono piccoli e girano su dispositivi personali o piccoli server locali.

Anche la privacy beneficia dall’implementazione degli SLM: l’esecuzione locale elimina o riduce drasticamente la necessità di inviare dati sensibili su server esterni, mitigando i rischi di violazione e aumentando la fiducia degli utenti. Questo aspetto diventa ancora più cruciale con l’entrata in vigore di regolamenti sempre più stringenti in tema di protezione dei dati, come il GDPR europeo.

Limiti e prospettive future

Naturalmente, gli SLM non sono adatti a qualsiasi applicazione. La loro capacità di “generalizzare” resta inferiore rispetto ai LLM nei compiti estremamente complessi o nei casi in cui sia necessaria una conoscenza estesa. Va pur detto che l’avvento delle tecniche di distillazione e fine-tuning permette di ottenere prestazioni notevoli anche con modelli di dimensioni contenute.

In futuro, ci possiamo aspettare di avere un ecosistema misto, in cui i LLM verranno utilizzati per compiti ad alto impatto e centralizzati, mentre gli SLM saranno sempre più diffusi nell’uso quotidiano, personale e professionale, come “copiloti” discreti ed efficienti.

La vera innovazione, oggi, non sta più tanto nel creare modelli sempre più grandi e affamati di risorse, quanto nel saper costruire soluzioni intelligenti, sostenibili e accessibili. Gli SLM sono un passo deciso in questa direzione: meno spreco, più efficienza, maggiore privacy, ampia accessibilità.

Recapiti