Il lato oscuro di internet presto non sarà più un rifugio sicuro per fuorilegge e cyber-criminali, e chi lo frequenta con fini poco nobili, se non addirittura spregevoli, avrà le ore contate. Questa è quantomeno la speranza di sei programmatori informatici sudcoreani della Cornell University di New York che hanno creato DarkBERT, un’intelligenza artificiale istruita studiando le caratteristiche del famigerato “Dark Web” che ospita – secondo le stime più audaci – qualcosa come un 95 per cento di attività illegali (dal semplice scambio di contenuti pirata fino al traffico di armi e droga, al terrorismo o alla pedofilia).
Oscuro alleato. I ricercatori sembrano essere fin troppo ottimisti sui risultati che “l’oscuro BERT” potrà ottenere nella lotta al cybercrime, ma occorre fare un passo alla volta per spiegare di che cosa si tratta.
Cominciamo col dire che l’acronimo BERT (Bidirectional Encoder Representations from Transformers) indica un modello di intelligenza artificiale, utilizzato per comprendere il linguaggio comune, che fu lanciato da Google nel 2018. Invece, che cosa è il Dark Web?
COMINCIAMO DALLE BASI. Con Dark Web si definiscono tutti quei contenuti sommersi di internet ospitati nelle cosiddette darknet (“reti oscure”) alle quali è possibile accedere solo attraverso specifici software o superando livelli di sicurezza elevati. Il Dark Web non va confuso con il “Deep Web”, il macro-mondo di cui lo stesso fa parte.
In breve: il World Wide Web si divide principalmente in Surface Web, la punta di un ipotetico iceberg, quello che visitiamo tutti i giorni e che ospita siti e social network, e appunto il Deep Web, la parte sommersa (e più vasta) dove si trovano tutte quelle pagine non indicizzate dai motori di ricerca. Per la maggior parte si tratta di database e forum privati, di indirizzi protetti da firewall (come quelle di istituti medici, scientifici, finanziari e di università), e di risorse non accessibili attraverso la ricerca tradizionale. Vi è dell’illecito anche in altre porzioni del Deep Web ma il grosso delle nefandezze sembrano essere contenute nel Dark Web, la base dell’iceberg.
PORTA DI ACCESSO. Per entrare nel Dark Web si utilizzano programmi come TOR (The Onion Router), utilizzato da circa 2,5 milioni di utenti ogni giorno. Tra di essi, anche il team della Cornell che ha cercato di far conoscere, esplorare, analizzare ed elaborare quanti più dati possibili al proprio modello linguistico, il quale ha dovuto imparare a raccogliere informazioni in maniera ben diversa da quella utilizzata da altre intelligenze artificiali come – per citare il più famoso – ChatGPT.
I dati archiviati da DarkBERT, infatti, sono grezzi e si basano prevalentemente su domini e configurazioni particolari, ma sembra siano stati sufficienti per creare un modello di classificazione che “supera quello dei noti modelli linguistici pre-addestrati”, stando almeno alle convinzioni di chi lo ha creato.
Prima c’era stata roberta. Va detto che Facebook nel 2019 provò a percorrere la stessa strada con un software chiamato “RoBERTa”, ma senza troppa fortuna. Il team coreano, invece, è certo che DarkBERT abbia il potenziale per essere impiegato con successo nel campo della sicurezza informatica.
Come funzionerà? Identificherà i siti che vendono ransomware (software in grado di prendere il controllo dei computer di altri utenti) o dati riservati (password personali, codici bancari) oppure passando al setaccio i numerosi forum del dark web con il fine di tenere d’occhio ogni scambio quotidiano di informazioni illegali e segnalarlo alle autorità.
Fotogallery 10 cose che non fai più da quando c’è internet
Fonte Focus.it