Il deep web (“web sommerso”, “web profondo”) è l’insieme delle risorse informative del World Wide Web non indicizzate dai normali motori di ricerca
Cos’è il Deep Web? Il web sommerso, o deep web, rappresenta l’insieme di risorse informative del World Wide Web che non sono indicizzate dai motori di ricerca convenzionali. Questa parte nascosta dell’Internet è spesso paragonata a un iceberg, dove la parte sopra l’acqua rappresenta le pagine web accessibili e indicizzate, mentre la parte sommersa corrisponde al web sommerso.
Per comprendere la vastità del deep web, si può considerare che, secondo una ricerca condotta nel 2000, la rete internet contiene oltre 18 milioni di GB e 550 miliardi di documenti, mentre solo una piccola percentuale (meno dell’uno per cento) è indicizzata da motori di ricerca come Google.
Le categorie di documenti presenti nel web invisibile includono contenuti dinamici generati al momento dal server, pagine non collegate ad altre, pagine ad accesso ristretto che richiedono registrazione, script che richiedono procedure particolari per essere raggiunti, contenuti non testuali come file multimediali e documenti in formati diversi dall’HTML, e infine contenuti vietati da motori di ricerca comuni a causa della loro illegalità, come siti pedo-pornografici o di traffico illegale di droghe e armi.
Differenze col dark web
Il Deep Web comprende una serie di risorse online non indicizzate, come nuovi siti non ancora riconosciuti dai motori di ricerca, pagine web dinamiche, software web e siti aziendali privati.
Il Dark Web, d’altra parte, costituisce una porzione specifica del Deep Web e include contenuti accessibili pubblicamente, ma ospitati su siti web con indirizzi IP nascosti. Di solito, questi siti sono accessibili tramite software specializzato poiché si trovano su reti sovrapposte a Internet, comunemente note come darknet. Le darknet più diffuse includono Tor, I2P e Freenet. L’accesso a queste reti avviene attraverso software appositi che fungono da intermediari tra Internet e la darknet. Tor è uno dei software più noti, consentendo non solo l’accesso alla sua rete omonima ma garantendo anche l’anonimato all’utente, consentendogli di navigare in modo anonimo anche sul World Wide Web tradizionale attraverso uno dei nodi della rete Tor.
In alcuni casi, l’anonimato offerto dal Dark Web è sfruttato per condurre attività illecite, come la vendita di merci illegali. Un esempio famoso è Silk Road, un sito di commercio elettronico sulla rete Tor coinvolto in attività criminali come il traffico di droga e la distribuzione di pornografia illegale.
Cos’è il Deep Web
L’Internet che utilizziamo quotidianamente, noto come Internet di superficie, è la parte accessibile e indicizzata dai motori di ricerca tradizionali, come Google o Bing. Questa sezione viene esplorata attraverso browser e web crawler, che sono software in grado di acquisire copie testuali delle pagine web visitate e di inserirle in un indice insieme alle relative informazioni. In questo modo, otteniamo risultati quando effettuiamo ricerche su motori come Google, associando pagine web a determinati argomenti o parole chiave.
Il Deep Web, al contrario, costituisce la parte di Internet che sfugge all’indicizzazione dei motori di ricerca comuni, rendendola inaccessibile tramite ricerche su Google o Bing. Si stima che questa parte rappresenti tra l’89% e il 96% dell’intero web. Quindi, ciò che percepiamo della Rete rappresenta solo una minima frazione del suo vasto panorama.
Contenuti come messaggi diretti, email e transazioni bancarie finiscono nel calderone del Deep Web. In questa categoria rientrano anche le pagine web che richiedono un’autenticazione o un login per essere visitate, come forum o indirizzari universitari. Ciò include anche i nuovi siti, quelli privati di istituti accademici o aziende e le pagine appena pubblicate.
Il testo è più facilmente indicizzato rispetto a video e immagini, il cui contenuto spesso sfugge all’estrazione diretta di informazioni e conoscenze.
Per accedere a molti contenuti del Deep Web, è possibile utilizzare un browser standard conosciuto l’indirizzo specifico del sito. Alcuni siti cercano di catalogare database e pagine web non indicizzate da Google, come The WWW Virtual Library, Surfwax e Stumpedia, che sono raccolti nel sito Weitzenegger.
Potrebbero interessarti anche questi articoli:
FONTEUFFICIALE.it riassume le notizie pubblicate dalle agenzie di stampa e da altri media autorevoli (come Ansa, Agi, AdnKronos, Corriere della Sera, ecc..), quindi non è direttamente responsabile di inesattezze. Se, però, ritieni che un nostro articolo debba essere modificato o eliminato puoi farne richiesta [ scrivendo qui ].
Per ricevere i nostri aggiornamenti e restare informato ti invitiamo a seguirci sul nostro profilo ufficiale di Google News.