Il Web e i Web server

Guida Apache
di Openskills

Introduzione al world wide web
Il www, acronimo di World Wide Web è il risultato dell'interconnessione fisica e logica fra un vasto numero di computer in rete.
Ogni computer su Internet viene definito host, ha un proprio indirizzo IP e può indifferentemente svolgere funzioni da client o server per una moltitudine di protocolli, a seconda del software installato ed utilizzato. Nella sua forma base, un Server Web è un computer generalmente online 24 ore su 24, ha un indirizzo IP fisso a cui è associato un nome tipo www.dominio.com e, tramite un software dedicato (Apache, IIS, Zeus...) non fa altro che fornire file ai client (i browser come Netscape Navigator, Microsoft Internet Explorer, Opera...) che li richiedono.
Questi file sono tipicamente immagini (di solito in formato GIF e JPEG) e pagine HTML, che normali file ASCII contenenti il testo di un linguaggio di programmazione ipertestuale che permette di formattare testo, grafica e link all'interno di schermate visualizzabili dal browser.
Il protocollo che gestisce il trasferimento di questi file fra client e server web è l'HTTP Hyper text Transfer Protocol.
Di fatto mentre si naviga non si fa altro che trasferire file via rete, tramite il protocollo HTTP, dall'hard disk del server web al nostro computer, dove il browser interpreta le pagine HTML ricevute e le visualizza, richiedendo di volta in volta le immagini e gli altri file necessari per completare la visualizzazione delle pagine.
Cliccando su un link, l'utente richiede un diverso file html sul server su cui sta navigando o su un altro server che fisicamente potrebbe essere distante migliaia di chilometri dal primo.
Il gran numero di server web, che contiene una enorme quantità di pagine html che a loro volta includono innumerevoli link ipertestuali che collegano altre pagine, costituiscono l'ossatura di questa ragnatela globale che collega logicamente pagine e server fisicamente dislocati in ogni parte del globo.
Dal momento che sia il protocollo HTTP che il linguaggio di programmazione HTML sono definiti come standard, con regole ben precise, è normale e comune avere client e server web che "girano" anche su Sistemi Operativi diversi.
In pratica non c'è nessun problema a navigare con il proprio Windows 98 su un sito che risiede su un sistema Linux o Windows 2000 e viceversa.

Cosa sono gli Url
E' grazie agli URL (Uniform Resouce Locator) che i navigatori possono accedere alle informazioni del World Wide Web. Il problema è che non esiste un indice principale, un unico punto di riferimento, che racchiuda in se tutte le risorse e le informazioni disponibili su Internet, quindi per recuperare una specifica informazione si possono utilizzare diversi protocolli e metodi.
I protocolli in questione sono:
HTTP = HyperText Transfer Protocol. Protocollo di trasferimento di ipertesto, quello che viene più utilizzato nel WWW.
FTP = File Transfer Protocol. Protocollo di trasferimento di file.
GOPHER = Gopher. Progenitore dell'HTTP, ormai poco usato.
TELNET = Telnet. Protocollo per accedere, tramite interfaccia testuale, ad un host (computer) remoto.
NEWS = Network News Transfer Protocol. Protocollo di trasferimento delle news.

Ciascun tipo di protocollo ha un formato leggermente diverso per identificare univocamente la locazione di una risorsa.

HTTP e FTP
Questi due protocolli hanno lo stesso formato in quasi tutti i casi.
Locazione risorsa=//nome_server/percorso_documento
ad esempio per individuare, tramite protocollo HTTP, il file pippo.htm, contenuto nella directory mio sul server xxx.yyy.it si utilizzerà l'URL:
http://xxx.yyy.it/mio/pippo.htm.

Gopher
Il campo tipo è un singolo carattere che viene utilizzato dal protocollo Gopher per determinare il tipo di documento (quello predefinito è 1). Il resto del percorso è il documento o la stringa del selettore di risorse, come descritto nel protocollo Gopher.
Ad esempio, per accedere al documento principale sul server gopher.biz.com, si utilizza l'URL
gopher://gopher.biz.com/1

Telnet
Sulla maggior parte dei sistemi aprendo un URL di Telnet si lancia semplicemente un'applicazione esterna di telnet e ci si può connettere da lì.
Locazione risorsa=//nome_utente:password@nome_del_server ad esempio per collegarsi a xxx.yyy.it come mariorossi si utilizza l'URL
telnet://mariorossi@xxx.yyy.it

News
Per la maggior parte dei programmi di ricerca si deve impostare una preferenza che indica quale server richiedere per gli URL di News. Ogni server ha i propri identificatori per ciascun articolo, quindi è meglio prima chiedere un elenco di articoli correnti omettendo le parole chiave primo e ultimo.
Locazione risorsa=gruppo di lettura delle news: primo articolo-ultimo articolo
Ad esempio per chiedere gli articoli in alt.flame si utilizza l'URL
news:alt.flame

Overview dei server web disponibili sul mercato
Ci sono molti software con funzioni da server web disponibili sul mercato. Ecco un elenco dei piu rappresentativi con una breve descrizione

Apache (www.apache.org) sviluppato dalla Apache Software Foundation è diffuso sia nella versione 1.3 che nella 2.0 Pro: Gratis, open-source, espandibile grazie alla grande quantità di moduli che supporta, altamente e facilmente configurabile.
Contro: Performance non ottimali.
Il piu utilizzato, gira praticamente su tutte le piattaforme, Windows incluso. Il suo design modulare permette di aggiungere features facilmente..

Microsoft Internet Information Server (www.microsoft.com) sviluppato dalla Microsoft Corp.
Pro: Facile da usare; buon supporto tecnico; buone performance
Contro: Ha una storia travagliata in termini di sicurezza; non open-source ; tuning limitato
Ben integrato con Windows, permette una facile installazione e configurazione. Facile da usare, ha avuto seri e ripetuti problemi di sicurezza.

Zeus 4.0 (www.zeus.com) sviluppato dalla Zeus Technology Ltd.
Pro: Molto veloce; scalabile, interfaccia user-friendly.
Contro: Poco espandibile; costoso (1700 dollari circa a server).
Zeus web server ha features estensibili, una interfaccia ben fatta, ottime performance e gira su piattaforme Unix.

iPlanet Web Server Enterprise Edition (www.iplanet.com) sviluppato dalla iPlanet E-Commerce Solutions, poi definitivamente acquisita da Sun, deriva dal Netscape Server, a suo tempo un leader del mercato.
Pro: Eccellente supporto java, buone performance.
Contro: Poco espandibile, interfaccia poco intuitiva, costoso (poco meno di 1500 dollari per CPU).

Per una lista completa dei server Web disponibili è comoda la directory di DMOZ: dmoz.org/Computers/Software/Internet/Servers/WWW/.

Statistiche di diffusione dei server web
Esistono in rete siti e studi che raccolgono informazioni sulla diffusione dei server Web e il loro utilizzo. Il più significativo è senz'altro Netcraft che fornisce interessanti e attendibili statistiche su quali sono i server Web maggiormente utilizzati in rete e i relativi trend di sviluppo.

Il dominatore incontrastato del mercato è Apache, nelle sue varie versioni, presente su più del 60% dei webserver in rete. A seguire, ben distanziato è IIS di Microsoft, più del 25% di installazioni.
Agli altri prodotti, commerciali o opensource, rimangono le briciole: iPlanet, Zeus, Rapidsite e una pletora di altri contano per il 2% o meno.

Oltre a Netcraft, altri siti in rete forniscono dati e statistiche. Fra questi il più promettente è il Securityspace Web Server Survey che offre statistiche dettagliate ed estrapolazioni interessanti.

Source:
http://www.securityspace.com/s_survey/data/index.html

Link:
http://www.netcraft.com/survey/
http://www.migliorhosting.it/serverweb

Si ringrazia Openskills per
la realizzazione della guida


© Risorse.net (www.risorse.net)
pagina in versione stampabile:
http://www.risorse.net /apache/il_web.asp?print=ok