L'indicizzazione nei motori di ricerca è un processo scrupoloso e meticoloso, bisogna impostare correttamente i tag del sito, sapere quali metatag utilizzare, un sito a cui puntano più siti sarà maggiormente indicizzato.
Ci sono discipline come Information Retrieval:
IR come disciplina scientifica è stata in auge per 50 anni, fino all'avvento del World Wide Web.Data una collezione statica di documenti (Corpus), le tecniche di IR permettono di trovare i documenti rilevanti per l'utente.
Abbiamo Motori Di ricerca diversi che necessitano di opportune indicizzazioni:
Evoluzione dei motori di ricerca
Prima generazione:
analisi dei dati on page, e nient'altro
Seconda generazione:
analisi di dati specifici del Web (link, anchor-text, click-through data)
Terza generazione:
tentativo di dare risposta ai bisogni che stanno dietro alle query
analisi semantica
integrazione di risorse multiple
aiuto all'utente (spell checking, query refinement, ecc.)
determinazione del contesto
spaziale
del query stream (traccia delle query precedenti)
personale (profilo utente)
Ti cito alcuni tra i metodi in voga per i posizionamenti:
Link Analysis per le ricerche nel Web Kleinberg, Brin e Page sono stati i pionieri dell'analisi dei link per il potenziamento dei motori di ricerca.Un autore che mette nelle proprie pagine Web collegamenti ad altre pagine, implicitamente approva queste ultime.
Dal giudizio collettivo di diversi autori, un motore di ricerca può estrarre dal Web il contenuto di maggior importanza.
Algoritmo HITS (Hyperlinked Induced Topic Search)Kleinberg identifica due due tipi di pagine Web:
authority pagine che rappresentano autorevoli sorgenti di informazione per la query
hub liste che contengono puntatori a pagine relative ;argomento della query
C è una relazione di rinforzo mutuo tra le due tipologie di pagine, per cui
Good hubs point to good authorities and vice versa
L'algoritmo HITS formalizza tale relazione in un calcolo iterativo composto
da due fasi:
Sampling phase
Weight-propagation phase
Algoritmo PagerankBrin e Page fanno analisi dei link per ottenere una classifica delle pagine indipendente dalle query.
Si basa tutto su questa formulona:
Si assume che la pagina p sia puntata dalle pagine q1..qn.
Sia d la probabilità che un random surfer; si stufi della pagina che sta visitando e salti ad un'altra pagina a caso (normalmente d = 0,85).
Sia C(p) il numero di link che escono dalla pagina p. Il PageRank di p, cioè la probabilità che il random surfer vi capiti, è data dalla seguente formula:
PR(p) = (1-d) + d (PR(q1)/C(q1) + ... + PR(qn)/C(qn))
Infine ecco cosa dice Google:
Google
Google combines PageRank with sophisticated text-matching techniques to find pages that are both important and relevant to your search.
Google goes far beyond the number of times a term appears on a page and examines all aspects of the page's content (and the content of the pages linking to it) to determine if it's a good match for your query.
Come puoi vedere è un'argomento molto ampio e complesso, che richiede studio analisi e dedizione, se fosse cosi semplice indicizzare nei primi posti un sito....

,cmq utilizzado delle buone tecniche come ti ho illustrato precedentemente i risultati si ottengono.(Sono riuscito a posizionare discretemente alcuni dei siti che ho implementato, con un buon riscontro di visite).
Spero di esserti stato di aiuto,
Marco
Modificato da maltra il 09 ottobre 2008 15.03 -
Modificato da maltra il 09 ottobre 2008 15.09 -