Ricerca semantica - limiti e prospettive
13/12/2008 inserito da LUCIANO IOLLO
Tra le tante tematiche ancora in via di evoluzione c'è il web semantico.
Si tratta del naturale sviluppo dei motori di ricerca che mirano sempre meno a creare una corrispondenza stretta tra la chiave cercata ed i risultati.
In fondo già ora sono attivi dei tool che hanno il sapore delle prime avvisaglie di web semantico. Si prendano come esempio le "Spell corrections", ovvero i suggerimenti del motore di ricerca che in italiano ci suggeriscono "forse cercavi ...?".
Tali correzioni intervengono quando per una chiave molto simile (una due battute) corrispondono molti più risultati. Il secondo metodo grazie al quale è possibile far funzionare le "spell correction" di Google è la ricerca del tema della parola, ovvero della parte caratterizzante che la lingua declina e coniuga nei casi, nei generi necessari volta per volta.
Ho fatto un piccolo test con i nomi di due personalità sulle quali, per ragioni estremamente diverse, si concentrano sicuramente molte ricerche, Silvio Berlusconi e Monica Bellucci.
I due cognomi, tutto sommato sono molto simili, vediamoli:
B E R L U S C O N I
B E L L U C C I
Lo scarto si concentra su poche battute; in particolare sulla terza e la sesta. L'ultima battuta nel cognome della bella Monica corrisponde con l'ultima battuta del ghignante attuale Pres.del.Cons.
Ebbene digitando su Google la parola B E L L U C C O N I, al suono evidentemente più vicina al politico e con sole due battute di differenza dal relativo nome, il sistema ci suggerisce "Forse cercavi: bellucci".
Chiaramente il fattore preponderante è, in questo caso, il tema della parola. Cambiando la ricerca in B E R L U C C O N I (1 errore), Google riconosce il tema giusto e propone il coognome del politico scritto correttamente.
Inutile dire che in entrambe le ricerche i risultati oltre il suggerimento erano interamente dedicati al politico. Sono pagine dove il cognome è stato volutamente storpiato, ma anche pagine dove si tratta chiaramente di un errore di battitura, di cui la rete e piena.
Da un punto di vista SEO gli errori di battitura aprirebbero un capitolo a parte. Risulta particolarmente divertente osservare, tuttavia, che certi prodotti web riescono a scalare con estrema facilità le classifiche delle serp grazie ad inconsapevoli finezze di posizionamento.
Finezze a cui chi cura i progetti SEO delle pagine web di questi due attori della vita contemporanea (ovviamente se c'è qualcuno che lo fa altrimenti "anda" come diceva mia nonna), non ha avuto l'accortezza di pensare.
Proviamo adesso, a dimostrazione che a prescindere dalla semantica attribuita da un uomo, la finta semantica della macchina è solo costruita di regole che poco hanno a che fare con la somma delle lettere, voglio provare a fare uscire il suggerimento di Berlusconi inserendo un cognome che chiaramente ci ricorda Monica.
Inserendo sul motore di ricerca la parola
B E L L U C S C O N I, praticamente tutto il cognome dell'attrice tranne l'ultima battuta, non compare alcun risultato e la "spell correction" ci suggerisce... Berlusconi!
In questo caso il valore del tema è prossimo allo zero, mentre invece sembra assumere maggior rilevanza la presenza - evidentemente un indizio molto importante - di battute che nel cognome dell'attrice non sono presenti, trattandosi di un cognome con meno battute totali.
Cercando, infine, B E L L U C C I S C O N I, il sistema continua a non generare alcun risultato ed a proporre il cognome del politico.
Un'altra differenza sostanziale tra le due ricerche effettuate senza errori, consiste nel numero di risultati. Si parla di oltre 20 milioni per il politico e di poco meno di 9 milioni per l'attrice, una differenza di tutto rispetto, non me ne voglia la bellona.
Nessuno ad oggi può dire che il web semantico sia concretamente sviluppato e perfettamente funzionante. So, con certezza, che il medesimo funzionamento tiene in piedi tutte le corrispondenze generiche delle campagne di adwords. Inoltre il mio personalissimo pensiero è che se, nonostante tutto, non riesci a dare il 100% significa che ti stai allenando per la prossima volta!
Un
post molto interessante sul
Google official blog illustra le basi su cui funziona e le prospettive del web semantico così come lo stanno immaginando in big-G.
In altri post parlerò di come è realizzato il web semantico.
Ciao!