Tuesday, February 14, 2012

impostore di rank

In diverse occasioni ho avuto modo di prendere le distanze dalle affermazioni del prof. Marchiori che si vantava o lasciava credere di essere l'inventore dell'"algoritmo di Google".

I fatti sono ben chiari, basta leggere l'articolo di Brin e Page in cui introducono PageRank e in cui citano il lavoro di Marchiori, dicendo esplicitamente che l'approccio di Marchiori è diverso dal loro, anzi per l'esattezza l'opposto: Marchiori usa gli outlink e PageRank gli inlink.
Adesso è stato richiesto a Google stessa di pronunciarsi.

Se si dovesse considerare chi per primo ha pensato di utilizzare i link alle pagine, come fonte di informazioni sulle pagine stesse, potrei mettermici anch'io, con vari articoli sulla categorizzazione per contesti:
Il progetto Theseus era iniziato già nel 1996, con la proposta Naxos (aprile 1996) e proseguito con lo sviluppo di Arianna (estate 1996), contemporaneamente allo sviluppo di Google e di PageRank.
Quando Jeffrey Ullman, professore di Stanford e partner di Brin in Google, venne a Pisa come membro della commissione di valutazione del dipartimento, nel 1999, fu colpito dal nostro lavoro al punto di esprimere questo parere nella relazione ufficiale:
The objective of the project is in a sense a combination of the two viewpoints: develop sophisticated Web applications. The reviewers feel that, while the project is not without flaws, it represents an excellent direction for the department to take. We encourage the department to grow this effort if at all possible.
In privato discutemmo le relazioni con il progetto di Brin-Page, e concordammo che, mentre entrambi utilizzavano le informazioni dei link, loro li usavano per la ricerca, mentre noi li usavamo per la classificazione, ed utilizzavamo non soltanto i link, ma anche quello che chiamavamo il loro contesto, ossia i paragrafi circostanti e i titoli dei capitoli o delle sezioni che li includevano.

3 comments:

Magari said...

E poi c'era anche l'algoritmo di Teoma del gruppo di Gerasulis.

PageRank era adeguato, ma probabilmente non il migliore, e comunque il successo di Google e` stato dovuto al "paid search", un'idea copiata da Goto.com di Idealab.

Un libro che ho letto attribuisce il successo di Google in particolare a due dettagli:

* La "paid search" a latere, invece che interfogliata.

* L'aver chiamato la "paid search" col titolo "sponsored link", invece che "ads", che e` il titolo corrente.

Una delle grandi ironie di Google e` che il loro "business model" scoraggia (pesantemente) gli "outgoing link" (salvo quelli a Google), che sono invece quelli su cui si basa il loro algoritmo di indicizzazione, che si basa sullo sfruttare lo sforzo degli autori di scegliere gli "outgoing link" piu` utili.

Beppe said...

Prima ancora c'era l'algoritmo HITS di Kleinberg.

L'algoritmo di Gerasoulis mi è sempre rimasto oscuro: non mi ha mai convinto che riuscisse a scalare in modo da poter fornire risposte in tempo reale, essendo basato sul calcolo di autovalori di matrici di una certa dimensione.
Del resto non mi pare abbia mai pubblicato i dettagli dell'algoritmo ma solo vaghe indicazioni nella documentazione di brevetto.

Dopo l'acquisizione di Teoma da parte di Ask e l'abbandono del servizio, resterà per sempre un mistero.

Beppe said...

La vicenda di Marchiori in Volunia si è conclusa ignominiosamente. Ma visto che l'Italia è un paese di mammoni, si dà la colpa ad altri e si consola il vero ressponsabile.