Friday, July 6, 2012

LSI e motori di ricerca

Ora, che cosa ci guadagno attraverso l'uso di questa tecnologia LSI?


Per rispondere brevemente, possiamo dire che con LSI, motori di ricerca ha preso un passo in avanti per darci un risultato di ricerca ideale. Ora vi chiedo - che cosa è un risultato di ricerca ideale? Poi, rispondere a questa domanda! Che cosa cercare quando si digita una parola chiave o un contesto nella casella di testo di ricerca di Google?


Con il numero di pagine Web, aumentando voluminously sul Web, vorremmo fare affidamento senza dubbio sul motore di ricerca e desidera utilizzarle come un bibliotecario con enorme capacità di ricordare, la capacità di dare risultati più precisi e rilevanti e che troppo, con un meraviglioso senso di ordinamento. Più tecnicamente, il motore di ricerca ideale dovrebbe essere in grado di soddisfare questa Trinità di richiamo, precisione e ordine. E questo è dove LSI si inserisce nella meravigliosamente e aumenta la potenza del motore di ricerca per convergere con l'intelligenza artificiale.


Diamo un'occhiata al computer muto problemi che LSI può bene prendersi cura di.


Come abbiamo detto, un motore di ricerca convenzionale basato sulla parola chiave di ricerca potrebbe non dare i migliori risultati. Questo è semplicemente perché i programmi del motore di ricerca non possono distinguere tra:


• Simili parole con significati diversi, ex: workflow Monitor o monitor
• Parole che sono simili nel significato ma scritto in modo diverso, ex: malattia e malattie
• Forme singolari e plurali di parole, ex: pulsante e i pulsanti
• Parole con simili radici, come il diverso, è diverso e diversi
• Altre parole grammaticalmente diverse, come ad esempio arrosto, arrosto


La LSI, perché si concentra su un mucchio di parole chiave, quindi a dire e non una sola parola chiave e attraverso il suo modello ha studiato la relazione tra parole semanticamente vicini e lontani in una raccolta di documenti, esso non confondersi tra singolari e plurali o sinonimi. Esso semplicemente continua a trovare il contesto sviluppato da un gruppo di parole chiave. Così che, quando si cerca Tiger Woods, non va per cercare pagine Web che ha usato le parole chiave "tigre ' e 'bosco' liste ma un insieme di pagine che discute di Golf. Questo è quello che viene chiamato feedback sull'attinenza.


Di solito, si trova che i risultati della ricerca sono ridotti con l'aumento del numero di parole chiave che si cerca. Questo è perché una ricerca motori funzioni meglio quando studiare, indicizzare e ricordare per più brevi e un semplice insieme di parole chiave. LSI va che l'altro modo tondo e primo si concentra su sapendo e l'analisi di un documento esaustivamente prima di indicizzazione o categorizzare esso. Pertanto, un motore di ricerca semantico latente consente all'utente di fare una ricerca iterativa e fornisce il feedback utile per inquadrare una ricerca migliore, se necessario.


LSI è più vicino alla categorizzazione e tassonomie generati da umani e prende un lungo passo nella strutturazione dei dati non strutturati. Quindi, è più favorevoli all'archivio. Esso permette di archivisti per efficientemente etichettare e indicizzare le categorie generati da LSI. LSI fa mezzo il lavoro e ogni documento non deve essere indicizzato da zero.


LSI aiuta nel sottolineare qualsiasi parte del contenuto che è rilevante, ma non coperto in un documento confrontando i dati o contenuti parole su un determinato argomento. Questo può trovare impiego in contesti diversi, uno dei quali è una sorta di sistema di classificazione automatica, dove un'assegnazione viene confrontata con un campione di data qualità.


LSI può indagare le relazioni semantiche all'interno di un testo per decidere la pertinenza e la coerenza nelle parti componenti. Adozione in un'applicazione di questo aumenterebbe la leggibilità e la comprensione. Naturalmente, queste proprietà possono essere utilizzate in modo efficace progettazione didattica e tecniche.


Tuttavia, l'uso finale e più rilevante di LSI è forse il suo potere per filtrare le informazioni e prevenire lo spamming o la distribuzione di posta elettronica non richiesto. Adattamento e regolazione di un algoritmo semantico latente nella vostra cassetta postale e nutrire i dettagli di messaggi spam noti in esso, posta indesiderata può essere impedito in modo più efficace rispetto con l'attuale sistema di approcci di parola chiave basata.


LSI è una tecnica estremamente metodica che ha bisogno di una quantità elevata di precisione monotono, uno che un computer può fare in modo efficiente. Come ovvio, la tecnica comporta una ricerca puramente meccanica sulla base di un'ampia valutazione di un insieme di parole e confrontando la loro presenza in un insieme molto più ampio di documenti. Il processo può essere automatizzato perché il computer non ha bisogno di capire la query di ricerca o il significato delle parole.

No comments:

Post a Comment