Látens szemantikus indexelés
A látens szemantikus indexelés (röviden LSI) a Google webhelyeket indexelő és rangsoroló algoritmusának része.
Lényege, hogy a Google nem csak az alapján ítéli meg egy webhely relevanciáját, hogy egy specifikus felhasználói keresőkifejezés előfordul-e az oldal főcímében, meta címkéiben, horgonyszövegeiben, vagy hogy milyen gyakran fordul elő a tartalom törzsszövegében, hanem az alapján is, hogy hogy más, szemantikailag kapcsolódó szavak is megjelennek-e a szövegben.
Ennek a szempontnak a megvizsgálására a Google létrehozott egy LSI adatbázist. Ez az adatbázis több, ugyan azt a kulcsszót tartalmazó dokumentum összehasonlításával, és a kulcsszó mellett előforduló egyéb szavak megvizsgálása alapján jött létre. Azok a dokumentumok, amelyek nem csak a kulcsszóban (vagy kifejezésben), hanem sok más jelentős szóban is hasonlítanak egymásra, szemantikailag egymáshoz közelinek és relevánsnak minősülnek. Azok az oldalak, amelyek csak a kulcsszót tartalmazzák, de nem fordul bennük elő több (vagy semennyi) más szó a Google LSI adatbázisából, kevésbé relevánsnak minősülnek, és így alacsonyabb rangsorolást is kapnak.