Hogyan keresők - studopediya

Characteristics- kereső és kereső

Keresési eszközökkel a második típus az úgynevezett automatikus index.

Egy ilyen index automatikusan összegyűjtjük, és a középpontjában keresők - automatikus indexek. Keressen kulcsszavakra adatbázis, úgy legfeljebb néhány másodpercig, ez hozza ugyanazt az eredményt, mint a Pick WWW-oldalak körül az interneten







Automatikus index három részből áll: egy robot programot. gyűjtött a robot adatbázis - index és a felhasználói felület a keresés az adatbázisban. Mindezen elemek működhet teljesen automatikusan, emberi beavatkozás nélkül, innen a név.

Kulcsszó keresés igényel szűkül a keresési terület

WWW-oldalak automatikusan indexel, sok: WebCrawler, Lycos, Excite, Inktomi, Open Text és mások. Például Lycos egy tárgy katalógus, valamint egy automatikus indexet. Alta Vista. bár ez nem haladja meg a hagyományos szerkezetét a „robot - Adatbázis - Keressen Interface”, ez az egyik leghatékonyabb eszköz a maga nemében.

Egy hasonló működési elv van Archie rendszer. célja, hogy keresni a fájlt anonim FTP-helyek. Archie már jóval korábban, mint a program-robot utazás a WWW (valamint az FTP, sokkal korábban WWW), így Archie rendszer nem ugyanaz a tulajdonosa, és a szerverek szétszórva a világban.

Basic - relevanciája és helytállósága.

Fontossági (latin relevo -. Raising megkönnyítik) az információszerzés - szemantikus keresésnek megfelelő és keressen dokumentum képe.

Helytállósága (latin pertineo -. Aggódik, attitűd) - megfelelés által talált adatkezelő rendszer dokumentum információkat a felhasználó igényeinek. Más szóval, ez az arány a kötet hasznos információt a teljes beérkezett információ mennyisége.

Ha tízből a talált dokumentumok 8 egyezik a lekérdezés, de csak 5 felhasználó által kért, ennek eredményeként a keresési releváns dokumentumok 8 és 5 helytállósága.

Keresések Cistemy általában három elemből:

  • szer (lánctalpas vagy a pók), amely mozgatja az interneten, és információt gyűjt;
  • egy adatbázis, amely tartalmaz minden olyan információt összegyűjtött pókok;
  • egy kereső, amely az emberek használni, mint egy interfész kölcsönhatásban áll az adatbázis.






Ez a készítmény a keresési (search engine) típusú szerek, pók, bejáró és robotok használnak, hogy információt gyűjtsön a dokumentumokat, amelyek az interneten. Ezek olyan speciális programok, amelyek keresik a weboldalakon, távolítsa el a linkeket ezeken az oldalakon, és automatikusan indexeli az információkat találnak, hogy építsenek egy adatbázisba. Minden kereső saját szabályrendszert, amely meghatározza, hogy Cobiralas dokumentumokat.

Agents visszanyert és az indexelés különböző típusú információkat. Egyesek például, indexelése minden egyes szót találkozott a dokumentumban, míg mások index csak a legfontosabb 100 szó minden indexelt dokumentum formátumát és a szavak száma, akkor a cím, fejezetek és alfejezetek, és így tovább.

Szerek is navigálni az interneten, és információt találni, majd betette a kereső adatbázisban. A rendszergazdák keresőmotorok meghatározni, mely webhelyek vagy webhelytípusokat szerek kellene látogatnia és index.

Ha valaki meg akarja találni olyan információt, amely az interneten elérhető, meglátogat egy kereső oldalra, és kitölt egy űrlapot részletező információt, hogy szüksége van. Itt, kulcsszavak, dátum és egyéb kritériumokat is használható. Szempontok a keresési űrlapot kell eleget tesznek az alkalmazott szer indexelése információkat találnak a navigálás során a weben keresztül.

Adatbázis megkeresi a keresett objektum alapján megadott információk a kitöltött űrlapot, és kiadja a megfelelő által készített dokumentumok adatbázisba. Annak meghatározására, hogy milyen sorrendben a dokumentumok listája jelenik meg, az adatbázis használ rangsorban algoritmus. Ideális esetben a dokumentumok, amelyek a leginkább relevánsak a felhasználó kérésére kerül az első a listán. Különböző keresők különböző rangsorolási algoritmusai, de az alapelvek meghatározására relevanciáját az alábbiak:

  1. Száma keresőszavak egy szöveges dokumentum tartalmát (azaz html-kód).
  2. Címkék, amelyben a szavak vannak elrendezve.
  3. Hely ismeretlen szó a dokumentumban.
  4. Arány szó legrelevánsabb amelyek viszonyítva határozzuk meg a teljes mennyiség szó a dokumentumban.

Ezek az elvek vonatkoznak az összes keresők. És az alábbiakban felsorolt ​​által használt néhány, de eléggé jól ismert (mint AltaVista, HotBot).

  1. Time - meddig egy oldal az adatbázisban kereső. Eleinte úgy tűnik, hogy elég értelmetlen elv. De, ha úgy gondolja, hogy hány vannak olyan helyek az interneten, akik élnek, legfeljebb egy hónap! Ha az oldalon van egy olyan hosszú idő, ez azt jelenti, hogy a tulajdonos nagyon tapasztalt ebben a téma, és a felhasználó a megfelelőbb hely, hogy a műsorok egy pár éve a világ, hogyan kell viselkedni az asztalnál, mint az, hogy megjelent egy hete, az ugyanazt a témát.
  2. Citation Index - hány oldal linkjeit vezet a többi oldalt az adatbázisban regisztrált kereső.

Az adatbázis megjeleníti rangsorolja a dokumentumokat ezen a módon. Különböző keresők is választhat a különböző módon megjeleníteni a kapott lista - néhány csak azt mutatják, a kapcsolatokat; A másik következtetés Linkek c első néhány szereplő javaslatok a dokumentum vagy a dokumentum címében a Ref.

Poshukovі szerverek (büdös Igen іnformatsіynimi rendszerek)




Kapcsolódó cikkek