Hogy keresők

Kezdeni, hogy válaszoljon a kérdésre: „Miért keres egy fájlt a számítógépen eltarthat néhány percnyi időt, és a keresők az interneten mind egy pillanatra?”.

Ebben a cikkben, azt fogja mondani, hogy a Yandex, ő keres, és hogyan kell kezelni elérni egy ilyen minimális keresési idő.

Egy másik példa. Korábban, amikor nem volt a személyi számítógépek, hogy talál egy könyvet a könyvtárban, szükség volt sokáig ásni a könyvtárak speciális kártyát. És ha ezek a kártyák nem voltak? Könyv keresése fogyaszt még több időt.

És végül, a harmadik példa - ez az index a könyv. Ha jól néz ki, akkor az index által olyasmi, mint egy irányítószámot. Mintegy is keres, és a kereső, de van néhány különbség.

1. A keresési index abszolút minden szava, nem csak az olyan kifejezésekkel, amelyek előfordulnak a szokásos index. A könyvek tárgymutató feltétel csak közönséges szavakat, míg kihagyva elöljárók, indulatszavak és részecskéket. A keresési index használ abszolút minden szava.

2. A keresési indexek minden utalást a szavakat. Az index a könyv ad utalásokat használatát ezeket a szavakat egy párszor. A keresési index robot emlékszik teljesen említést, valamint azt az oldalt, ahol azok elhelyezkednek, mondatok száma és szavak ebben a mondatban. Ez nagyon fontos a kialakulását a kibocsátás. Plusz, a keresési index még mindig sok előnye van, például morfológia, szóalakok, stb

Hogy nézett Yandex keresési index? Például egy adott lekérdezés (legyek és hogyan Barmaglot pylkaet tűz). A képen látható a lista az összes szót, és melléjük 2 számjegy. Az első szám - ez hány szót az interneten, és a második - ez hány használják őket a dokumentumokat.

Ha megnézzük a „pylkaet”, akkor egyértelmű, hogy ez a szó az interneten található 11.000-szer 5000 dokumentumokat. És például az „és” szó megfelel a 38 milliárd. Times. Alapvetően ez minden világos és logikus, elvégre „és” - uniója, amelyet gyakran használnak a magyar nyelvben. Keresés index egy listát az összes dokumentumot, amennyiben ezeket a szavakat használjuk, majd a kérdés alapján ezeket a listákat.

A legérdekesebb az, hogy a kérdés a feltétlenül felül az összes $ 38 milliárd. A „és” szót, és akkor csak megtalálja bárhol „és” együtt használják a „pylkaet”. Bár általában Yandex hasonló szavak, amelyeket gyakran használnak általában nem néz. Jellemzően Yandex keres egy köteg ritkábban használt szavak.

Van olyan dolog, mint a kereső. A kép egy fénykép az első kereső Yandex szerver. Miután minden, a felhasználói kéréseket és a fejlesztők élvezni minden új látogató.

Mert abban az időben az internet nagyon kicsi volt. Bármennyire is viccesen hangzik, de a kifejezés, mint a „Letöltés az internetről, majd a ház az ő tiszteletére - valódi volt.” Aztán az egyik ilyen kereső tudta befogadni a teljes internetes keresőprogram index. Most, persze, az internet nőtt, és beszélni ezeket a szervereket nevetséges. Most fogalmát használja a keresési klaszter.

Keresés klaszter - ez az, amikor az egész internetes oszlik bizonyos részeit, és minden rész kerül egy adott szerver. Előfordul, hogy az egyik része a helyszínen van egy szerveren, és a második része a helyszínen, a másik. A Yandex egy nagy külön szerver „Metalpoisk”.

Hogyan működik a keresés? Ön meghajtók egy keresési lekérdezést a Yandex. Yandex szerver rögzíti a kérelmet, majd szétosztja a több ezer kisebb szervereket. Minden szerver néz annak töredék. Ezután a fragmentumokat gyűjtöttük egy egységet a nagy szerver és eljuttatja a felhasználót a képernyőn. A szerver, amely lebontja a kérést, a továbbiakban: „Metalpoisk” és kisebb szerverek - „Basic Search”.

Következő Anatolij elmondta, hogyan kell megépíteni Yandex adatközpontok.

Korábban Yandex a hagyomány a régi magyar ábécé betűit használják a számozás a kis szerverek, majd végül a levél nem csak a régi magyar, hanem a latin ábécé. Most Yandex kellett eltérni a hagyomány és a számozott szerver.

Ezután megmagyarázni, hogy ez replika és adatközpontok. Az alapvető szabály az irodai berendezések, mint a nagyobb, annál gyakrabban lerobban. Ha Yandex repülni egy pár autó, akkor egyszerűen nem lesz képes megtalálni néhány időpontot a kéréseket. Ahhoz, hogy hasonló helyzetek nem merülnek fel a használata Yandex másológépek, amelyek úgynevezett replikák. Ha egy gép meghibásodik, akkor azonnal kapcsolja be a biztonsági berendezés, amely segít, hogy a rendszer teljesen működőképes. Ezt a folyamatot nevezik replikáció. Egy ilyen replikációs között fennálló összes adatközpontok cégek. Abban az esetben, ha teljesen összeomlik a teljes adatközpont (a szobában, ahol minden szerver található), majd azonnal kapcsolja be a biztonsági adatközpontban.

Mivel az index? E célból Yandex van egy speciális robotot, amely elkötelezett készül minden indexek, majd rakja őket a keresést.

Hogyan működik a robot? A robot működik egyszerűen. Letölti az összes tartalmi oldalakon, osztja őket indexek, ami később átterjed a kereséshez. Ezért az információ frissítésre a kereső Yandex nem azonnali, de néhány nap múlva.

Kezdjük azzal a ténnyel, hogy az internet végtelen. Tény, hogy sok lenne egyet, de ez tény. Mindenki hozzon létre egy honlapot, amely tartalmazza egy adott oldalt egy bizonyos számot, de egy bizonyos számú, akkor dolgozzon ki egy speciális oldalt. Egyértelmű, hogy végtelen számú oldalak jönnek létre, hogy az emberek, a sok szemetet. robot feladata, hogy szitál a szemetet úgy, hogy csak a szükséges és hasznos információkat a felhasználó számára.

A második probléma a robotok - ez változik oldalakon. A robot lát a helyszínen sem jut ezen az oldalon. Weboldal dob be egy teljesen más tartalmat. Ebben az esetben a robot újra kell rostálni keresztül az ilyen oldalakon.

Továbbá, a robot köteles ellenőrizni a spam oldalak, folyamatosan próbál becsapni a rendszert, mesterséges mászás, a tetejére a kibocsátás.

Összefoglalva, ebben a cikkben a választ a leggyakrabban feltett kérdéseket.

1. Milyen az DMOZ sorban megtalálni? Lesznek előnyei, ha regisztrál a webhely Yandex katalógusban? Igen, vannak, azon az alapon, hogy a helyszín a katalógusban meghajtó élő emberek, így a robot segítségével a könyvtár lesz sokkal több információt a honlapon. Mindenesetre, ez hasznos SEO.

2. Miért van az, néha kereső másképp reagál ugyanarra a kérelmet? Azon egyszerű oknál fogva, hogy a keresők által vezérelt valamit, hogy a felhasználó hasznos információt. Ezért a kiviteli alakoknál a rangsor oldalakon különböző felhasználók különböző lehet.

3. helyek bontjuk? Azt nem mondhatjuk, hogy a helyszínek bontjuk. Bontjuk oldalak oldalakat. Mindezt annak érdekében, hogy csökkentsék a terhelést a kereső. Egy időben a Yandex volt egy hiba. Ha a felhasználók keresnek a Yandex Rambler, gyakran nem találjuk meg. És ez volt, hogy az összes Rambler feküdt ugyanazon a gépen. És ha sok felhasználó fordul a gép, akkor természetes, hogy az idő az ő visszatérése nőtt, és a felhasználók nem látják a kereső Rambler. Később ezt a hibát rögzítették, terjesztése minden szerver egy szelet az oldalon.

4. Mit jelent a „darab az interneten” vagy „darab egy hely?” Ma van olyan dolog, mint shardirovanie (Szilánk - egy darab az internet). A Yandex shardirovanie fordul elő körülbelül 10 fájlokat.

5. Mivel a robot megkeresi az új oldalakat? A robot megkeresi az új helyek minden lehetséges forrásból. A robot beolvassa a linkeket maradt más oldalakon, hogy már indexelt. Szintén keresők van egy gomb, mint a „Küldje el webhely”.

6. Melyek a kiemelt helyeket gyakrabban indexelés robotok? Ez egyszerű, annál gyakrabban a webhely frissítésekor, annál gyakrabban indexek a robot. De meg kell értenie, hogy a kereső pókok nem volt ideje index egyszerre, így kell választani indexelés oldalak által fokú hasznosságát.

Kapcsolódó cikkek