Hogyan határozzák meg a keresőprogramok szóalakok

Hogyan határozzák meg a keresőprogramok szóalakok

A nagy és hatalmas orosz nyelv nem csak szép, de nagyon bonyolult. Gyakran előfordul, hogy még az intuitív fogalma anyanyelvűek ellentétes a hivatalos. Például egyikünk fog emlékezni arra, hogy hivatalosan is a „legjobb” - egy másik formája a „jó”, mert ez a páratlan melléknév? Ugyanakkor, a „szép” és „finom” - ezek különböző szavak, mert tartoznak a különböző szófajok, „szép” - a melléknév „szép” - egy határozószó.

Az eredmények elemzése gép még mindig nagyon eltér a mi intuitív ötlet. Ebben a cikkben fogjuk megvitatni, hogyan kell látni Yandex szóalakok és hogyan befolyásolja a keresési eredményeket.

Különbségek gép wordforms

Nyelvünkben, több százezer szó, amelyek mindegyike tíz, és néha több, szóalakok. Minden szó, viszont több tulajdonsággal bír (az esetben nem, szám, dőlés, stb.) Ha bármilyen jelzőt, lehet, hogy ez a hét nyelvtani esetekben rövid formában, két szám, a három szülés, két fokkal, hogy élő vagy élettelen. Így minden egyes jelző 129 szóalakok. Több mint felük lesz különböző befejezés.

Egyes morfológiai szótárak a helytakarékosság végén szavak vannak csoportosítva bizonyos morfológiai csoportokat. Például melléknevek „lopakodó” és „erős” ugyanolyan lezárás azonos szóalakok. Ilyen szavak egyesítjük, és ők jelezték csak az alapítvány közös minden szóalakok, és a különböző morfológiai csoport: „a hatalmas, hatalmas * Group №21».

A legtöbb elektronikus adatbázisok dolgozik egy hasonló elv. Ha menteni minden szóalakok egyénileg kell kiosztani körülbelül 500 MB memóriával rendelkezik, míg a csoport elegendő 10. Természetesen nagy 500MB a szerver - ez nem sok, de meg kell jegyeznünk, hogy a munka a morfológia Yandex lefolytatott mintegy 10 évvel ezelőtt, és ezután a vásárlás több száz szerver több memória drága volt öröm. Azóta, a szabályok az orosz nyelv nem változik, ezért nem volt szükség, hogy átírja a morfológia - annál is inkább, bármilyen rendszerszintű változás vezetett volna, hogy meg kell átírni más részein a kódot.

Szinonimák és szóalakok

A keresési eredmények, szóalakok vastagon. Mivel azonban a szinonimái. Ezért nem lehet azt mondani, az biztos, hogy a keresett szavakat a kódrészletet rendszer úgy ítéli meg, a kérelmet, és egyfajta szavak vagy szinonimák? Hogy kikapcsolja a háttérvilágítást szinonimák, és hagyja csak a szóalakok a Yandex akkor használja a kezelő „+”.

A legtöbb modern morfológiai adatbázisok alapján a szótárban Zalizniak ahol a helytakarékosság oldalain morfológiai csoportokat vezettek be. Mivel azonban az a tény, hogy Zaliznyak és kollégái dolgozott egy szótár több mint 40 évvel ezelőtt, hogy szenved néhány „archaizmusok.” Például, igék, igenevek és gerunds őket (írás / írta), akkor a közeli változatokat, míg az ige tökéletes és tökéletlen formában (írás / olvasás) - nincs.

Hogyan határozzák meg a keresőprogramok szóalakok

Tesztelés Yandex ilyen archaizmusok (ezek megtalálhatók az adatbázisban AOT.ru), azt találjuk, hogy tartalmazza szinte teljes erejét. Ugyanakkor érdemes figyelembe venni, hogy a Yandex használja az adatbázis „szinonimák”, és az egyik cél pontosan rögzíti a különbség felfogása szóalakok az emberek és gépek. Például, ha a kérés, hogy „hogy egy füst bomba” vastag és a szó „make”, akkor ha felveszi a „+” szavak előtt a „nem”, a háttérvilágítás a szó „hogy” eltűnik.

Hogyan lehet megérteni a Google szóalakok

Az angol nyelv nem olyan bonyolult, mint az orosz. Nem olyan gazdag, ő és morfológia: szóval már csak néhány szót formákat. Ezért szükség van egy csoportja szó annak érdekében, hogy optimalizálja a memória nem merül fel. Talán, mert az általánosság kedvéért kód orosz és angol nyelvű Google morfológia nem használja a csoportot, és így nem a hibái Yandex.

Ha beírjuk a kereső lekérdezés „készített”, akkor nem kell keresni a „tenni”, mint a Yandex. Ön kiválaszt Yandex és a Google a kifejezést „hogyan kell egy torta” kedvéért kísérletet. Szinte mindig, a Google kiemeli félkövér csak szóalakok, de letiltja a kiemelést a „make”, ha keres, hogy „nem” a kereső nem fog működni. Így kiderül, hogy a Google „nem” és a „nem” - szóalakok és a Yandex - szinonimái.

Furcsa módon, a Google orosz morfológia helyesen hajtják végre, mint a Yandex. Még több paradox tény, hogy egy ilyen rendszer - ez annak a következménye, hogy a Google eljött hozzánk Amerikából. Azonban ez mindig „jó” azt jelenti, „jobb”. A kibocsátás bármilyen jelentősége a keresési rendszer - egy nagyon vitatott kérdés. Amint az a tény, hogy a kereső az, hogy válaszul a vizsgálatot „Hogyan torta”.

A különbség eredmények rangsorolása

Az a tény, hogy a Yandex kiemeli vagy dosvechivaet szóalakok plusz jel arra utal, hogy a szóalakok morfológiai azonnal meghatározva, mások - szinonimaként. Könnyen lehet, hogy a Yandex nem tesz különbséget a rangsor a morfológiai és sinonimalnyh szóalakok.

Ma nincs olyan módszer megbecsülni a különbség a kérdés vagy szoftver saját számítás. Kézzel elemzik kibocsátása több száz kérés nagyon nehéz. Így bizonyítani, hogy van-e különbség a rangsor a különböző típusú szóalakok, ez lehetetlen. Az egyetlen módja -, hogy megtalálják a közvetett bizonyítékok.

Ha megkérdezzük a kereső gép szóalakok, az oldalak számát talált különbözni fog nem több, mint 1%. De kérésére szóalakok, szinonimák különbség sokkal jelentősebb, 10-30%:

  • „Legyen a Google a kezdőlapja” - 5 millió
  • „A Google készített egy honlap” - 5 millió
  • „Legyen a Google a kezdőlapja” - 7000000
  • „Vajon Google honlap” - 7000000

Érdekes összehasonlítani és módosíthatja a szállítási között a Google és a Yandex. Az első keresési rendszer közötti különbség kérelmek „hogyan lehet a torta” és a „hogyan kell egy torta,” gyakorlatilag nincs. Az első tíz Yandex mérkőzés lekérdezés csak 2 tízből, és ezek a pozíciók jelentősen változhat.

Van is egy csoportja szó, hogy vastagon egy nagyon furcsa elvet. Például ha beírja a „vásárolni”, hogy lesz kiemelve, és szóalakok a tökéletlen formában (például a „Vásárlás”), még akkor is, ha tesz egy „+”. A lényeg az, hogy Yandex vezetett be kivételt a szót, bár wordstat „vásárolni”, és „vásárolni”, és maradt más szavakkal. Ha szinonimák és szóalakok a kérdés ugyanaz volt, akkor nincs ok arra, hogy kivételt tesz ez a szó nem lenne.

„Buy” nagyon népszerű kérés (WordStat azt mutatja, hogy több mint 40 millió megjelenítés havonta), így további lépéseket annak érdekében, hogy rangsorban vettünk. Javíthatja az eredményeket kiadásának bevezetése közötti közvetlen kapcsolat „vásárolni”, és „vásárolni”, és nem egyértelmű, de a fejlesztők és a bírálók jobban tudják. Van egy másik példa, amelyben az adagoló javulás tagadhatatlan.

Beszélünk a „főzés” és „főzés”. Szerint wordstat „Főzés” van egy millió találatot, „főzés” - mintegy 100 ezer. Azonban, ha a cikk nem SEO-szakemberek ellenőrzik, akkor ez lesz az úgynevezett „Brewing Coffee”, és nem „Hogyan kávét.” Az előnye ennek a kivétel a rangsorban ott.

Mint mondják, kivételt csak megerősíti a szabályt. Mi alapján a kutatás azt mondhatjuk, hogy a morfológiai szóalakok rangsorolása magasabb szóalakok, szinonimák.

Nagyfrekvenciás lekérdezések

Isolation szinonimák zsír ki nem csak hozzáadásával egy „+”. Megjegyzés: ha beírja a „szálloda Moszkva,” a keresési sáv, a „hotel” nem világít. De ha beírja „Moszkva központjában hotel” vagy „hotel Kijev”, a háttérvilágítás ismét bekapcsol. Tehát van egy bizonyos küszöböt, amely, úgy tűnik, függ az oldalak számát az index, vagy a jelentősége az első oldalakon, de nem a gyakorisága a kérelmet. Amint ezt a küszöböt leküzdeni, szinonimák nem szerepelnek az ügyet, hogy ne rontsák az eredményeket.

Közös szóalakok elismerési szabályok

Tökéletes és tökéletlen formában az ige - szinonimák és szóalakok nem

  • Igaz csak Yandex
  • ≠, hogy köze
  • kivételek: buy / vásárolni, húzza ki / kihúzható, küldjön / post

Igék, igenevek és gerundot wordforms

  • Igaz csak Yandex
  • do = kész = done = tenni, és stb

mivel közösségben sovány számának, a nemek és az esetben, mint a melléknevek, és a fedezet, mint ige, az ige egyes Yandex több mint 100 szóalakok. És a „vásárolni”, amely kivételt képez, ők még. Communion lehet használni, hogy javítsa a rangsor igék (pl „vásárolt”, „megvásárolni” a „buy”).

Különböző szófajok, szóalakok nem egymást

  • Igaz csak Yandex
  • ≠ ≠ vásárlás vásárló vásárol
  • ≠ szépen Sing Sing szépen
  • ≠ erős atléta
  • kivételek: főzés / sütés, valamint az összes ige, igeneveket és gerunds

Minden szóalakok főnevek egy neme

  • igaz Yandex és a Google
  • ≠ szép szépség
  • ≠ Tanár

Páratlan melléknév a szóalakok

  • Igaz csak Yandex
  • jó = legjobb
  • Jó = Welcome = Welcome = Welcome = Welcome
  • = Gyönyörű szép stb
  • Megjegyzés: ≠ gyönyörű szép (ezek a szavak szinonimák)

Összehasonlító melléknév egyik wordforms

  • igaz Yandex és a Google
  • Jó = kinder
  • gyönyörű szép =
  • Megjegyzés: A Google jó ≠ jobb, mivel ez a szóalak kereső tárgya felsőfokon.

A Google szóasszociációs zajlik az intuitív hasonlóságuk inkább formális szabályokat az orosz nyelv, ami jól látszik a példa a „jó” - „jobb”. A többi összehasonlító melléknevek a rendes, és nem nagy alakja.

Amint azt már említettük, a legvalószínűbb a kereső jelentősége szóalakok, szinonimák alacsonyabb, mint a morfológiai szóalakok. Ezért, ha optimalizálni egy oldalt, akkor jobb felhasználása a szóalak a motor teljesítményét. Különösen fontos ez a javaslat, hogy ha tesz egy népszerű leírás az erőforrás sablon, mert így változtatni, hogy több ezer oldalt.

A specializáció - dolgozó, különböző térfogatú és témák. Weboldalak, névjegykártyák, portálok, online vásárlás.

Sikeresen végrehajtott több mint 113 projektet.

Kapcsolódó cikkek