Vizsgálata az élő adás Yandex van-e értelme, hogy elemezzük és, hogy tartalmaz egy

Vizsgálata az élő adás Yandex van-e értelme, hogy elemezzük és, hogy tartalmaz egy

A kísérlet célja az volt írva többszálú elemzőt, és maradt egy hétig egyedül dolgozni. Egy héttel később, 414 GB információt talált és 4460619547 a szerveren. Vidáman dörzsölte tollak, a szakértők elkezdték eltávolítani másolatok tömb kifejezéseket. És mi a meglepetés, amikor eltávolítása után ismétli a tömbben marad csak 15.068.199 egyedi kifejezések - valóban jelentéktelen összeg, mint az eredeti kötetet.







Így elmondható, hogy a gyakorlatban elemzés a webcast nem ad statisztikailag szignifikáns eredményeket - ezen a héten érkezett 8000000 kifejezések, az év ki fog derülni, a legjobb 300-350.000.000, ami nem jelentős mennyiségű szempontjából kortárs adatbázis-kulcs a piaci igényekhez.







Vessünk egy közelebbi pillantást, amit már kapott eredményeként elemzés héten.

  • elemzés a folyamok száma - 10
  • az arány kézhezvételét kulcsszavak - mintegy 10 ezer másodpercenként
  • Felvétel végeztük 70 fájlok, szöveges fájlok (7 napon át 10 stream):

Vizsgálata az élő adás Yandex van-e értelme, hogy elemezzük és, hogy tartalmaz egy

  • fájl mérete 1,6 GB, 8,8 GB
  • A számos kulcsfontosságú mondatok során nyert elemzés - 4460619547
  • A számos kulcsfontosságú mondatok eltávolítása után ismétli - 15068199

A mintavételi frekvencia szó, kivéve a szakszervezetek és prepositions acélból (tartalmaz használati gyakoriság, idő):

Önmagában az élő közvetítés is megtalálható kérdések kitalálni - úgy tűnik, ez a szám a találat a keresési eredmények az adott lekérdezés. Optimalizálókkal megszerzésében érdekelt ez a paraméter is eltarthat közvetlen éter - ellentétben a szokásos kérdés, nincs captcha és elemzési fordul szinte ingyen.