Az online áruházak elemzése

Tehát most, hogy le a nagyon értelmező először írok a kódot (azok számára, akik kevés megértést megbirkózni anélkül, hogy a megjegyzések), majd elkezdik magyarázni a ravasz.







var lap = SpreadsheetApp.getActiveSheet ();

var tartomány = sheet.getRange ("A2: I5000");

var cell = range.getCell (startRow, 1);

var válasz = UrlFetchApp.fetch (url);

mert (var i = 1; i<=10;i++)

Az online áruházak elemzése

Jelenleg 2 funkció van, getconten és getPageContent. A getconten-ból átadjuk a szükséges adatokat, és futtatjuk a getPageContent függvényt, hogy elemezzük a getconten-ból átadott oldalt.

A getconten függvény: itt van egy hurok, amely megegyezik az ebben a részben szereplő oldalak számával. A ciklus minden egyes lépésénél linket küldünk az oldalra és a már feldolgozott termékek számára.

Tehát milyen linket kell beillesztenünk webhelyünkre? A legtöbb webhely hasonló struktúrával rendelkezik a site.ru / section /? Oldalak = 1 alatt a szóoldalon elrejtheti bármelyik szót a mi esetünkben, elindul, gyakran oldal. Néha egy webhely első oldalán, ahol ez a változó nincs jelen, egyszerűen csak át kell mennie a másodikra. A jobb megértés érdekében javaslom olvasni a GET kéréseket itt vagy a Google-on.

Formula 1 + 10 * (j-1) - van szükség annak érdekében, hogy rögzítse haladt, ahelyett, hogy felülírja a dokumentumot, ahol a 10 a bejegyzések száma (számlaszám az alapértelmezett bejegyzéseket frekvencián jobban menjen a kívánt oldalra egy másik böngészőt vagy! a privát lapon, akkor az oldalt pontosan úgy látja, ahogy a szkript látja).

A getPageContent funkció: itt a fő varázslat jön létre. Szerintem érdemes megmagyarázni csak a főbb pontokat, ha többet szeretne olvasni, akkor mindegyik funkció a Google-ban érdekelheti.

sheet.getRange ("A1: I5000") - itt választjuk azt a cellatartományt, amellyel dolgozni fogunk.

mert (var i = 1; i<=10;i++) - параметры цикла, где 10 см.формулу выше (!Внимание! цифры должны совпадать с формулой вышей).






A fő paramétereket állítottuk be, most készen állunk az elemzés konfigurálására.

További lépések azt jelentik, hogy a HTML alapfogalmai és az oldal forrásszövege van, ha nem, azt javasoljuk, hogy először olvasd el ezeket a dolgokat.

Így tehát a repülés elemzése:

Ahhoz, hogy beillesszen egy szöveget a cellába az oldalról, meg kell tudnunk a kezdeti pozícióját (kezdet) és a végét (végét). Ehhez egy egyedi sort találunk az elemhez, amelyet el akarunk távolítani, a termékkép esetén ez a karakterlánc

Ez egyedülálló, azt az egyetlen termék, ugyanakkor ez a lehetőség minden tétel, de mi lesz túl sok épület ezen a vonalon, ebben találjuk a ponton közelebb az információkat, és azt a park, mint a kezdet. Felejthetetlen, hogy hozzáadja a vonal összes karakterének számát.

start = textResp.indexOf ('

', vég) +24;

A végén még egyszerűbb itt van egy záró tag vagy idézetek.

Ezután a szubsztring funkció használatával kivonjuk a szükséges adatokat, tudva, hogy hol kezdődnek és hol végződnek.

Itt csak hozzárendeljük az értéket a cellához.

És ugorjon át az új oszlopra, ugyanazon a vonalon maradjon .offset (String, Column).

Felejthetetlen a végén, ugorjon egy új vonalra, és térjen vissza a nulla oszlopra.

cell = cell.offset (1, -5); - ahol az 5 az oszlopok száma, amelyekre elhagytuk, vagy egyszerűbb, mennyi adatot gyűjtöttünk össze az általunk kijátszott árukból.

Beszéljünk részletesebben az előnyeiről és hátrányairól:

Teljesen univerzális, és funkcionalitása lehetővé teszi, hogy szinte mindenre kiterjedjen, mint a legtöbb fizetett elemző.

Nem szükséges a szoftver telepítése.

A hiányosságokból bizonyos alapismeretek és a logika léte, kevés tapasztalat van. Nem használtam más felszólalókat, de azt hiszem, majdnem ugyanaz a bemeneti gőz.

Az elemző meglehetősen költséges, de ingyen van, vagyis minden egyes feladathoz hozzá kell igazítani, ezért érdemes csak akkor használni, ha az áruk nagyok.

Az első része a szövegnek, amely a szükséges információk előtt áll, például egy címke vagy valami más. Ennek a szövegnek egyedinek kell lennie, nem lehet csak címkézni

keresni. Általában ez a parancs adja meg a stringben az első előfordulás indexét.

+A 24 a karakterláncok száma a keresőszövegben, ha ez nem történik meg, akkor a cella ezzel a sorral együtt kerül beillesztésre.

Az elemző ezen verziója a katalógus, vagyis az áru előnézete. Megoldhatod úgy, hogy ez a parsil kártya, ha ilyen feladatra van szükséged. Mindig elég volt.

Bár egyszer magamnak a kártyákat elemeztem, de egyszer volt, és nem sok volt, nem akarom befejezni

// start = textResp.indexOf ('

', vég) +50;

// start = textResp.indexOf ('