URL-de “Semalt” jikme-jiklikleri - Örän oňat web gözlemek we maglumatlary çykarmak guraly

URLitor täze, ýöne täsirli web gözlemek we maglumatlary çykarmak guralydyr. URLitor-y ulanmak üçin, görkezilen şablonda onlaýn mazmunyny ýok etmek isleýän ähli URL-leriň sanawyny goşmaly. Soňra web sahypalaryndan çykarmak isleýän HTML elementiňizi görkezmeli we tabşyrmak düwmesine basmaly. Munuň ýaly aňsat. Bu gural bilen, indi brauzerden göçürip ýa-da göçürmek zerurlygy ýok.

xPath, XML faýllarynda maglumat gözlemek üçin ulanylýan dil. XML faýllaryndaky düwünleri ýa-da düwünleri saýlamak üçin käbir aňlatmalary ulanýar. XPath-yň düşünýän sözleri adaty kompýuter faýllary ýa-da resminamalary bilen ulanylýan sözlere gaty meňzeýär.

XPath birnäçe programmirleme dilleri bilen ulanylsa-da, bu gural hiç hili programmirleme bilimi bolmadyk ulanyjylar üçin guruldy. Şeýlelik bilen, ony ulanmak üçin programmist bolmak hökman däl. Bu gural bilen birnäçe HTML we XML sahypalaryndan maglumatlary alyp bilersiňiz.

Ulanyşyň ýönekeýligi üçin, ýygy-ýygydan ulanylýan birnäçe XPath aňlatmasy açylýan menýuda öňünden kesgitlenildi, şonuň üçin ulanyjylar diňe maksadyna baglylykda haýsydyr birini saýlamaly bolarlar. Şeýle-de bolsa, “XPath” -yň ýokary tejribeli ulanyjylary islän wagtlarynda öz adaty sözlerini ulanmaga haklydyr.

Gural bir gyryş sessiýasynda 100 URL-lik kuwwatlylyk bilen işlenip düzüldi we birbada iň köp 10 aňlatma alýar. Başgaça aýdylanda, bir gezekde iň köp 100 URL-den maglumatlary gyryp biler.

Üýtgedip ýa-da goşup boljak käbir möhüm XPath adaty aňlatmalar aşakda beýan edildi:

1. // div [2] - Bu aňlatma ikinji diweri iýerarhiki taýdan saýlaýar;

2. // link [@ rel = 'kanoniki'] / @ href - Bu aňlatma, rel atributyny kanoniki bilen deňleşdirmek üçin ulanylýan belligiň ýerleşýän ýerini (ref) saýlaýar;

3. / html / head / meta [@ name = 'description'] / @ mazmun - Bu aňlatma mazmuny saýlamak üçin ulanylýar;

4. // * [@ class = 'class-name'] - Bu aňlatmany CSS synpy hökmünde 'class-name' bilen ähli elementleri saýlamak üçin ulanyp bilersiňiz;

5. // h2 | // sözbaşy - Bu aňlatma ilkinji H2-ni we sahypanyň adyny saýlamak üçin ulanylyp bilner;

6. // * [name () = 'h1' ýa-da name () = 'title'] - Bu aňlatma ýokardaky ýaly işleýär. Şeýle-de bolsa, ýokarda görkezilen aňlatma has gysga bolany üçin has gowudyr;

7 .

8. // ene-ata :: * [text () = 'Hoş geldiňiz'] - Bu aňlatma 'Hoş geldiňiz' teksti bolan islendik elementiň ene-atasyny saýlaýar;

Bu gural Beta wersiýasy bolup, käbir ýalňyşlyklar bilen işläp biler. Şeýle-de bolsa, programmirleme bilimi az ýa-da ýok ulanyjylar üçin henizem ajaýyp gural, sebäbi ýygy-ýygydan ulanylýan sözlemleriň hemmesi öň aýdylyşy ýaly menýuda öňünden kesgitlenildi.

mass gmail