Krom Kazıyıcı Eklentili Web Kazıma - Semalt Expert

Sraper, otomatik bir komut dosyasıdır ve web sayfalarından veri ayıklamak ve kazınmış verileri e-tablolara aktarmak için kullanılan kullanımı kolay bir araçtır. Bir Google Chrome tutkunuysanız, Chrome Kazıyıcı Uzantısı dikkate alınması gereken en iyi araçtır. Bu web kazıma aracı, tercih edilen web sayfasından faydalı bilgileri çıkarmanıza ve Google Dokümanlar'a aktarmanıza yardımcı olacaktır.

Neden Chrome Kazıyıcı Uzantısını seçmelisiniz?

Google krom kazıyıcı eklentisi, web'den okunabilir biçimlere büyük miktarda veri çeken bir kendin yap aracıdır. Tarayıcınıza sıyırıcı uzantısı yüklemek için Chrome Web Mağazası'nı ziyaret edin ve yükleme işlemini tamamlamak için "Chrome'a Ekle" seçeneğini tıklayın. Bu eklenti ile, web sayfalarını sizin için kazımak için bir programcı tutmanız gerekmez.

Tarayıcınıza yüklendikten sonra, sıyırıcı uzantısı sizin için tüm kazıma işlemini yapar. Başlamak için, kazınacak bilgileri seçin, seçilen verilere sağ tıklayın ve "Benzer Kazıma" yı tıklayın.

Kazıyıcı uzantısını kullanmayı dört gözle bekliyorsanız, bir programlama dili bilgisi minimum bir gerekliliktir. Bununla birlikte, XPath'i biliyorsanız, işler sizin için çok daha kolay olacaktır. Açıklık getirmek amacıyla XPath, düğüm kümelerini seçmek için yol ifadelerini kullanan bir programlama dilidir. Çoğu durumda, XPath, bir XML belgesinde kullanılan temel öznitelikler ve öğeler arasında gezinmek için çalıştığı eXtensible Markup Language (XML) belgelerinde kullanılır.

Bir web sayfasını Chrome kazıyıcı eklentisini kullanarak nasıl kazımak isterim?

Bu kılavuzda, web sayfalarını ve XML belgelerini kazıyıcı uzantıyla nasıl kazımayı öğreneceksiniz. Bir web sayfasından faydalı verileri almak ve Google Dokümanlar'a dışa aktarmak için aşağıdaki kılavuzu kullanın.

  • Chrome tarayıcınızı başlatın ve Chrome Web Mağazası'nı arayın. Ekran görüntünüzde "Chrome'a Ekle" seçeneğini tıklayın.
  • Hedef belgenizi veya web sayfanızı açın ve kazınacak tüm verileri seçin.
  • Seçili metne sağ tıklayın ve "Benzer Kopyala" seçeneğine basın.
  • Chrome, kazınmış verileri içeren başka bir pencere açar. Çıkarılan verileri dışa aktarmak için içeriği Google Dokümanlarınıza kaydetmek için "Google dokümanlarına kaydet" seçeneğini tıklayın.

Sıyırıcı uzantısı ile gelişmiş web kazıma

XPath, XML tabanlı bir metindeki düğüm kümelerini seçmek için kullanılan bir programlama dilidir. Bu programlama dili, JavaScript ve Python'da kullanılabilecek yol ifadelerini kullanır. Bir web sayfasını kazımaya çalışırken zorluklarla karşılaşırsanız, sıyırıcı konsolunuzu açın, sol üst köşenizde küçük bir kutu bulacaksınız.

Sıyırıcı uzantısı ile jQuery veya XPath'e gidebilirsiniz. Bu durumda, bir web sayfasındaki hedef öğeleri bulmak için "XPath" üzerine tıklayın. Kazıma görevini yürütmek için bir sayfadaki doğru öğeyi tanımlayın ve XPath'ini oluşturun. Bir sıyırıcı konsolu "Kolonlar" bölümünü içerir. Kazınan verilerinizi okunabilir ve kullanılabilir biçimlerde almak için sütun bölümlerini kullanın.