Scrapy proxy integation

Scrapy Proxy Integration

This guide may be outdated. For an up-to-date guide please see our documentation.

What is Scrapy?

Scrapy is a Python framework for web crawling and scraping, which allows users to extract structured data from websites. It is open-source, fast, and extensible. Scrapy can be used for various purposes, such as data mining, monitoring, and automated testing.

Scrapy integration with Bright Data proxies

Open your preferred IDE and start a new scrapy project, type in the command line :

      scrapy startproject <project_name>
    

This will create a new folder with the project name, within the folder open a python file.

  • Go to your Bright Data Control Panel and clicking the ‘Proxies & Scraping Infra’ icon
  • Create a new proxy zone by clicking ‘Add’, choosing a network type, configuring the proxy, and clicking save
  • Under your proxy-zone’s ‘Access parameters’ tab, you will find your ‘USERNAME’ and ‘PASSWORD’ values.
  • In your scrapy spider code file, within the request’s meta parameter set the ‘proxy’ value to be the following, using the ‘USERNAME’ and ‘PASSWORD’ values from before: “http://USERNAME:[email protected]:33335
  • For Example:
      import scrapy

class BrightdatascrapyexampleSpider(scrapy.Spider):
name = "BrightDataScrapyExample"

def start_requests(self):
request = scrapy.Request(url="http://example.com",callback=self.parse)
request.meta['proxy'] = "http://USERNAME:[email protected]:33335"
yield request

def parse(self, response):
print(response.body)

Then run the following command in your command line :

      scrapy runspider <Pythonfilename.py>
    

How To Use Bright Data Proxy Manger With Scrapy

  • Create a proxy zone same as in the direct integration above
  • Install the Proxy Manager
  • Click ‘add new port’ and configure it for your use case
  • In your Scrapy spider code file, within the request’s meta parameter set the ‘proxy’ value to be the following: “http://IP:PORTNUMBER”
  • The local host IP is 127.0.0.1 – this is the value you need to use if the proxy manager is installed on your machine. If the proxy manager is installed on an external server, input that server’s IP address
  • The port created in the Proxy Manager is 24XXX, for example, 24000 – the default first port number
  • For example:
      import scrapy

class BrightdatascrapyexampleSpider(scrapy.Spider):
name = "BrightDataScrapyExample"

def start_requests(self):
request = scrapy.Request(url="http://example.com",callback=self.parse)
request.meta['proxy'] = "http://127.0.0.1:24000"
yield request

def parse(self, response):
print(response.body)

⚠️Important note: If you are using Bright Data’s Residential Proxies, Web Unlocker or SERP API, you need to install an SSL certificate to enable end-to-end secure connections to your target website(s). This is a simple process, see https://docs.brightdata.com/general/account/ssl-certificate#installation-of-the-ssl-certificate for instructions.

Get proxies for Scrapy

proxy badges

Impulsionado por uma infraestrutura de proxy residencial premiada

Mais de 400M+ monthly de proxies residenciais, a melhor tecnologia da categoria e a capacidade de segmentar qualquer país, cidade, operadora e ASN, torna nossos serviços de proxy premium a melhor escolha para desenvolvedores.

Proxy Network Pricing

50% DE DESCONTO
pay as you go plan icon
PAGUE O QUE GASTAR
$8 $4.00 / GB
Sem compromisso
Comece grátis
Use este código de cupom: RESIGB50

Use nossos proxies sem compromisso mensal
50% DE DESCONTO
2nd plan icon
141 GB incluso
$7 $3.50 / GB
$499 Faturação mensal
Comece grátis
Use este código de cupom: RESIGB50

Perfeito para pequenas empresas com uso moderado
50% DE DESCONTO
3rd plan icon
332 GB incluso
$6 $3.00 / GB
$999 Faturação mensal
Comece grátis
Use este código de cupom: RESIGB50

Projetado para equipes grandes com amplas necessidades operacionais
50% DE DESCONTO
4th plan icon
798 GB incluso
$5 $2.50 / GB
$1999 Faturação mensal
Comece grátis
Use este código de cupom: RESIGB50

Otimizado para empresas que executam operações em grande escala
Precisa de mais de 1 TB?
CONTATE-NOS
  • Escala ilimitada
  • Assentos ilimitados
  • SLA Premium
  • 99,99% de disponibilidade de rede
  • Gestor de Proxy Gratuito
  • Cobertura completa de dados
  • Preço personalizado por GB
  • Soluções personalizadas
pay as you go plan icon
PAGUE O QUE GASTAR
$8 / GB
Sem compromisso
Comece grátis
Use nossos proxies sem compromisso mensal
2nd plan icon
71 GB incluso
$7 / GB
$499 Faturação mensal
Comece grátis
Perfeito para pequenas empresas com uso moderado
3rd plan icon
166 GB incluso
$6 / GB
$999 Faturação mensal
Comece grátis
Projetado para equipes grandes com amplas necessidades operacionais
4th plan icon
399 GB incluso
$5 / GB
$1999 Faturação mensal
Comece grátis
Otimizado para empresas que executam operações em grande escala
Precisa de mais de 1 TB?
CONTATE-NOS
  • Escala ilimitada
  • Assentos ilimitados
  • SLA Premium
  • 99,99% de disponibilidade de rede
  • Gestor de Proxy Gratuito
  • Cobertura completa de dados
  • Preço personalizado por GB
  • Soluções personalizadas
pay as you go plan icon
PAGUE O QUE GASTAR
$0.6 / GB
Sem compromisso
Comece grátis
Use nossos proxies sem compromisso mensal
2nd plan icon
1 TB incluso
$0.51 / GB
$499 Faturação mensal
Comece grátis
Perfeito para pequenas empresas com uso moderado
3rd plan icon
2 TB incluso
$0.45 / GB
$999 Faturação mensal
Comece grátis
Projetado para equipes grandes com amplas necessidades operacionais
4th plan icon
5 TB incluso
$0.42 / GB
$1999 Faturação mensal
Comece grátis
Otimizado para empresas que executam operações em grande escala
Precisa de mais de 1 TB?
CONTATE-NOS
  • Escala ilimitada
  • Assentos ilimitados
  • SLA Premium
  • 99,99% de disponibilidade de rede
  • Gestor de Proxy Gratuito
  • Cobertura completa de dados
  • Preço personalizado por GB
  • Soluções personalizadas
Aceitamos esses métodos de pagamento:

Para os clientes, a melhor experiência do ramo

Você pede, nós desenvolvemos

Novos lançamentos de recursos todos os dias

Suporte global 24 horas por dia, 7 dias por semana

Para responder a qualquer pergunta quando você precisar

Transparência total

Painel de desempenho de rede em tempo real

Gerentes de contas dedicados

Para otimizar seu desempenho

Soluções personalizadas

Para atingir suas metas de coleta de dados

Líder em proxies e coleta de dados

650TB de dados públicos coletados todos os dias
Novos lançamentos de recursos todos os dias
Atendendo a 7/10 das principais universidades do mundo
4.6/5 classificação mais alta do Trustpilot na indústria

Ready to get Scrapy proxies?