Todd Wilson

President at screen-scraper

Na Screen-Scraper, temos feito coleta de dados na web desde 2002. Então, já temos algum tempo aqui. Dentro desse tempo, temos trabalhado em praticamente todas as indústrias que você possa imaginar, desde viagens a e-commerce e fazemos bastante com os registros públicos oficiais.

Somos uma empresa relativamente pequena, na sua maioria criadores e engenheiros. Essa é também a minha formação, faço muita engenharia. Temos os nossos próprios produtos que lidam com a extração de dados, e utilizamos principalmente dados da web para alimentar o nosso produto Screen-Scraper.

Um dos nossos principais focos são os registos oficiais, porque é muito do que fazemos. Há muito valor nos registos dos tribunais. Estas podem ser escrituras ou registros locais da cidade. Pode mesmo ser informação pública que possa ser utilizada para fins de marketing, ou verificações de antecedentes, por exemplo.

Ao coletar dados públicos na web, a experiência e o conhecimento de como diferentes sites se comportam, tendo visto padrões diferentes, é fundamental. Por isso, o que penso que nos torna atrativos para potenciais clientes é o nosso nível de especialização e que o temos vindo a fazer há mais tempo e melhor do que qualquer outro.

Sinto que somos muito experientes, estamos muito familiarizados com as ferramentas que estão disponíveis. Acessar e descarregar estes conhecimentos de um site é também o tipo de coisa que é um pouco mais uma arte do que uma ciência. Se nunca fez antes, é difícil entrar pela primeira vez e começar a fazer de forma eficaz.

Coletar dados da web e prepará-los para análise interna não é fácil. Fazemos o nosso melhor para reunir e estruturar insights para os nossos clientes, mas por vezes os sites põem em prática medidas para tentar proteger-se, de modo a não receberem ataques de negação de serviço (DDoS).

Para responder aos administradores do site, temos de ajustar os parâmetros do nosso lado, o que implica escrever milhões de linhas de código, ao mesmo tempo que estruturamos os dados que recebemos, e ao mesmo tempo que estamos atentos a outros desafios de coleta de dados que possam surgir. E anda para trás e para a frente.

É aí que entra Bright Data. Se um site implementar medidas para desencorajar o nosso acesso, podemos utilizar a plataforma de Bright Data para recuperar os dados públicos da web de que necessitamos da forma mais eficiente, confiável e flexível: tipicamente através das redes Residencial, de Centro de Dados e Móvel de Bright Data, bem como do Desbloqueador da Web. Estes permitem-nos pesquisar, monitorar e analisar os dados e depois transmitir os valiosos conhecimentos aos nossos clientes.

Bright Data é o serviço premium, no que diz respeito aos serviços de coleta e otimização de dados na web. É como virar uma chave. Eles nos poupam muito tempo. Em vez de termos de investigar, afinar e solucionar problemas, temos dados que fluem como a água. É simplesmente o melhor em termos da extensa rede que oferece, a própria plataforma do ponto de vista técnico, as APIs, a flexibilidade que temos, e o superior serviço ao cliente que recebemos. É simplesmente o pacote completo.

Ao avançarmos para 2022, me surpreenderia se a necessidade de coleta de dados não continuasse a crescer, especialmente com mais ênfase na incorporação de grandes estratégias de dados, o que permite que as empresas sejam capazes de analisar dados, buscar tendências e impactar positivamente seus resultados.