Neste tutorial, você aprenderá:
- O que é o Dify e por que ele é uma ferramenta interessante para a criação de agentes de IA.
- Por que os agentes de IA precisam ter acesso a dados da Web atualizados e precisos para fornecer resultados confiáveis.
- Como criar um agente de IA com recursos de recuperação de dados usando um fluxo de trabalho Dify sem código.
Vamos mergulhar de cabeça!
O que é a Dify?
A Dify é uma plataforma de código aberto cada vez mais popular para a criação de aplicativos de IA generativa com LLMs. Ela simplifica o processo de desenvolvimento, oferecendo uma interface visual sem código/baixo código para a criação de fluxos de trabalho de IA e pipelines RAG.
Você pode aproveitar a Dify por meio de sua versão auto-hospedada e de código aberto ou utilizá-la diretamente na nuvem sem nenhuma configuração (como faremos aqui). Essencialmente, ele atua como um BaaS(Backend-as-a-Service) para operações de LLM.
A Dify suporta uma ampla gama de LLMs e oferece amplos recursos de integração por meio de vários plugins. Eles permitem conexões com vários serviços e soluções de terceiros. No momento em que este texto foi escrito, seu mercado apresentava cerca de 100 plug-ins e extensões.
Os agentes de IA precisam ser precisos e eficazes
Independentemente da plataforma, biblioteca ou ferramenta de criação de agentes de IA que você escolher, há uma limitação importante: para serem precisos, os agentes de IA precisam de dados de alta qualidade. Com relação a isso, lembre-se de que a Web é uma das fontes de dados mais ricas e confiáveis.
Portanto, para ser realmente eficaz, um agente de IA deve ser capaz de acessar e extrair dados diretamente das páginas da Web. Mas não basta apenas extrair o conteúdo bruto. Os dados devem ser otimizados para uso de IA, de preferência no formato Markdown.
Dica profissional: o Markdown é compacto e mais fácil de ser processado pelos modelos de IA, o que geralmente leva a resultados mais precisos, conforme confirmado por nossos benchmarks.
É por isso que seus agentes de IA da Dify precisam de um plug-in que possa extrair conteúdo estruturado, como Markdown, de qualquer página da Web. Isso é especificamente o que o plug-in Bright Data Dify oferece. Além disso, ele permite que seu agente de IA sem código extraia dados novos de mecanismos de pesquisa e de mais de 50 plataformas populares no formato JSON estruturado.
O plug-in Bright Data lida com todos os desafios da coleta de dados da Web para você, incluindo CAPTCHAs, bloqueios de IP, limites de taxa e muito mais. Em seguida, graças ao construtor de fluxo sem código da Dify, você pode integrar tudo ao seu agente de IA apenas conectando os nós. O resultado é um agente de IA pronto para produção com acesso a dados da Web confiáveis e em tempo real.
Como integrar o plug-in Bright Data à Dify para a criação de agentes de IA
Nesta seção guiada, você aprenderá a criar um agente de IA na Dify. Em particular, você usará o plug-in Bright Data como o mecanismo de dados pronto para IA que alimenta o agente com informações confiáveis.
Vamos acompanhar a criação de um agente de resumo simples que pode resumir o conteúdo de qualquer página da Web. Observe que este é apenas um exemplo para demonstrar o que é possível fazer com a integração Dify + Bright Data. Você pode cobrir muitos outros casos de uso com a mesma facilidade.
Observação: de certa forma, o exemplo escolhido pode ser visto como um fluxo de trabalho agêntico do RAG. O motivo é que o plug-in do Bright Data pode ser visto como o componente de recuperação no processo agêntico do RAG.
Siga as etapas abaixo para criar um agente de IA sem código na Dify que acesse dados atualizados da Web!
Pré-requisitos
Para reproduzir este tutorial e criar um agente de IA na Dify com tecnologia Bright Data, você precisa do seguinte:
- Uma conta Dify (um plano gratuito é suficiente).
- Uma chave de API da Bright Data.
- Uma chave de API de um provedor de LLM (neste exemplo, usaremos uma chave de API do Gemini )
Se você ainda não os tiver, clique nos links acima e siga as instruções de configuração.
Etapa 1: Integração do LLM
Observação: se você já tiver uma integração LLM configurada em sua conta Dify, poderá ignorar esta etapa.
Para criar um agente de IA na Dify, primeiro você precisa configurar um provedor de LLM. Para fazer isso, faça login na Dify e acesse seu painel. Clique na imagem de seu perfil no canto superior direito e selecione a opção “Settings” (Configurações):
Em seguida, na barra lateral do modal, clique na opção “Model Provider” (Provedor de modelo). Aqui, você pode instalar o provedor de LLM que deseja usar. Neste tutorial, usaremos o Gemini (que pode ser usado gratuitamente via API):
Passe o mouse sobre a opção Gemini e pressione o botão “Install” (Instalar). Depois de instalado, clique no botão “Setup” e cole sua chave de API do Gemini para concluir a configuração:
Depois disso, pressione “System Model Settings” (Configurações do modelo do sistema) para definir o Gemini como seu provedor global de LLM em sua conta Dify:
Escolha o modelo que você deseja usar. Neste caso, selecionaremos “Gemini 2.0 Flash” (que é gratuito via API). Em seguida, clique em “Save” (Salvar):
Perfeito! Sua integração do LLM na Dify está concluída.
Etapa 2: Instalação do plug-in Bright Data
Chegou a hora de instalar o plug-in Bright Data Dify. Para fazer isso, clique na opção “PLUGINS” localizada na barra lateral à esquerda da foto do seu perfil:
Na seção Dify Plugin Marketplace, clique no botão “Install Plugin” (Instalar plug-in) e escolha a opção “GitHub”:
No modal que aparece, cole a URL do GitHub para o plug-in Bright Data Dify:
https://github.com/Idanvilenski/BrightData_Dify_Plugin
Selecione a versão do plug-in (recomenda-se a versão mais recente), escolha o pacote do plug-in e clique em “Next” (Avançar):
Clique em “Install” (Instalar) para finalizar a instalação do plug-in. Depois de instalado, clique no cartão do plug-in. No painel que se abre à direita, clique no botão “Authorize” (Autorizar):
Cole seu token da API da Bright Data e clique em “Save” (Salvar):
Incrível! O plug-in Bright Data Dify agora está instalado e suas ferramentas estão prontas para uso.
Etapa 3: criar um novo aplicativo Dify
Agora você tem tudo pronto para criar seu agente de compactação de IA sem código. Volte ao painel da Dify e clique em “CREATE APP > Create from Blank” para iniciar um novo projeto de agente de IA:
Selecione o modelo “Workflow” (Fluxo de trabalho), dê ao seu agente de IA um nome como “AI Summarization Agent” (Agente de sumarização de IA) e clique em “Create” (Criar) para inicializar o aplicativo:
Você verá a tela visual em que pode criar seu agente conectando os nós:
É aqui que você definirá a lógica e o fluxo de dados do seu agente de IA, vinculando diferentes componentes. Fantástico!
Etapa nº 4: Desenvolver a lógica do agente de IA
Antes de implementar o seu agente de IA sem código, dedique algum tempo a pensar no que o agente de IA precisa fazer. Nesse caso, o agente de IA deve:
- Receba o URL da página da Web a ser resumida.
- Passe o URL para o plug-in Bright Data para recuperar o conteúdo da página no formato Markdown.
- Envie o conteúdo do Markdown para o LLM configurado com um prompt para gerar um resumo.
- Retorna o conteúdo resumido para o usuário.
Nas próximas quatro etapas, você implementará cada uma dessas ações conectando nós e usando plug-ins no Dify.
Etapa 5: Configurar o parâmetro de entrada do URL da página
Primeiro, clique no nó “START” e, em seguida, clique no ícone “+” para adicionar uma nova variável de entrada:
Nas opções de tipo de entrada, selecione o tipo de dados “Parágrafo”. Isso é ideal para a entrada de texto como um URL. Nomeie a entrada com algo como page_url
:
Certifique-se de que a opção “Required” esteja ativada, pois essa entrada é essencial para o funcionamento desse agente de IA. Depois de salvar, você verá algo parecido com isto:
Veja como o nó “START” agora mostra sua variável de entrada personalizada. Muito bem!
Etapa 6: Recuperar o conteúdo Markdown com o plug-in Bright Data
Clique no botão “+” no nó “START” e selecione o plug-in Bright Data. Em seguida, escolha a ferramenta “Scrape As Markdown”:
Configure a ferramenta definindo page_url
como o parâmetro de entrada. Além disso, ative a opção “RETRY ON FAILURE” (Tentar novamente em caso de falha). Isso permite que o plug-in Bright Data tente novamente de forma automática se ocorrer um erro durante o processo de raspagem:
Maravilhoso! O plug-in Bright Data agora pegará o URL fornecido, extrairá a página e retornará seu conteúdo no formato Markdown.
Etapa nº 7: Integrar a lógica de resumo do LLM
A próxima etapa é conectar um nó LLM que resumirá o conteúdo Markdown retornado pelo plug-in Bright Data. Clique no ícone “+” no nó “Scrape As Markdown” e selecione “LLM”:
Nas configurações do nó “LLM”, defina a entrada “CONTEXT” como a variável de texto
, que é a saída da ferramenta “Scrape As Markdown”.
Em seguida, escreva um prompt como o seguinte:
You are a summarization agent. Based on the Markdown content provided below, write a concise and helpful summary in no more than 150 words. Focus on capturing the key elements of the content.
Content:
{CONTEXT}
O nó “LLM” atua como o cérebro de seu agente de IA da Dify, processando os dados e gerando o resumo. Fantástico! Você está quase terminando a lógica de criação do agente de IA.
Etapa nº 8: Devolver o resumo
Como etapa final em seu fluxo de trabalho de agente de IA da Dify sem código, adicione um nó “End”:
Configure o nó “END” para usar a saída de texto
do nó LLM:
Esse nó tratará do retorno do conteúdo final resumido para o usuário. Missão concluída! Seu agente de compactação de IA sem código está pronto para ser usado.
Etapa 9: teste seu agente de IA
É assim que deve ser o fluxo de trabalho completo do agente de IA da Dify:
Com apenas quatro nós, você criou um agente de IA do mundo real com recursos de resumo precisos.
Para testá-lo, clique no botão “Run” (Executar) no canto superior direito:
Em seguida, insira o URL da página que você deseja resumir. Para este exemplo, você deve usar um artigo da CNN Sports.
Pressione o botão “Start Run” e você verá cada nó ser executado em sequência, ficando verde para indicar o sucesso:
Este é um possível resultado que você deve obter:
This CNN article analyzes the epic French Open final between Carlos Alcaraz and Jannik Sinner, highlighting it as proof that men's tennis is in good hands for the future. Alcaraz's improbable comeback from two sets down against Sinner is described as a historic moment. The author notes that with the era of Djokovic, Federer, and Nadal ending, Alcaraz and Sinner have demonstrated that they are ready to fill the void. The rivalry between Alcaraz and Sinner is compared to the great rivalries of the past, with the potential to elevate the sport. Experts even suggest that Alcaraz and Sinner could beat Nadal at his best. The article emphasizes the high level of play and the exciting future of tennis with these two stars.
Esse é um resumo conciso e contextualizado com menos de 150 palavras, exatamente como solicitado. Observe como o LLM também reconheceu a fonte do artigo como sendo a CNN.
E pronto! Você acabou de criar um agente de resumo de IA totalmente funcional na Dify, sem escrever uma única linha de código. Esse agente é capaz de processar e resumir qualquer página da Web.
Conclusão
Neste artigo, você aprendeu a usar o Dify para criar um agente de sumarização de IA com um fluxo de trabalho sem código. Para estar pronto para a produção, o agente precisa de acesso a dados públicos da Web. Isso é possível graças ao plug-in Bright Data Dify, que expõe ferramentas avançadas para recuperação de dados prontos para IA.
Esse foi apenas um exemplo simples de fluxo de trabalho, mas talvez você queira criar agentes de IA mais complexos. Para isso, você precisa de ferramentas para recuperar, validar e transformar o conteúdo da Web. É exatamente isso que a infraestrutura de IA da Bright Data foi criada para oferecer.
Crie uma conta gratuita na Bright Data e comece a fazer experiências com nossas ferramentas de dados prontas para IA!