Fake news dataset

Detect and prevent the dissemination of false information.

Get dataset
  • Available as a custom dataset request
  • Get data from major social media and news websites
  • 100% compliant scraping
fake news datasets
                              {
  "type": "object",
  "fields": {
    "news_records": {
      "type": "array",
      "active": true,
      "items": {
        "type": "object",
        "fields": {
          "article_id": {
            "type": "text",
            "active": true,
            "sample_value": "FN12345"
          },
          "title": {
            "type": "text",
            "active": true,
            "sample_value": "Shocking Discovery in Ancient Pyramid"
          },
          "author": {
            "type": "text",
            "active": true,
            "sample_value": "John Doe"
          },
          "publication_date": {
            "type": "date",
            "active": true,
            "sample_value": "2023-10-01"
          },
          "source_name": {
            "type": "text",
            "active": true,
            "sample_value": "Unreliable News Network"
          },
          "source_url": {
            "type": "url",
            "active": true,
            "sample_value": "https://unreliablenews.com/article123"
          },
          "source_reliability_score": {
            "type": "number",
            "active": true,
            "sample_value": 2.3
          },
          "content": {
            "type": "text",
            "active": true,
            "sample_value": "An ancient pyramid reveals a shocking secret..."
          },
          "credibility_rating": {
            "type": "number",
            "active": true,
            "sample_value": 1.5
          },
          "fake_news_score": {
            "type": "number",
            "active": true,
            "sample_value": 4.8
          },
          "fact_checked": {
            "type": "boolean",
            "active": true,
            "sample_value": true
          },
          "fact_check_url": {
            "type": "url",
            "active": true,
            "sample_value": "https://factchecker.org/fake-news/shocking-discovery"
          },
          "tags": {
            "type": "array",
            "active": true,
            "items": {
              "type": "text",
              "sample_value": "conspiracy"
            }
          },
          "comments": {
            "type": "array",
            "active": true,
            "items": {
              "type": "object",
              "fields": {
                "comment_id": {
                  "type": "text",
                  "active": true,
                  "sample_value": "CMT001"
                },
                "user": {
                  "type": "text",
                  "active": true,
                  "sample_value": "JaneSmith123"
                },
                "comment_text": {
                  "type": "text",
                  "active": true,
                  "sample_value": "This sounds too strange to be true!"
                },
                "sentiment_score": {
                  "type": "number",
                  "active": true,
                  "sample_value": -0.7
                },
                "date": {
                  "type": "date",
                  "active": true,
                  "sample_value": "2023-10-02"
                }
              }
            }
          }
        }
      }
    },
    "url": {
      "type": "url",
      "required": true,
      "active": true,
      "sample_value": "https://example.com/fake_news_data"
    }
  }
}
                              
                            

Fake news dataset sample

Choose from fully managed or self-managed fake news datasets. Fully managed datasets provide a hands-off experience with data maintained by our partners, while self-managed datasets allow you to set up and customize data collection and validation rules. The fake news data points may include article title, author, publication date, source reliability, content credibility rating, and more.
O PROCESSO

Plataforma automatizada de criação de conjuntos de dados

Simplifique o processo de coleta de dados para concentrar-se no que importa.
  1. Configuração inicial

    Adicione as URLs do site de destino.

  2. Criação de amostra

    Obtenha um esquema gerado por IA e uma amostra. Configure as regras de validação.

  3. Validação do conceito

    O extrator de dados é criado com base no esquema e nas regras de validação.

  4. Coleta e entrega de dados

    Os dados são coletados e entregues.

Preços de conjuntos de dados personalizados

CONJUNTO DE DADOS PERSONALIZADO
Assinatura
Starting from
$300/month
One time
Starting from
$1,000
Proof of Concept
One time
$500
  • Esquema e amostra gerados por IA
  • Controle sobre a validação de dados
  • Estimativa em tempo real da quantidade de produto.
  • Diário, semanal, mensal, personalizado

Fake news datasets tailored to your needs

Get easy to use, well-structured datasets for any use case

Assinatura de dados

Inscreva-se para acessar conjuntos de dados a um custo consideravelmente menor.

Formatos de exportação de arquivo

JSON, NDJSON, JSON Lines, CSV, Parquet. Compressão .gz opcional.

Entrega flexível

Snowflake, Amazon S3 bucket, Google Cloud, Azure e SFTP.

Dados escaláveis

Escale sem se preocupar com infraestrutura, servidores proxy ou blocos.

Redução de custos

Personalize qualquer conjunto de dados usando filtros e opções de formatação.

Manutenção de código

Os conjuntos de dados são mantidos com base nas mudanças na estrutura do site.

Integrações simplificadas

Beneficie-se das integrações com Snowflake e AWS.

Suporte 24 horas

Uma equipe dedicada de profissionais de dados está aqui para ajudar.

Líderes em conformidade

Os dados são obtidos de forma ética e estão em conformidade com todas as leis de privacidade.

Get structured and reliable Fake news data

Nós fornecemos os dados enquanto você se concentra no resto

Grandes volumes de dados da web

Com nossos recursos de desbloqueio e rotação de IPs 24 horas, garantimos o acesso a todos os pontos de dados em qualquer site.

Dados para uso imediato

Cada aspecto do processo de coleta de dados é minuciosamente validado como parte do nosso robusto processo de validação de dados.

Fluxo de dados automatizado

Crie cronogramas personalizados para automatizar a entrega de dados e veja os dados entrarem com perfeição em seu armazenamento.

How companies use Fake news datasets

Monitor publications

Verify the authenticity of news articles by analyzing specific data points that could potentially indicate on the validity of the article. Datapoints could include: source, date and time of publication and more.
Get dataset

Machine learning

Media companies can train their machine learning model using fake news datasets. Data points such as article text, headlines, author, or publication sources helps the ML detect and remove false information automatically, ensuring quality and credibility of their content.
Get dataset

Government and law enforcement

In the fight against disinformation and its negative effects on society, fake news datasets provide government agencies and law enforcement with a vital tool for tracking and monitoring false information.
Get dataset

Get your Fake news dataset today.