Visualize dados não estruturados com Watson Natural Language Understanding

2 min de leitura
Patrocinado
Imagem de: Visualize dados não estruturados com Watson Natural Language Understanding
Avatar do autor

Equipe TecMundo

Por: Pavan Tummala, Richard Hagarty

Atualizado em: 28 de dezembro de 2018 | Publicado em: 27 de dezembro de 2018

Obtenha o código

Assista ao vídeo

Resumo

Neste padrão de código, criaremos um aplicativo da web para visualizar dados não estruturados usando Watson™ Natural Understanding, Apache Tika e D3.js. Depois que um usuário carrega um arquivo local de sua escolha, o aplicativo utiliza o Apache Tika para extrair texto do arquivo de dados não estruturados. O texto é então passado pelo Watson Natural Language Understanding, do qual entidades e conceitos são extraídos. Por fim, o aplicativo utiliza a biblioteca D3.js como ferramenta de visualização para mostrar os resultados ao usuário.

Descrição

O principal benefício de utilizar o Watson Natural Understanding Service é seu poderoso mecanismo de análise que fornece enriquecimento cognitivo e insights sobre os dados. Os principais enriquecimentos extraídos incluem:

  • Entidades – pessoas, empresas, organizações, cidades e muito mais;

  • Palavras-chave – tópicos importantes geralmente utilizados para indexar ou pesquisar os dados;

  • Conceitos – conceitos gerais identificados que não são necessariamente referenciados nos dados;

  • Sentimento – o sentimento geral positivo ou negativo dos dados.

Os enriquecimentos serão exibidos por meio do uso do D3.js, uma biblioteca JavaScript que fornece técnicas de visualização poderosas que ajudam a dar vida aos dados. Neste aplicativo, vamos utilizá-lo a fim de exibir cada um dos enriquecimentos em uma nuvem de bolhas interativa, com o tamanho e a localização de cada elemento determinados por seu relevância relativa.

Ao concluir este padrão de código, você entenderá como:

  • Criar e utilizar uma instância do Watson Natural Language Understanding;

  • Aproveitar o Apache Tika para extrair texto de arquivos não estruturados;

  • Utilizar o D3.js para exibir os visuais.

Fluxo

Fluxo

  1. O usuário configura as credenciais para o serviço Watson Natural Language Understanding e inicia o aplicativo;

  2. O usuário seleciona o arquivo de dados para processar e carregar;

  3. O Apache Tika extrai o texto do arquivo de dados;

  4. O texto extraído é passado para o Watson NLU para enriquecimento;

  5. Os dados enriquecidos são visualizados na IU por meio da biblioteca D3.js.

Instruções

Pronto para começar? Consulte o README para obter instruções detalhadas.

Conclusão

Este padrão mostrou como criar um aplicativo da web para visualizar dados não estruturados utilizando Watson Natural Understanding, Apache Tika e D3.js. O padrão faz parte do caminho de aprendizagem Introdução ao processamento de linguagem natural. Para continuar com o caminho de aprendizagem, dê uma olhada na próxima etapa, Descubra insights de uso ocultos do Facebook.

...

Quer ler mais conteúdo especializado de programação? Conheça o IBM Blue Profile e tenha acesso a matérias exclusivas, novas jornadas de conhecimento e testes personalizados. Confira agora mesmo, consiga as badges e dê um upgrade na sua carreira!

…..

Quer dar o próximo grande passo na sua jornada profissional? Participe do Cloud Training, um curso online e gratuito que vai te preparar para o exame da certificação IBM Cloud Foundations. Inscreva-se já!

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.