Visualize dados não estruturados com Watson Natural Language Understanding

Motor de análise poderoso fornece enriquecimento cognitivo e insights sobre os dados

Guilherme Tanabe

schedule28/01/2021, às 03:00

Fonte:

Imagem de Visualize dados não estruturados com Watson Natural Language Understanding no tecmundo

Por: Pavan Tummala, Richard Hagarty

Atualizado em: 28 de dezembro de 2018 | Publicado em: 27 de dezembro de 2018

Obtenha o código

Assista ao vídeo

Resumo

Neste padrão de código, criaremos um aplicativo da web para visualizar dados não estruturados usando Watson™ Natural Understanding, Apache Tika e D3.js. Depois que um usuário carrega um arquivo local de sua escolha, o aplicativo utiliza o Apache Tika para extrair texto do arquivo de dados não estruturados. O texto é então passado pelo Watson Natural Language Understanding, do qual entidades e conceitos são extraídos. Por fim, o aplicativo utiliza a biblioteca D3.js como ferramenta de visualização para mostrar os resultados ao usuário.

Descrição

O principal benefício de utilizar o Watson Natural Understanding Service é seu poderoso mecanismo de análise que fornece enriquecimento cognitivo e insights sobre os dados. Os principais enriquecimentos extraídos incluem:

Entidades – pessoas, empresas, organizações, cidades e muito mais;

Palavras-chave – tópicos importantes geralmente utilizados para indexar ou pesquisar os dados;

Conceitos – conceitos gerais identificados que não são necessariamente referenciados nos dados;

Sentimento – o sentimento geral positivo ou negativo dos dados.

Os enriquecimentos serão exibidos por meio do uso do D3.js, uma biblioteca JavaScript que fornece técnicas de visualização poderosas que ajudam a dar vida aos dados. Neste aplicativo, vamos utilizá-lo a fim de exibir cada um dos enriquecimentos em uma nuvem de bolhas interativa, com o tamanho e a localização de cada elemento determinados por seu relevância relativa.

Ao concluir este padrão de código, você entenderá como:

Criar e utilizar uma instância do Watson Natural Language Understanding;

Aproveitar o Apache Tika para extrair texto de arquivos não estruturados;

Utilizar o D3.js para exibir os visuais.

Fluxo

O usuário configura as credenciais para o serviço Watson Natural Language Understanding e inicia o aplicativo;

O usuário seleciona o arquivo de dados para processar e carregar;

O Apache Tika extrai o texto do arquivo de dados;

O texto extraído é passado para o Watson NLU para enriquecimento;

Os dados enriquecidos são visualizados na IU por meio da biblioteca D3.js.

Instruções

Pronto para começar? Consulte o README para obter instruções detalhadas.

Conclusão

Este padrão mostrou como criar um aplicativo da web para visualizar dados não estruturados utilizando Watson Natural Understanding, Apache Tika e D3.js. O padrão faz parte do caminho de aprendizagem Introdução ao processamento de linguagem natural. Para continuar com o caminho de aprendizagem, dê uma olhada na próxima etapa, Descubra insights de uso ocultos do Facebook.

...

Quer ler mais conteúdo especializado de programação? Conheça o IBM Blue Profile e tenha acesso a matérias exclusivas, novas jornadas de conhecimento e testes personalizados. Confira agora mesmo, consiga as badges e dê um upgrade na sua carreira!

…..

Quer dar o próximo grande passo na sua jornada profissional? Participe do Cloud Training, um curso online e gratuito que vai te preparar para o exame da certificação IBM Cloud Foundations. Inscreva-se já!

info

Conteúdo patrocinado produzido pelo TecMundo.