Ferramentas de análise de texto para big data

Video: Curso de Big Data - Aula 2 - Principais Ferramentas (Hadoop, HBase e Spark)

Aqui está uma visão geral de alguns dos jogadores no mercado de big data análise de texto. Alguns são pequenos, enquanto outros são nomes da casa. Alguns chamam o que fazem grandes análise de texto de dados, enquanto alguns apenas se referem a ele como análise de texto.

Attensity para big data

Attensity é uma das empresas de análise de texto originais que começou a desenvolver e vender produtos mais de dez anos atrás. Neste momento, tem mais de 150 clientes corporativos e um dos maiores grupos de desenvolvimento NLP do mundo. Attensity oferece vários motores de análise de texto. Estes incluem Auto-classificação, Entidade de extração e extração exaustiva. Extração exaustiva é a tecnologia carro-chefe da Attensity que extrai automaticamente fatos do texto analisado e organiza esta informação.

Video: Edição #31 - Conceitos e Ferramentas de Big Data

A empresa está focada na análise social e multicanal e engajamento por meio da análise de texto para relatar a partir de fontes internas e externas e, em seguida, encaminhá-lo para os usuários de negócios para o engajamento. Ele recentemente comprou Biz360, uma empresa de mídia social que agrega enormes fluxos de mídia social. Ele desenvolveu um sistema de computação em grade que fornece capacidades de alto desempenho para o processamento de grandes quantidades de texto em tempo real.

Attensity usa uma estrutura Hadoop para armazenar dados. Ele também tem um sistema de filas de dados que cria um processo de orquestração que reconhece picos de dados de entrada e ajusta processamento através de mais / menos servidores, conforme necessário.

Clarabridge para big data

Outra pure-play fornecedor texto analytics, Clarabridge é na verdade um spin-off de uma empresa de consultoria de inteligência de negócios (BI) (chamado Claraview) que percebeu a necessidade de lidar com dados não estruturados. Seu objetivo é ajudar as empresas a impulsionar o valor de negócio mensurável, olhando para o cliente de forma holística, identificar experiências e questões, e ajudando todos em uma organização tomar medidas e colaborar em tempo real.

Video: Ferramenta para análise de sentimentos em textos da Web

Isto inclui a determinação em tempo real do sentimento e classificação de feedback dos clientes de dados / texto e encenação do verbatim para processamento futuro no sistema Clarabridge.

Neste momento, Clarabridge oferece aos seus clientes alguns recursos sofisticados e interessantes, incluindo um único clique causa raiz análise para identificar o que está causando uma mudança no volume de texto alimenta, sentimento, ou satisfação associada a questões emergentes. Ele também oferece a sua solução como Software as a Service (SaaS).

IBM para big data

A gigante do software IBM oferece várias soluções no espaço de análise de texto sob a sua égide estratégia Smarter Planet. Além de Watson e IBM SPSS, a IBM também oferece o IBM Content Analytics com o Enterprise Search. IBM Content Analytics foi desenvolvido com base no trabalho realizado pelo IBM Research.



IBM Content Analytics é utilizado para transformar o conteúdo em informações analisadas, e isso está disponível para análises detalhadas semelhante à forma como os dados estruturados seriam analisados ​​em um conjunto de ferramentas de BI. IBM Content Analytics e Enterprise Search uma vez foram dois produtos distintos.

Os alvos solução convergente tanto de pesquisa empresarial avançada que usa análise de texto, bem como as necessidades de análise de conteúdo independente. ICAES tem forte integração com a plataforma InfoSphere BigInsights IBM, permitindo coleções muito grandes de busca e análise de conteúdo.

Video: Análise de Big Data Aula 1/9 HD

OpenText para big data

OpenText, uma empresa com sede no Canadá, é provavelmente mais conhecido por sua liderança em soluções de gerenciamento de informações empresariais. Sua visão gira em torno de gerir, proteger e extrair valor a partir dos dados não estruturados de empresas. Ele fornece o que chama “middleware semântica.”

Segundo a empresa, a sua evolução tecnologia semântica está enraizada na sua capacidade “para permitir análises em tempo real com alta precisão em grandes conjuntos de dados em idiomas, formatos e domínios da indústria.” A idéia por trás middleware semântica é que a semântica pode ser exposto a diferentes níveis e trabalhar com diferentes tecnologias para resolver problemas de negócios.

Em outras palavras, as análise de texto pode ser ativado e utilizado quando necessário.

SAS para big data

SAS foi resolver problemas complexos grandes de dados por um longo tempo. Vários anos atrás, comprou análise de texto fornecedor Teragram para melhorar a sua estratégia de usar dados estruturados e não estruturados em análise e para integrar esses dados para modelagem descritiva e preditiva. Agora, as suas capacidades de análise de texto são parte de sua plataforma de análise e texto de dados global é visto simplesmente como uma outra fonte de dados.

SAS continua a inovar na área de análises de alto desempenho para garantir que o desempenho atenda às expectativas dos clientes. O objetivo é levar os problemas que costumava levar semanas para resolver e resolvê-los em dias, ou problemas que costumavam levar dias para resolver e resolvê-los em minutos em vez.

Por exemplo, o SAS High Performance Analytics Server é uma solução in-memória que lhe permite desenvolver modelos analíticos utilizando dados completos, não apenas um subconjunto de dados agregados. SAS diz que você pode usar milhares de variáveis ​​e milhões de documentos como parte desta análise. A solução roda em EMC Greenplum ou aparelhos Teradata, bem como em hardware commodity usando Hadoop Distributed File System (HDFS).


Publicações relacionadas