. A próxima grande coisa em grandes volumes de dados: análise de Plug-and-play - Tudo Sobre Tecnologia

Quanto mais as empresas olham para análise e modelos de mineração de dados para extrair informações úteis a partir de grandes volumes de dados, a melhor maneira é necessária para compartilhar esses modelos entre as aplicações. 
Apesar de existirem ferramentas bem estabelecidas para a construção de análises e modelos de mineração de dados para ajudar as empresas a identificar transações fraudulentas ou recomendar acompanhamento compras para os clientes, conectando esses modelos em aplicativos pode ser um processo doloroso.
À medida que mais empresas invocam esses modelos para interrogar cada vez mais grandes conjuntos de dados, torna-se necessário ter uma maneira fácil de exportar e compartilhar esses modelos entre as aplicações.
Sean Owen, diretor de ciência de dados em Hadoop Cloudera especialista, espera que a próxima área de grande crescimento em grandes dados estarão em ferramentas que tornam mais simples de compartilhar esses modelos entre as aplicações.
"Parece ser um problema comum, a roda que mantém se reinventado pelos clientes", disse ele.
"O padrão de fazer é que alguém faz um modelo em [a linguagem de modelagem estatística] R e dizem 'Aqui está um grupo de coeficientes, acesse este programa em algum código Java e usar isso no site.
"Isso requer um pouco de conhecimento em nome também do desenvolvedor, é muito manual.
"Eles precisam de algo que o serviço web pode pedir de alguma forma simples standard 'Aqui está um novo ponto de dados, classificá-lo para mim'."
Um candidato de uma maneira padronizada para compartilhar esses modelos é o  Predictive Model Markup Language  (PMML) - uma linguagem baseada em XML para a representação de mineração de dados e modelos estatísticos.
PMML pode representar não só as técnicas estatísticas utilizadas para aprender os padrões de dados, tais como redes neurais artificiais e árvores de decisão, mas também de pré-processamento dos dados de entrada brutos e pós-processamento dos resultados do modelo.
A ampla gama de ferramentas de mineração de dados pode importar ou exportar modelos como PMML, eo padrão em si é desenvolvido pelo Data Mining Group, um fornecedor lideradas consórcios cujos membros incluem IBM, MicroStrategy, SAS e SPSS.
Desenvolver uma forma padrão de representar e interagir com esses modelos seria um "grande negócio" no ano que vem, disse Owen.
"Você pensaria que haveria um servidor para isso e realmente não é. SAS tem uma ferramenta proprietária cara que faz isso e não é um pacote open source que tipo de faz isso", disse ele.
"Se eu tenho um modelo, com certeza eu seria capaz de carregá-lo em alguma coisa e depois consultá-lo com o padrão de APIs e bibliotecas de cliente? Precisamos padronizar e ter um conjunto de soluções maduras para fazer isso."
Autor:

Sobre Nick Heath

Nick Heath é repórter-chefe da TechRepublic Reino Unido. Ele escreve sobre a tecnologia que os tomadores de decisão de TI precisa saber sobre, e os últimos acontecimentos no cenário europeu de tecnologia.

0 comentários Goocle+ 0 Facebook

Postar um comentário

 
Tudo Sobre Tecnologia © 2013-2020. Todos os direitos reservados. Tudo Sobre Tecnologia. Desenvolvido por TST
Topo