. Para os cientistas de dados, o dinheiro é grande em open source - Tudo Sobre Tecnologia

Cientistas de dados que se concentram em tecnologias de código aberto ganhar mais dinheiro do que aqueles que tratam de tecnologias proprietárias. 
Big data significa grande compensação para os cientistas de dados. Mas o tipo de cientista de dados que são em grande parte determina o quão grande é o seu salário será. Como um novo O'Reilly levantamento  revela, os cientistas de dados que se concentram em tecnologias de código aberto ganhar mais dinheiro do que aqueles que ainda estão tratando de tecnologias proprietárias. O software de código aberto mais você sabe, mais dinheiro você está para fazer em big data.

Big data, muito dinheiro

Dado o nível de interesse em Big Data, não é surpreendente que as empresas estão dispostas a pagar salários bolada de recrutar os melhores talentos, sobretudo tendo em conta a dificuldade no fornecimento de tal talento. Em 2012 NewVantage Partners sondada  um grupo relativamente pequeno, mas altamente qualificada de executivos de grandes organizações e descobriu que 100 por cento dos inquiridos estão pelo menos "um pouco desafiado" para recrutar cientistas de dados. Um total de 40 por cento estão achando "muito difícil" ou "impossível".
Contra essa escassez, os cientistas de dados estão com preços em um prêmio.
Conforme Dados Glassdoor , o salário médio para os cientistas de dados nos Estados Unidos é $ 117.500. Por outro lado, um analista de negócios pode esperar fazer em torno de 61.000 dólares  e um analista de dados cerca de 55.000 dólares . Analista do Gartner, Svetlana Sicular zomba de toda a categoria de ciência de dados, rindo que "um cientista de dados é 1) um analista de dados na Califórnia ou 2) um estatístico com menos de 35."
Isso é um grande salto de preço para o polimento de um cargo.

Ferramentas do comércio ciência dados

Na realidade, não há mais a ser um cientista de dados do que simplesmente atualizar sua cargo. Como 2013 de Dados Científicos Pesquisa Salarial da O'Reilly sugere, "o campo de big data inaugurou a chegada de novas ferramentas complexas que relativamente poucas pessoas entendem ou sequer ouvido falar." Sabendo dessas ferramentas é o que produz esses salários exagerados.
Mas quais as ferramentas um cientista de dados mestres acaba por ter um impacto grande, material em seu poder aquisitivo.
A ferramenta de dados superior, de longe, é o SQL, o que não é surpreendente: a análise dos dados tem sido em torno de muito antes, dada por um rótulo sexy "ciência de dados", e acessar dados através de SQL tem sido o padrão para a análise de dados. Isto não muda durante a noite.

oreilly 1.jpg
2.013 Dados Ciência Pesquisa Salarial
 (Crédito: O'Reilly)
 
Mas uma vez que se mover além SQL, está dizendo o quanto as ferramentas de Big Data mais utilizados são de código aberto: R, Python, Hadoop e muito mais. Mais interessante, porém, é a bifurcação entre o que O'Reilly chama de "o grupo Hadoop" (laranja) e "SQL / grupo Excel" (azul):

oreilly 2.jpg
2.013 Dados Ciência Pesquisa Salarial
 (Crédito: O'Reilly)
 
Cientistas de dados que usam um conjunto de ferramentas não usar o outro: a indústria está mais ou menos dividido em dois campos, com o grupo vermelho formando essencialmente uma periferia em torno do grupo Hadoop. Como o relatório O'Reilly sugere, "Os dois grupos não têm ferramentas em comum e são muito distante em termos de correlação: existem apenas quatro correlações positivas entre os dois conjuntos (principalmente através Tableau), enquanto há um colossal 51 correlações negativas. "

O dinheiro está na aberto

Embora um tanto interessante que os cientistas de dados dividida em linhas partidárias - Hadoop vs SQL, aberto versus fechado - a observação mais interessante relatório do O'Reilly faz é o quanto essa divisão se traduz em diferenças salariais.
Quanto mais ferramentas de dados um cientista de dados usa, mais seus aumentos salariais.Uma vez que um cientista de dados usa pelo menos 10 ferramentas, seu salário cresce consideravelmente:

oreilly 3.jpg
2.013 Dados Ciência Pesquisa Salarial
 (Crédito: O'Reilly)
 
Curiosamente, aqueles no grupo de origem / Hadoop aberto tendem a usar muito mais ferramentas e, portanto, está a fazer muito mais dinheiro. Como os autores do relatório apontam, "salário base Mediana geralmente aumenta com o número de ferramentas utilizadas a partir do cluster do Hadoop, de US $ 85k para aqueles que não usam essas ferramentas para US $ 125k para aqueles que usam pelo menos seis." Para aqueles em terras de propriedade / SQL, utilizando cinco ou mais ferramentas do cluster proprietário leva a uma queda significativa no salário.
Embora existam maneiras de explicar a aparente divergência nos salários, os autores concluem:
"Parece muito provável que saber como usar ferramentas como o R, Python, enquadramentos Hadoop, D3, e ferramentas de aprendizado de máquina escaláveis ​​qualifica analista da mais bem pagos cargos de mais do que saber SQL, Excel e plataformas RDB. Podemos também deduzir que quanto mais ferramentas analista sabe, o melhor: se você está pensando em aprender um instrumento do cluster Hadoop, é melhor para aprender várias ".
E então eles fazem um ponto altamente revelador:
"As ferramentas da quota cluster do Hadoop uma característica comum: todos eles permitem o acesso a grandes conjuntos de dados e / ou análise de suporte de grandes conjuntos de dados A demanda por analistas que sabem como trabalhar com grandes conjuntos de dados está crescendo, em particular para aqueles. que pode realizar a aprendizagem de máquina mais avançada, gráfico e tarefas em tempo real em grandes conjuntos de dados. Até que o fornecimento de tais analistas alcança, seus salários serão naturalmente lance para cima. "
Em outras palavras, as ferramentas de código aberto pode ser mais adequado para lidar com grandes conjuntos de dados, enquanto que as ferramentas proprietárias tendem a ter, um utilitário mais estreito com base em consulta. Além disso, ferramentas como Python e R dar uma ampla latitude de usuário para moldar análise de dados, em vez de viver dentro das limitações que um fornecedor proprietário fornece.
O que isso pode significar é que tomar a rota SQL / Excel é uma maneira decente para arrastar-se, juntamente com a análise de dados da velha escola, mas se você quiser realmente ir fundo na ciência de dados, e se bem pagos por seus esforços, você realmente precisa ir aberto com Hadoop, Python, NoSQL e outros open-source grandes ferramentas principais de dados.

Sobre 

Matt Asay é uma tecnologia colunista veterano que tem escrito para CNET, ReadWrite, e outros meios de comunicação de tecnologia. Em seu dia de trabalho, ele é o vice-presidente de desenvolvimento de negócios e marketing da MongoDB. Anteriormente, ele foi diretor operacional da Canonical, ...

0 comentários Goocle+ 0 Facebook

Postar um comentário

 
Tudo Sobre Tecnologia © 2013-2020. Todos os direitos reservados. Tudo Sobre Tecnologia. Desenvolvido por TST
Topo