Big Data Week Brasil

Um ótimo blog sobre Big Data Analytics com artigos, ebooks e vídeos abordando as aplicações de Big Data Analytics no Brasil e no mundo.
22
Aug

Papel futuro do analista de dados # 1: O Explorador de Dados

Como é o futuro para o analista de dados e de negócios? De nossa perspectiva, é extremamente brilhante, porque se você é um analista hoje, você está em uma posição melhor do que qualquer outra pessoa para se tornar o Analista do Futuro.

Identificamos três funções futuras distintas do analista e hoje apresentaremos a primeira: O Explorador de Dados. Esses papéis são tirados do guia recente, The Analyst of the Future, que você pode baixar aqui.

Como você sabe se pode se tornar um bom Explorador de Dados? Bem, você provavelmente veio de um background em que usou uma combinação de Excel, Access, SQL, SAS ou Alteryx. Você pode saber programar, mas pode também não saber porque novas ferramentas gráficas permitem realizar muitas tarefas que antes exigiam programação.

Sua nova função provavelmente exigirá muito mais criatividade do que sua função atual. Você precisará ser capaz de identificar e se conectar a novas fontes de dados, mesclar e preparar os dados e construir pipelines de dados prontos para produção. O objetivo dos produtos que você estará ajudando a construir é que eles sejam executados na produção e, assim, você ficará obcecado com a automação e a reprodutibilidade. Você será o especialista local nos detalhes dos dados. Quando uma nova fonte de dados for adicionada, você saberá quais campos ela contém e quais novos recursos você poderá criar a partir dela. Você também terá os olhos abertos para novas fontes de dados públicos que você pode usar para enriquecer seus dados internos. E, embora uma boa parte da engenharia de features seja feita pelo Modelador de Dados (que apresentaremos a você em breve), você estará encarregado de recursos de engenharia, como KPIs.

De certa forma, o Explorador de Dados já existe, na forma da função Engenheiro de Dados. Ainda assim, acreditamos que os Exploradores de Dados podem ter um conjunto de responsabilidades muito mais amplo do que aqueles atribuídos atualmente aos Engenheiros de Dados.

Você ainda precisará estar familiarizado com os algoritmos de aprendizado de máquina e provavelmente precisará ter uma compreensão firme dos conceitos de arquitetura de dados, como a computação distribuída.

Aqui estão alguns recursos para ajudá-lo em sua aventura:

  • Você ainda estará fazendo muito trabalho no Excel, então por que não fazê-lo muito melhor depois de assistir o excelente e divertido vídeo do fundador do Trello, Joel Spolsky, “You Suck at Excel”.
  • Este curso on-line do Portal de Dados Europeusapresentará as noções básicas de limpeza de dados.
  • Esta série de postssobre os fundamentos da ciência de dados é realmente útil para explicar o Hadoop.
  • Você deveria aprender a codificar? Não é a pior ideia. Se você fizer isso, Python e R são os mais úteis para analistas de dados (e tendemos a recomendar Python sobre R, mas ambos são “cidadãos de primeira classe”, como gostamos de dizer). Tente este curso Udacity em Pythone este outro em aprendizado de máquina

Traduzido de: https://blog.dataiku.com/future-data-analyst-role-1-the-data-explorer