Big Data Week Brasil

Um ótimo blog sobre Big Data Analytics com artigos, ebooks e vídeos abordando as aplicações de Big Data Analytics no Brasil e no mundo.
9
Aug

A democratização da ciência de dados

De Jonathan Cornelissen:

Quer pegar fraudes fiscais? O governo de Ruanda faiz isso – e os encontra estudando anomalias nos dados de coleta de receita.

Quer entender como a cultura americana está mudando? O mesmo acontece com um sociólogo iniciante em Indiana. Ele está usando a ciência de dados para encontrar padrões nas enormes quantidades de texto que as pessoas usam todos os dias para expressar suas visões de mundo — padrões que nenhum leitor individual seria capaz de reconhecer.

Pessoas inteligentes encontram novos usos para a ciência de dados todos os dias. Ainda assim, apesar da explosão de interesse nos dados coletados por quase todos os setores de negócios americanos — de empresas financeiras e empresas de saúde a consultorias de gestão e governo — muitas organizações continuam a relegar o conhecimento de ciência de dados a um pequeno número de funcionários.

Isso é um erro e, a longo prazo, é insustentável. Pense desta maneira: poucas empresas esperam que apenas escritores profissionais saibam escrever. Então, por que pedir apenas cientistas de dados profissionais para entender e analisar dados, pelo menos em um nível básico?

Relegar todo o conhecimento de dados a um punhado de pessoas dentro de uma empresa é problemático em muitos níveis. Os cientistas de dados acham isso frustrante porque é difícil para eles comunicar suas descobertas a colegas que não possuem conhecimentos básicos de dados. As partes interessadas nos negócios estão insatisfeitas porque as solicitações de dados demoram muito para serem atendidas e geralmente não conseguem responder às perguntas originais. Em alguns casos, isso ocorre porque o questionador não conseguiu explicar a pergunta adequadamente ao cientista de dados.

Por que cientistas “não-dados” precisariam aprender ciência de dados? É como perguntar por que os não contadores devem ficar dentro do orçamento.

Hoje em dia, todo setor está repleto de dados, e as organizações que obtêm sucesso são aquelas que mais rapidamente dão sentido a seus dados para se adaptarem ao que está por vir. A melhor maneira de permitir a descoberta rápida e insights mais aprofundados é dispersar a expertise em ciência de dados em toda a organização.

As empresas que querem competir na era dos dados precisam fazer três coisas: compartilhar ferramentas de dados, distribuir habilidades de dados e distribuir a responsabilidade pelos dados.

Ferramentas de Compartilhamento

A maioria das ferramentas de dados fica com a equipe de ciência de dados. Embora isso possa parecer lógico, criar um silo de ferramentas de dados e restringir o acesso a um grupo restrito de funcionários acaba que sobrecarrega esses funcionários. A maioria das consultas de outros departamentos — engenharia, finanças, produtos, marketing — são solicitações relativamente simples que qualquer pessoa com treinamento básico poderia cumprir. Ao sobrecarregar os cientistas de dados com tarefas básicas de gatekeeping, as organizações desviam sua atenção dos projetos maiores que exigem sua profunda especialização.

O Airbnb, uma grande defensora da democratização da ciência de dados, esforça-se para capacitar cada membro da equipe a tomar decisões baseadas em dados. Para garantir isso, a empresa criou sua própria Data University.

Ferramentas colaborativas também ajudam. No Airbnb, qualquer um pode postar um artigo em um Repositório de Conhecimento. O resto da empresa vê novas análises em um feed de notícias, informando (1) qual novo problema acaba de ser resolvido e (2) quem o resolveu, para que qualquer pessoa com mais dúvidas possa saber a quem ligar. Além de ajudar toda a empresa a se tornar mais eficaz, esses artigos dão reconhecimento às pessoas que os publicam — o que incentiva os outros a fazer o mesmo.

Compartilhando Habilidades

É claro que, quando você compartilha ferramentas de dados, também é necessário permitir que as pessoas usem essas ferramentas. Nem toda empresa pode criar sua própria Data University. Dependendo das ferramentas de dados que sua organização usa, no entanto, uma variedade de programas educacionais, tanto on-line quanto pessoalmente, pode agilizar sua equipe. (Claro, eu sou tendencioso: eu co-fundei um deles.)

À medida que sua equipe ganha a oportunidade de aprender essas habilidades, eles se sentirão mais à vontade ao trazer dados para todas as decisões importantes. Ficará claro que alguns membros da equipe se sentem mais confortáveis ​​usando as habilidades de dados do os demais. Incentive os proficientes a orientar os outros. Mesmo em nossa empresa, onde a ciência de dados é o nosso negócio, algumas pessoas não trabalham com dados o tempo todo. Quando eles precisam de ajuda em um problema complicado, eles se juntam com aqueles que o fazem.

Uma equipe alfabetizada em dados faz solicitações melhores. Até mesmo um entendimento básico de ferramentas e recursos melhora muito a qualidade da interação entre os colegas. Quando o “nível de esforço” — a quantidade de idas e vindas necessária para esclarecer o que é desejado — de cada solicitação diminui, a velocidade e a qualidade aumentam.

Habilidades compartilhadas melhoram a cultura do local de trabalho e resultam de outra forma também: Elas melhoram o entendimento mútuo. Se você souber como será difícil obter uma saída de dados específica, você ajustará a maneira como interage com as pessoas encarregadas de fornecer a saída. Tais ajustes melhoram o local de trabalho para todos.

Compartilhando Responsabilidade

Uma vez que a organização esteja fornecendo o acesso e a educação necessários para democratizar os dados entre seus funcionários, talvez seja hora de ajustar funções e responsabilidades. No mínimo, as equipes devem poder acessar e entender os conjuntos de dados mais relevantes para suas próprias funções. Mas ao equipar mais membros da equipe com habilidades básicas de codificação, as organizações também podem esperar que as equipes de ciências que não são de dados apliquem esse conhecimento à solução de problemas do departamento — o que leva a resultados muito melhores.

Se sua força de trabalho é alfabetizada em dados, por exemplo, sua equipe de dados centralizada pode mudar seu foco de “fazer o trabalho de dados de todos os outros” para “construir as ferramentas que permitem que todos trabalhem com mais rapidez”. Em vez disso, ele cria novas ferramentas que todos podem usar para que 50 projetos possam avançar tão rapidamente quanto um projeto foi movido antes.

A ciência de dados não é mais apenas para cientistas de dados, se é que já foi. As empresas inteligentes de hoje garantem que muitos de seus funcionários possam falar a linguagem dos dados e usá-la para melhorar os resultados do trabalho. Ao capacitar os funcionários com essas habilidades fundamentais, as empresas estão percebendo níveis extraordinários de inovação e eficiência.

Jonathan Cornelissen é co-fundador e CEO da DataCamp, uma plataforma de aprendizado on-line para ciência de dados.

Tradução do texto: https://hbr.org/2018/07/the-democratization-of-data-science.

Leave a Reply