
Por quê um Cientista de Dados deveria ser um Black Belt em Lean Seis Sigma (ou o contrário)
Tenho recebido com cada vez mais frequência, perguntas relativas às diferenças e sinergias entre um Cientista de Dados e um Black Belt em Lean Seis Sigma. Dessa forma, gostaria de apresentar um resumo das competências que hoje compõe o arcabouço do chamado Cientista de Dados e fazer uma análise de como as competências requeridas de um Black Belt (do Lean Seis Sigma) podem potencializar a visão sistêmica desses profissionais. Além disso, irei abordar a vantagem de um Cientista de Dados fazer a formação Black Belt e vice-versa.
O que são Cientistas de Dados?
Cientistas de Dados são uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos – e a curiosidade de explorar quais são os problemas que precisam ser resolvidos.
Eles também são um sinal dos tempos modernos. Cientistas de dados não estavam no radar há uma década, mas sua popularidade repentina reflete como as empresas agora pensam sobre Big Data. Essa incrível massa de informações não estruturadas já não pode mais ser ignorada e esquecida. É uma mina de ouro virtual que ajuda a aumentar receitas – contanto que haja alguém que escave e desenterre insights empresariais que ninguém havia pensado em procurar. Entra em cena o Cientista de Dados.
Os dados utilizados por um Cientista de Dados podem ser tanto estruturados (bancos de dados transacionais de sistemas ERP ou CRM, por exemplo) e não estruturados (e-mails, imagens, vídeos ou dados de redes sociais). O Cientista de Dados cria algoritmos para extrair insights destes dados. Em seguida, cabe ao Cientista de Dados, apresentar estes dados, de forma que os tomadores de decisão possam utilizar o resultado da análise ao definir as estratégias empresariais ou mesmo para criar novos produtos ou serviços baseados em dados.
Não existe uma formação que prepare Cientistas de Dados, pois esta é uma profissão relativamente nova. Tem havido muito debate sobre isso no ambiente acadêmico (principalmente nos EUA), pois o mercado precisa de profissionais agora e o tempo de preparação de um profissional como estas habilidades, pode levar algum tempo. E por isso formações técnicas em determinadas áreas, podem ajudar a preparar estes profissionais.
De qualquer forma, ressalto aqui algumas competências que são consenso para esses profissionais até o momento:
Programação – Conhecimento de programação é necessário. Linguagens de programação como R, Python, Julia, Scala, Java são parte do arsenal de ferramentas utilizadas em Data Science. Mesmo outros pacotes de análise de dados, como SAS, Matlab, Octave, SPSS e até o IBM Watson Analytics, requerem conhecimento em programação, para se extrair o melhor de cada ferramenta. É a habilidade de programação, que permite ao Cientista de Dados colocar em prática sua criatividade e extrair dos dados respostas para perguntas que ainda não foram feitas. Se você já tiver conhecimento em programação, isso será uma vantagem. Caso não tenha experiência em programação, mas tenha uma boa noção dos conceitos envolvidos em programação de computadores, isso vai ajudar muito. Avalie de forma clara seu nível de conhecimento em programação.
Pensamento Lógico – Cientistas de Dados usam o pensamento lógico para fazer análises. Programação requer lógica. Se você já possui esta habilidade, isso vai acelerar seu aprendizado em Data Science.
Habilidade com Números – Matemática é a base da Ciência de Dados. Programação de computadores, envolve habilidade com números. Os algoritmos de Machine Learning, são baseados em conceitos matemáticos. A Estatística, parte fundamental da Ciência de Dados, requer habilidade com números. Avalie suas características e na sua auto avaliação, verifique se esse item será um problema ou não.
Conhecimento em Banco de Dados – Em diversas fases do processo de análise de dados, interações com bancos de dados serão necessárias. Bancos de sados relacionais, Data Warehouses, bancos de dados NoSQL, Hadoop, linguagem SQL. Todas estas tecnologias estão diretamente ligadas ao trabalho do Cientista de Dados e pelo menos sua compreensão será um ponto que poderá fazer diferença. Avalie se você compreende o conceito de banco de dados, entende as diferenças entre bancos de dados relacionais e NoSQL e como utilizar linguagem SQL para consultas.
Sinergias com o Lean Seis Sigma à luz das competências
A norma ISO 18404:2015 estabelece as competências mínimas requeridas para um Black Belt num total de 23 itens. Essas competências devem ser desenvolvidas ao longo da formação desse profissional, de tal forma que é possível ver sinergia com as quatro principais competências do Cientista de Dados. De alguma forma, todas as 23 competências referidas na norma (ver meu artigo AQUI) se aproximam do desafio do Cientista de Dados mas selecionei acima aquelas que, ao meu ver, são mais pronunciadas. Abaixo, a lista das competência do Black Belt e, em parênteses, a competência correlata do Cientista de Dados:
Competência 2: Melhoria nos processos de negócios (Pensamento Lógico) ;
Competência 6: Aquisição de dados para análise (Conhecimento em Banco de Dados);
Competência 7: Pensamento de criatividade (Pensamento Lógico);
Competência 8: Foco no cliente (Pensamento Lógico);
Competência 9: Tomada de decisão (Pensamento Lógico);
Competência 13: Resolução prática de problema (Pensamento Lógico);
Competência 21: Técnicas estatísticas (Habilidades com Números);
Competência 22: Uso estatístico de software (Programação).
De forma geral, vemos que o Cientista de Dados possui maior conhecimento de programação, base de dados enquanto o Black Belt tem maior foco na condução de projetos de melhoria que usam os dados como um meio e não um fim. Em comum, o conhecimento de estatística, o pensamento lógico e trabalho com base em dados.
Vantagem de um Cientista de Dados se tornar Black Belt
A formação Black Belt irá capacitar o Cientista de Dados a conduzir as análises de forma mais estruturada pelas etapas da metodologia, com maior foco em melhorias e resultados, tangibilizando os ganhos e envolvendo a equipe. Um Cientista de Dados que se torna Black Belt desenvolverá mais o pensamento com foco no negócio, na qualidade e na experiência do cliente.
Vantagem de um Black Belt se tornar Cientista de Dados
Quando um Black Belt passa a conhecer mais sobre base de dados, tratamento de dados e programação, ele fica menos dependente de áreas que o suportam com os dados (Inteligência de Negócios, por exemplo). Além disso, ele consegue automatizar de forma mais consistente as análises sem depender de softwares típicos como o Minitab, por exemplo. Ele também ganha autonomia para automatizar e digitalizar alguns processos e gerar relatórios e análises de forma mais sistemática, com base em IA e Machine Learning melhorando a governança e a qualidade dos controles.
Dessa forma, existem muitas sinergias e a busca do desenvolvimento das competências de forma holística, ao meu ver, é um grande diferencial competitiva para qualquer profissional que quer estar preparado para o cenário complexo de um mercado cada vez mais existente. A saber, o Setec Consulting Group possui a formação Black Belt com reconhecimento internacional pela CSSC e também ministramos treinamentos do software R e Minitab que podem ser bons complementos para busca dessas novas competências.