Nosso blog

A importância da Ciência de Dados para o futuro da sua empresa

k

25 Maio 2017

Vidhya Karthikeyan

Posts by authors: Vidhya Karthikeyan, Principal Research Scientist, BT

Vidhya Karthikeyan, Principal Research Scientist, BT, fala sobre a importância dos cientistas de dados para as organizações que desejam orientar suas ações a partir de dados – e assim, orientar-se para o futuro.

A Ciência de Dados cada vez mais se torna fundamental. Afinal, como transformar a crescente massa de dados em algo utilizável por cada departamento da empresa, do marketing ao desenvolvimento de produtos? Porém, é preocupante o número ainda pequeno dos cientistas de dados, além de empregar-se pouco a ciência de dados diante dos progressos da tecnologia.

Em primeiro lugar, o que faz exatamente um cientista de dados?

Os cientistas de dados trabalham para que, em empresas como a BT, por exemplo, as decisões sejam tomadas com base em evidências. Isso ajuda a detectar tendências não intuitivas, que talvez não saibamos onde procurar.

Tudo está mudando, constantemente – da infraestrutura de rede aos serviços que entregamos sobre essa infraestrutura como suporte aos processos de negócio. Pessoas de todas as áreas precisam responder a diferentes questões durante o processo de evolução da empresa, mas a ciência de dados, a partir de uma perspectiva mais ampla (como fazemos na pesquisa) não responde exatamente a questões imediatas, mas identifica o que existe em comum entre uma série de questões similares, recorrendo às ferramentas certas para buscar as respostas certas. Não há respostas prontas.

A ciência dos dados consiste em mais do que buscar padrões em dados existentes. Trata-se do uso de ferramentas e da Inteligência Artificial (IA) e a, além de, de conhecimentos específicos, da confiança de todas as partes interessadas (e vice-versa), e de definir o que torna uma informação acionável em determinado momento vs. informações interessantes, mas não necessariamente acionáveis.

Os cientistas de dados ajudam a empresa a definir a maneira como coletam e tratam os dados para que se transformem em soluções inovadoras e informações úteis para os negócios. Os cientistas de dados voltados para a pesquisa ajudam as empresas no desenvolvimento de um roadmap de ferramentas. Como pioneiros de provas de conceito, eles têm acesso a uma série de ferramentas, para diferentes finalidades. O cientista de dados é a pessoa certa para, à medida que a empresa evolui, indicar as ferramentas mais adequadas para toda a comunidade empresarial, aconselhando, com sua experiência, quanto à facilidade de uso e quanto a recursos úteis para uma determinado grupo de pessoas ou para uma infraestrutura em particular.

A utilização prática da ciência de dados é única, e diferente da entrega de software tradicional. Os cientistas de dados chegam a informações a partir de dados, e essas informações devem levar às melhores decisões para a empresa. Eles podem projetar algoritmos de aprendizado que se integrem a sistemas de TI existentes e permitem uma ação automatizada e proativa para melhorar a experiência do cliente. Podem também reunir ferramentas existentes, utilizando uma pequena parte de cada uma delas, para criar novos recursos capazes de transformar dados de um ambiente para outro. O resultado do trabalho de um cientista de dados varia bastante, de acordo com a necessidade da empresa, e vai desde lidar com dados até a sua modelagem para que se apliquem ao aprendizado de máquina.

E o que a ciência de dados oferece de melhor?

Na minha opinião, são três as características da boa ciência dos dados:

  1. Possibilitar decisões melhores e mais rápidas. O principal objetivo da ciência dos dados é alavancar os vastos volumes de dados coletados pela empresa e fazer com que os recursos já existentes sejam orientados por dados. Muitas vezes isso significa mudar processos existentes, como resultado de uma nova percepção trazida pelos dados.
  2. Considerar recursos comuns para questões relacionadas entre si, em vez de buscar soluções pontuais para os problemas.
  3. Dever ser reprodutível. Em primeiro lugar, para garantir controle de qualidade. Em segundo lugar, embora um cientista de dados possa projetar uma solução baseada em dados e ajudar a integrá-la à empresa, a manutenção dessas soluções poderá estar em outro setor, completamente diferente. Assim, a boa ciência dos dados deve ser bem documentada – o suficiente para ser entendida, na organização, por pessoas de habilidades diferentes.

Além de gerar informações acionáveis, que outros benefícios as empresas podem obter da ciência dos dados?

Há uma série de outros benefícios. Por exemplo, os cientistas de dados podem aproximar uma empresa de seus clientes – estaríamos em melhor sintonia com eles se projetássemos nossos sistemas tendo a coleta e arquitetura de dados como foco principal. Por isso, é vital haver um lago de dados comum, onde eles sejam facilmente acessíveis por todos (dentro do que permitem as regulamentações, claro), desde o pessoal de marketing até as equipes de finanças e de produtos, com ferramentas adequadas acessíveis a cada um desses setores.

Aos cientistas de dados muitas vezes se solicita que examinem aplicações baseadas em fontes de dados comuns, e pessoas como eu trabalham para levar a empresa a uma melhor arquitetura de dados e melhor reutilização desses dados por diferentes aplicativos, obtendo de maneira geral, o melhor valor dos deles.

Que conselho daria às organizações que pretendem se tornar mais orientadas por dados?

Fundamentalmente, as organizações, ao conceberem novos produtos, serviços e processos de negócios, devem dispender algum esforço para decidir como coletar, manusear e manter os dados relativos aos que estão desenvolvendo. Os dados necessários a um sistema crítico para o dia a dia da empresa são diferentes dos que utilizamos em análises.

Deve permitir que seus cientistas de dados pesquisem e falhem. Devem criar infraestruturas de TI que suportem aplicativos críticos para o cotidiano dos negócios, bem como aplicações para análise de grandes volumes de dados. Uma tendência que não é visível hoje talvez possa ser percebida se retrocedermos no tempo. Documentar seus dados – e sua ciência dos dados – pode não ser a parte mais interessante do trabalho, mas com certeza isso é necessário. Confie nos dados: as organizações migraram do manual para o automatizado – por que não daí ao autônomo?

Você pode dar um exemplo do impacto da ciência de dados para a BT? 

A BT coleta um grande volume de dados sobre o desempenho de suas redes e serviços. As equipes de operação já têm muito trabalho, e extrair informações dos dados não é mais um processo manual. Estou bastante orgulhosa de uma primeira prova de conceito que eu conduzi, para a qual  projetei um algoritmo capaz de prever com alto grau acerto a probabilidade de falhas resultantes de alta temperatura de dispositivos. Esses eventos vinham sendo ignorados pelas equipes de operação simplesmente porque não havia como estabelecer essa relação – até que meu trabalho a descobriu.

Uma das minhas áreas de pesquisa é utilizar dados de desempenho de serviços e da rede para aprimorar a oferta de TV a nossos clientes. Aplicando a ciência de dados e técnicas de aprendizagem de máquinas, meu trabalho ajudou a diagnosticar causas de degradação, no passado, de sinais de TV em nossa infraestrutura em todo o Reino Unido. Também influenciou positivamente as informações em conversas com os clientes que entravam em contato conosco. Mais recentemente, alguns de meus trabalhos influenciaram a estratégia de nosso crescimento em TV no sentido de aumentar o número de canais entregues por meio de nossa rede – com a certeza de nossa capacidade para transportar esse tráfego. Minhas  pesquisas permitem que nossos clientes assistam televisão de alta definição com boa qualidade, seja em suas salas de estar ou em movimento.

Encontrar cientistas de dados pode ser complicado para as organizações. Quais as suas recomendações para compor uma equipe de ciência dos dados?

Para recrutar um bom cientista de dados, é preciso saber reconhecê-lo. Eu não seria capaz de avaliar um candidato até dar a ele uma determinada tarefa, apresentando-lhe um conjunto de dados e verificando a abordagem que ele escolheria para chegar ao resultado pedido. Podemos aprender a usar ferramentas mais rapidamente do que maneiras de pensar. Os cientistas de dados aprendem a comunicar seus resultados técnicos por meio da experiência, pois não é fácil transformar um modelo matemático em palavras que todos entendam.

As organizações devem expor questões de suas diversas áreas aos jovens cientistas de dados, porque isso os ajuda na identificação de problemas comuns e na comunicação sobre as formas de enfrentá-lo. Devem permitir que seus jovens cientistas de dados “brinquem” com os dados e ferramentas em um ambiente de sandbox, sem que necessariamente eles tenham um problema concreto a resolver. E Incentivar a criatividade, ajudando-os a encontrar meios para que as conclusões de seu trabalho tenham impacto nos negócios, além de solicitar-lhes  respostas para as questões de interesse da empresa.

Vidhya estará no Innovation  2017, quando abordará mais detalhadamente o papel que a ciência dos dados desempenha nas organizações modernas.