Infraestruturas de Serviços: um chamado para a etnografia da heterogeneidade

EPIC People Brasil
12 min readNov 28, 2022

por ROGERIO DE PAULA, VICTOR CAVALCANTE e CLAUDIO PINHANEZ

Este artigo investiga a noção de heterogeneidade, inspirada pelo trabalho de Latour a respeito da Teoria Ator-Rede, como uma lente para entender as práticas diárias de trabalho em uma grande organização de prestação de serviços. Para isso, apresentamos e discutimos as descobertas de uma pesquisa em andamento em que revelamos como os administradores do sistema gerenciam e negociam solicitações de resolução de incidentes como parte das práticas de entrega de serviços. Em particular, analisamos o modo pelo qual as métricas de desempenho, como os contratos de Acordo de Nível de Serviço (ANS), mediavam essas práticas. Este artigo contribui para os estudos da infraestrutura e explora a sinergia crítica entre métodos quantitativos e qualitativos amparando a prática de pesquisa em larga escala.

INTRODUÇÃO

Gerenciar grandes infraestruturas de tecnologias de informação (TI) — vastas configurações de atores e artefatos heterogêneos — constitui as práticas cotidianas de serviços de uma empresa de entrega de serviços de TI em larga escala. Eles formam associações (e redes) de servidores, cabos de rede, roteadores e protocolos, processos de trabalho, operações, métricas de desempenho, fusos horários, interesses e valores empresariais, clientes, administradores de sistemas (sysadmins), vendedores, gerenciamento e práticas, que estão constantemente sendo ativadas (e desativadas), reunidas e efetivadas como resultado de esforços contínuos para orquestrar e manter o sistema sociotécnico global operacional. Ou seja, enquanto as infraestruturas dos clientes são tomadas como um substrato estável e transparente contra o qual as operações de negócios reais se desdobram (ou gostariam seriamente de tomá-las como tal), para as organizações de serviços de TI tais infraestruturas são aspectos manifestos de suas rotinas diárias de trabalho. Eles são o lócus e o foco das preocupações comerciais das organizações de serviços de TI. Essa "inversão infra-estrutural" (Bowker 1994) — colocando em primeiro plano os elementos efetivos dos bastidores das práticas de prestação de serviço — ajuda a desvendar e explicar as maneiras pelas quais esses atores e artefatos entram em jogo moldando o (e sendo moldados pelo) trabalho diário das pessoas que prestam serviços.

Este estudo analisa, assim, a prestação de serviços por meio das práticas de manutenção da infraestrutura. Ou seja, estamos interessados nas formas consolidadas de representar, atribuir e relatar a resolução de incidentes que moldam as lógicas e práticas de prestação de serviços em uma organização. Seguindo a longa linha de pesquisa etnográfica da infraestrutura de Star et al. (Bowker et al. 2010; Estrela 1999; Estrela 2002; Star e Ruhleder 1994; Star e Ruhleder 1996), pretendemos analisar os aspectos mais mundanos da prestação de serviços. Para isso, propusemo-nos os processos pelos quais os acordos contratuais (ou seja, acordos de nível de serviço — ANS) são artefatos para medir e garantir altos níveis de qualidade na prestação de serviços, mas também para negociar o desempenho de uma equipe. Ou seja, examinamos as práticas de despacho de incidentes (leitura, tratamento de problemas) e as maneiras pelas quais eles são frequentemente modulados pelos ANS de um determinado cliente. Reunimos narrativas em torno das tensões entre o local e o global, observamos as maneiras pelas quais as ferramentas existentes (caseiras ou globais, padronizadas ou não) afetam as práticas de entrega e examinamos como os "tickets" de incidentes se tornam moeda para avaliação e negociação de desempenho.

Neste artigo, tentamos, assim, explorar e expandir a noção de infraestruturas de Star et al., introduzindo a noção de heterogeneidade de Latour et al. (Latour 2005; Law 1992). Nesse contexto, as infraestruturas não são diferentes da sociedade na medida em que podem ser consideradas associações ou redes de "elementos" heterogêneos (animados ou não). Em resumo, a Teoria Ator-Rede (TAR) de Latour sugere que a sociedade, organizações, agentes e máquinas são todos resultados de redes estabilizadas de materiais diversos/heterogêneos (Law1992), sejam pessoas, máquinas, políticas, hierarquias de organizações, e assim por diante. À medida que esses materiais interagem entre si, eles deixam para trás rastros que costumamos chamar de "social". Embora Star et al. reconheçam a heterogeneidade em suas abordagens etnográficas e teorizações da infraestrutura, e considerem sua propriedade relacional – ou seja, como algo que emerge das suas relações com práticas humanas organizadas (Star 2002) – tais autores ainda separam os substratos materiais subjacentes das práticas de fato. Segundo a TAR, por outro lado, humanos, caixas, redes, aplicativos de software e documentações são todos atores nessas redes heterogêneas (ou associações). Acreditamos, então, que essa abordagem 'misturada' da "infraestruturação" da prestação de serviços pode ajudar a lançar uma nova luz sobre como diferentes configurações das redes materiais podem afetar as práticas de prestação de serviços, desempenhos e resultados.

ESTUDOS DE INFRAESTRUTURAS DE SERVIÇOS

Embora o serviço de terceirização de TI seja uma indústria importante, significativa e em crescimento em todo o mundo, os estudos etnográficos das práticas cotidianas dentro da organização de prestação de serviços permanecem ainda poucos. Há exceções notáveis, não obstante. Em 1997, Sandusky (Sandusky 1997) investigou o trabalho de administradores de rede de um grande instituto financeiro. Ele estava principalmente interessado nos padrões de comunicação por meio das fronteiros do grupo e da organização. Como estudos subsequentes também observaram, seu trabalho ilustra as complexidades do trabalho de gestão de redes (infraestrutura), apontando para os desafios da coordenação em diversas dimensões (temporal, espacial e organizacional). Maglio, Harber e colegas mais tarde realizaram uma extensa série de trabalho de campo (por mais de 4 anos) visitando várias organizações diferentes de prestação de serviços de TI (da hospedagem web ao suporte do sistema operacional à segurança do computador às operações de data center) (Haber e Bailey 2007; Kandogan et al. 2012). Kandogan e seus colegas oferecem uma perspectiva minuciosa e completa da prestação de serviços de TI nas principais empresas de terceirização de TI em todo o mundo.¬ Com base em séries de observações e entrevistas contextuais, eles apresentam uma série de episódios sobre práticas cotidianas de administradores de sistemas, revelando as maneiras pelas quais eles planejam, implantam, monitoram e solucionam problemas das infraestruturas de TI como práticas inerentemente coletivas. Blomberg (Blomberg 2011) investigou o efeito das mudanças de processo na transformação organizacional, que envolviam abordagens sinópticas e performáticas da transformação diária de uma grande organização de serviços de TI.¬ E, de Souza et al. (Souza et al. 2011a; Souza et al. 2011b) investigaram as práticas de coordenação na prestação de serviços de uma organização global de serviços de TI.

As infraestruturas de TI são um componente-chave, se não o mais importante, da prestação de serviços. Mas, em geral, estão tradicionalmente em segundo plano — invisíveis e frequentemente tomados como certos (Star e Ruhleder 1994). Em particular, esses estudos de prestação de serviços tomam a infraestrutura como o substrato subjacente a partir do qual os administradores de sistemas operam. Como tal, ele combina os sistemas (sejam eles, computadores, normas, protocolos e afins) que amparam e permitem seu trabalho e aqueles sobre os quais ‘eles’ atendem. Mas, como será descrito em seguida, essa perspectiva não considera a natureza dupla e relacional da infraestrutura em que se encontra concomitantemente em segundo plano e no ponto focal, padronizada e personalizada; local e global; interna e externa; tecnológica e social; transparente e opaca. Estudar a prestação de serviços de TI como parte de uma grande implantação e manutenção de infraestrutura torna-se, portanto, necessário.

A noção tradicional de infraestrutura muitas vezes invoca a imagem dos substratos subjacentes que suportam atividades humanas, como, tubulação de água/esgoto, estradas, trilhos ferroviários, pontes, redes de computadores e afins. Este artigo, no entanto, baseia-se na tradição de longa data de Star e colegas sobre a etnografia da infraestrutura. Baseando-se em uma série de estudos etnográficos do que Star passou a chamar de estudos de “coisas chatas”, eles exploraram a natureza incorporada, complexa e relacional das infraestruturas cotidianas. Desde o início, tais trabalhos estavam particularmente interessados em analisar temas incomuns, muitas vezes considerados maçantes, o que atraía pouca atenção dos etnógrafos. No entanto, à medida que se aprofundavam nos vários tópicos “chatos”, eles começam a descobrir uma miríade de práticas sociopolíticas-culturais importantes que haviam sido deixadas intocadas pelo simples fato de serem consideradas menos excitantes, exóticas e etc. Ao fazê-lo, começam a investigar e desconstruir o que chamaram de barreiras infraestruturais, ou seja, decisões sociopolíticas que poderiam permitir, dificultar, reforçar ou desestabilizar (dependendo do ponto de vista) ações, processos, instituições ou mesmo conhecimentos (Dourish e Bell 2007; Star 2002). Por sua própria natureza, as infraestruturas são, portanto, entendidas como formas ortodoxas, convencionais, padronizadas e conservadoras de fazer as coisas. Isso levou ao entendimento de que a infraestrutura é, de fato, uma maneira de constranger, construir e preservar o conhecimento — com base em padrões ou valores culturais. Em outras palavras, a infraestrutura incorpora arranjos institucionais específicos que, em última análise, reificam sua existência. Significativamente, Star e seus colegas encaram a infraestrutura como fundamentalmente um conceito relacional (Star and Ruhleder 1996) — ela só pode ser compreendida em relação a uma determinada prática ou perspectiva organizada. Portanto, não tem significado fixo. “A infraestrutura de uma pessoa é um outro tema, ou dificuldade” (Star 1999).

UM CASO DE PRESTAÇÃO DE SERVIÇOS EM UMA FÁBRICA DE SERVIÇOS

Big Service Factory1 (BSF) é uma fábrica de serviços de TI, uma empresa de operação de serviços de TI em larga escala, onde centenas ou mesmo milhares de funcionários de suporte gerenciam sistemas complexos de TI compostos por milhares de servidores (heterogêneos), roteadores e outros equipamentos de TI, muitas vezes de vários clientes, simultaneamente (Souza et al. 2011b). Os funcionários da BSF são muito especializados, frequentemente focados em repetidas tarefas específicas, muitas vezes ao dia. Em particular, muitos desses profissionais são administradores de sistemas, responsáveis por algumas das funções mais necessárias para manter as infraestruturas de TI dos clientes funcionando bem e com inteligência. Apesar da especialização, o trabalho dos administradores de sistemas é altamente dinâmico, colaborativo e interdependente (Haber et al. 2011).

Nos últimos dois anos, temos investigado as práticas cotidianas de prestação de serviços na BSF (Souza et al. 2011a; Souza et al. 2011b). Iniciamos nossa pesquisa logo após a BSF implementar um novo modelo organizacional (ver próxima seção) visando alcançar economias de escala por meio da mudança organizacional da equipe, antes baseada em competência, para baseada no cliente. Nossa pesquisa ocorreu, assim, no meio desse grande processo de “infraestruturação” (Hughes 1983), pelo qual elementos anteriormente invisíveis (desinteressantes) vieram à tona enquanto outros passaram para um segundo plano.

Metodologicamente, implementamos um programa de pesquisa duplo, inspirado na etno-mineração (Anderson et al. 2009), que integrou tanto metodologias qualitativas (etnografia) quanto quantitativas (mineração de dados). Para a representação quantitativa, concebemos uma ferramenta analítica, chamada Workload Profile Chart (WPC), que caracteriza o desempenho geral de uma equipe, traçando em um gráfico log-log os valores normalizados dos tempos de atribuição e resolução, respectivamente, de cada incidente em um determinado período de tempo. Em relação ao estudo qualitativo, fizemos uma série de reuniões em que apresentamos os WPCs aos participantes (que vão de administradores de sistemas à gestão) e mediamos as conversas entre pesquisadores e participantes — isso ajudou a traduzir uma série de operações ímpares (de acordo com o tempo de resposta retratado no WPC) em práticas de negociação de ANS. Essa abordagem permitiu, assim, revelar abordagens sinópticas e performativas das práticas de prestação de serviços. Blomberg propôs essa abordagem metodológica para estudar a transformação de uma organização de serviços de TI em larga escala (Blomberg 2011), que entrelaça perspectivas sinópticas e performáticas de transformação com uma organização de serviços. Ao fazê-lo, fomos capazes de delinear as trajetórias das mudanças ao longo do tempo e, ao mesmo tempo, revelar as maneiras pelas quais as tais transformações são de fato performadas nas ações cotidianas das pessoas. Nosso objetivo final foi descobrir o modo pelo qual as práticas de serviço foram transformadas no trabalho diário das pessoas.

ESTRUTURA ORGANIZACIONAL DA BSF

A organização da BSF costumava ser feita em departamentos focados em clientes específicos, ou seja, um grupo de administradores de sistemas de diferentes plataformas forneceia suporte apenas a um determinado cliente. Nesse contexto, eles eram mais propensos a construir um entendimento profundo de importantes componentes de TI do cliente para o qual prestavam serviços. Por outro lado, a organização não conseguiu alcançar economias de escala compartilhando recursos entre os clientes, e segundo, o conhecimento técnico muitas vezes não era compartilhado entre esses grupos. Devido ao mercado altamente competitivo, há cerca de sete anos, a BSF internacional começou a implementar uma nova estrutura organizacional baseada principalmente em competências técnicas: ou seja, departamentos baseados em habilidades, competências e atividades comuns. Por exemplo: o grupo UNIX, responsável por lidar com problemas de sistemas de servidores baseados em UNIX; e Grupo de Segurança, responsável pela prestação de contas, atualizações de segurança e problemas semelhantes em sistemas operacionais. Esses departamentos (ou grupos de serviço) são responsáveis pelo tratamento de incidentes, em que um incidente é definido como “qualquer evento que não faça parte da operação padrão de um serviço e cause, ou possa causar, uma interrupção ou uma redução na qualidade desse serviço” (Guia Aberto itil, 2011). Cada incidente (ou solicitação de serviço) é gerenciado através de um objeto de TI muitas vezes referido como um bilhete, que é um registro que agrega todas as informações-chave sobre tal incidente. Os bilhetes descrevem uma interrupção (ou redução na qualidade do serviço) de um determinado serviço oferecido pela BSF aos seus clientes formalmente acordado por meio de contratos legais. Dentro da BSF, há também um departamento responsável por trazer novos clientes ou vender serviços adicionais aos que já assim o são. Uma dessas equipes é a equipe de conta do cliente cujo trabalho é gerenciar o relacionamento geral com o cliente. Eles interagem com funcionários e clientes da BSF negociando preços, contratos e monitorando a qualidade dos serviços prestados.

Estabelecer papéis bem-definidos é outro aspecto da padronização do processo. Por exemplo, para concentrar as informações e conhecimentos específicos para determinados clientes, o modelo propõe o papel de especialistas em clientes (ECs), responsáveis por entender com mais detalhes o ambiente de TI e a estrutura organizacional de determinados clientes. No entanto, dado o grande número de clientes, alguns funcionários da BSF são ECs para até 5 clientes diferentes. Além disso, dentro de cada departamento, os administradores de sistemas são reunidos em três categorias de trabalho diferentes de acordo com seu nível de experiência necessário para a realização do trabalho. Outra função é o “pool dispatcher”, responsável pelas atribuições de bilhetes e seu monitoramento; essa última tarefa parece ser uma responsabilidade coletiva, compartilhada com administradores de sistemas, gerentes de serviços, e afins. A atribuição deles é baseada em sua natureza e nível de dificuldade (ou complexidade) combinada com a capacidade de resolução de um administrador de sistemas (ou seja, expertise). A Figura 1 ilustra o processo de atribuição dos bilhetes. Normalmente, os bilhetes são criados por solicitações de clientes e descritos no IMS como pessoal de help- desk ou gerados por alertas de monitoramento (scripts automatizados) e encaminhados para pools através do IMS. Então, com base na estratégia de despacho adotada pelo expedidor que trabalha no pool de serviços, cada bilhete de entrada é movido da fila de entrada para um administrador de sistema que é capaz de resolver o incidente adequadamente.

O expedidor, portanto, desempenha um papel central na prestação de serviços, pois sua função primária é corresponder aos requisitos de resolução de incidentes (com base na natureza e dificuldade do problema em questão) e o melhor recurso disponível para enfrentá-lo em tempo hábil. Uma de suas principais preocupações é cumprir com o ANS associado a cada bilhete. Ao fazê-lo, eles definem a cadência do trabalho realizado por cada pool. Eles definiram o tempo de atribuição dos incidentes. Em justaposição está o tempo que leva para um administrado de sistemas realmente resolver o incidente — o tempo de resolução. Os incidentes são registrados e representados pelos sistemas de gerenciamento de incidentes como bilhetes. Assim, os bilhetes podem ser pensados como solicitações de serviço. Considerando que um bilhete, por exemplo, de alta gravidade pode ter o ANS de 30 (ou até 15) minutos, qualquer tempo gasto excedente atribuído a um determinado bilhete impacta seu tempo de resolução, pressionando assim os administradores de sistemas. Como será discutido a seguir, este é um ponto crítico de dissenso entre diferentes grupos, pois eles negociam de quem pode ser a culpa por ANSs perdidos.

Processo de envio de tickets
Figura 1: Processo de envio de tickets

Ao longo de todos os processos de prestação de serviços de TI, uma grande preocupação é manter as infraestruturas de TI funcionando ininterruptas e prontamente acessíveis, e sempre que necessário restabelecer operações normais o mais rápido possível com o menor impacto possível nos negócios dos clientes ou de seus clientes. Portanto, o tempo de resposta é uma métrica fundamental de qualidade do serviço. Os contratos entre as fábricas de serviços de TI e seus clientes estabelecem instrumentos formais para regular a “qualidade” do serviço a ser prestado, determinando claramente a rapidez com que os incidentes devem ser investigados e resolvidos para garantir a menor interrupção possível na infraestrutura de TI. Para isso, a ANS é um contrato formal entre as partes que estabelece o tempo máximo dentro do qual um determinado tipo de incidente deve ser abordado e resolvido. Normalmente, uma classificação formal de incidentes é definida como uma maneira associar tipos de incidentes com seu impacto específico na organização de um cliente devido à indisponibilidade dos serviços. O não cumprimento dos ANSs de bilhetes de alta prioridade pode resultar em multas e penalidades.

Escrito por ROGERIO DE PAULA, VICTOR CAVALCANTE e CLAUDIO PINHANEZ

Tradução de Eduardo Almeida
Voluntário no EPIC Brasil, que gentilmente doou seu tempo e tornou possível a publicação deste artigo.

--

--

EPIC People Brasil

Grupo multidisciplinar que busca criar um espaço colaborativo a respeito de práticas de pesquisa, e estabelecer pontes entre o saber acadêmico e o mercado