O algoritmo aprende o passado errado

Entre 2022 e 2026, a adoção de sistemas de triagem algorítmica em RH corporativo brasileiro cresceu mais rápido do que qualquer outra ferramenta de gestão de pessoas — e cresceu sem protocolo de auditoria equivalente. O que esta reportagem documenta, depois de conversas com gestores de RH, pesquisadores de equidade algorítmica e especialistas em ética de IA em sete grandes empresas dos setores financeiro, varejista, tecnológico e industrial, é uma distância. Uma distância entre o discurso da neutralidade e o comportamento empírico das ferramentas.

Escrevo sobre isso de um lugar que preciso nomear. Atendo no consultório profissionais negros e negras que passaram por essas triagens — engenheiros de software qualificados que viram a vaga abrir, fechar e nunca explicar por que; analistas de crédito que aprenderam a apagar o nome do bairro do currículo antes de submeter; gestoras que perderam dois processos seletivos seguidos pra candidatos com menos tempo de carreira e mais consoantes no sobrenome. O algoritmo não chega ao meu consultório como abstração técnica. Chega como o silêncio depois de "vamos manter seu currículo em nosso banco de talentos", repetido por anos. Escrevo sobre o sistema lendo papers, mas escrevo também ouvindo a conta concreta de quem foi filtrado por ele.

O problema técnico tem nome. Solon Barocas, Moritz Hardt e Arvind Narayanan sistematizaram o campo em Fairness and Machine Learning (MIT Press, 2023), livro que virou referência para o NIST AI Risk Management Framework e para o EU AI Act de 2024. Modelos de ranqueamento de currículos são treinados sobre dados históricos. Dados históricos do mercado de trabalho brasileiro carregam décadas de exclusão racial documentada. O sistema aprende a reproduzir o padrão não porque há má intenção no código, mas porque o código generaliza bem sobre o passado — e o passado é racialmente seletivo. Generalizar bem sobre o passado errado é exatamente isso. Errar de novo, com mais eficiência.

O viés em embeddings é o mais documentado e o menos discutido publicamente. Embeddings são representações vetoriais de palavras, nomes, descrições de cargo, trajetórias profissionais. Tolga Bolukbasi e colaboradores mostraram em 2016 (NeurIPS, Man is to Computer Programmer as Woman is to Homemaker?) que esses vetores codificam associações estereotipadas. Aylin Caliskan e colaboradores estenderam o achado em 2017 (Science, Semantics derived automatically from language corpora contain human-like biases): nomes associados a fototipos escuros pontuam mais baixo em contextos de prestígio e mais alto em contextos de esforço físico. Quando o sistema de triagem usa embeddings para calcular "fit cultural" ou "potencial de liderança", ele não é neutro. Está executando uma aritmética de exclusão. Aritmética que o gestor de RH raramente consegue auditar — porque ninguém ensinou a auditar, e o fornecedor estrangeiro não abre a caixa.

Das sete empresas consultadas, quatro operam ferramentas de triagem compradas de fornecedores estrangeiros. Em três delas, os gestores responsáveis não sabiam precisar se o modelo havia sido retreinado com dados brasileiros ou se operava com pesos originais calibrados em mercados do hemisfério norte. Não sabiam. Nenhuma das sete possui protocolo formal de auditoria de equidade por fototipo ou raça autodeclarada. Duas afirmaram realizar "monitoramento de diversidade" — só que o monitoramento se limitava a contar cabeças nas listas de contratados, sem retroagir sobre a etapa de triagem algorítmica onde o funil já se fechou. Contar quem entra depois que a porta filtrou é contar errado.

O human-in-the-loop merece desconstrução. Há pelo menos quatro posições distintas em que um humano pode estar no processo: na rotulagem dos dados de treinamento, na validação das saídas, na contestação de resultados pelo candidato, na governança do modelo. Quatro posições, quatro poderes diferentes. Um recrutador humano que revisa uma lista já filtrada pelo algoritmo não está exercendo supervisão sobre o algoritmo. Está consumindo o produto do algoritmo com a ilusão de autonomia. A pergunta relevante não é se há humano no circuito — é em que ponto do circuito ele pode de fato interromper a máquina. Nas sete empresas, em nenhuma o humano pode interromper o que veio antes de ele aparecer.

O quadro regulatório brasileiro em 2026 é transitório. O PL 2338, em sucessivos substitutivos, oscila entre o modelo europeu de regulação por risco — que classifica triagem de emprego como alto risco e exige auditoria obrigatória — e uma abordagem setorial fragmentada, sem obrigação de transparência algorítmica. A Lei Geral de Proteção de Dados, no artigo 20, prevê o direito à revisão de decisões automatizadas que afetem interesses do titular. Existe no papel. A ANPD ainda não emitiu regulamentação específica sobre como esse direito se aplica a sistemas de RH. E a maioria dos candidatos afetados desconhece que o direito existe. Direito que ninguém sabe que tem é direito que não filtra. É decoração legal.

Para o profissional negro que lê esta reportagem, a leitura clínica é esta: o currículo que não passa pelo filtro algorítmico raramente chega a um ser humano que possa avaliá-lo. A disputa por equidade no mercado de trabalho passou a incluir uma disputa anterior — a disputa pela transparência dos sistemas que decidem antes dos humanos. Isso exige alfabetização técnica de quem contrata. Exige pressão coletiva por auditoria pública. Exige um direito de explicação que precisa ser negociado empresa por empresa, porque a regulação federal ainda não chegou. A neutralidade do algoritmo é argumento de marketing. A evidência empírica diz outra coisa — e quem trabalha em RH precisa decidir de qual lado fica.

REPORTAGEM ENSAÍSTICA — Dados, marcos regulatórios, papers e fontes institucionais verificados em campo. Quando o texto evoca cenários clínicos individuais, trata-se de composições anonimizadas, construídas a partir de padrões observados em prática profissional e na literatura, em conformidade com o Código de Ética Profissional do Psicólogo (CFP Art. 9, sigilo profissional).