NOTÍCIA

Gestão

Autor

Paulo de Camargo

Publicado em 15/07/2025

Hora de reavaliar a avaliação escolar

A chegada de ferramentas baseadas em inteligência artificial acrescenta complexidade a um dos principais desafios das escolas: avaliar o desenvolvimento pedagógico dos seus alunos

Há 35 anos, em 1990, a educação brasileira dava um passo que marcou todas as políticas desenvolvidas desde então: era lançado o Sistema de Avaliação da Educação Básica (Saeb), estruturando um conjunto de avaliações em larga escala e abrindo caminho para as iniciativas posteriores que se tornaram conhecidas da sociedade brasileira, como o Exame Nacional do Ensino Médio (Enem), em 1998, e o Índice de Desenvolvimento da Educação Básica (Ideb), em 2007. Com o mérito de ter se tornado uma rara e inovadora política de Estado, atravessando governos de diferentes espectros ideológicos, e de ter disseminado uma cultura avaliativa, o Saeb agora é pressionado a se movimentar para se adaptar aos novos tempos.

“O Saeb permitiu a construção de uma linha de base para avaliarmos a evolução da educação. Mas, em termos de estrutura, as avaliações mudaram pouco, o que é ruim, se pensarmos o quanto o mundo mudou, a tecnologia avançou, inovações no campo da avaliação surgiram”, avalia o pesquisador Ernesto Faria, diretor do Interdisciplinaridade e Evidências no Debate Educacional (Iede).

Para dar uma dimensão dessa estagnação, basta olhar para o Programa Internacional de Avaliação de Estudantes (Pisa), criado uma década após o Saeb. Desde sua criação, o Pisa não parou de mudar, e introduziu novas matrizes de avaliação, buscou capturar a evolução de competências mais complexas, como a criatividade, ampliou os questionários para conhecer a vida dos alunos, dos professores e dos gestores, e introduziu inovações para provas em larga escala, como questões abertas.

—————————–

Leia também

Avaliação: diferentes instrumentos para seres humanos diversos

Inteligência artificial na educação, das promessas à realidade

—————————–

“O Saeb, hoje, se reduz a avaliar conhecimentos e habilidades de baixa demanda cognitiva. Além disso, assume que basta ensinar o específico, considerando que, naturalmente, os estudantes saberão mobilizar os conhecimentos específicos para construir o todo. Ou seja, a ideia central da Base Nacional Comum Curricular (BNCC), que é a mobilização de conhecimentos e habilidades para a solução de problemas da vida, não está devidamente consagrada nos atuais instrumentos”, escreveu recentemente em seu LinkedIn José Francisco Soares, ex-presidente do Inep e um dos nomes de referência da avaliação da educação brasileira.

O impacto de qualquer mudança terá efeitos também sobre o Ideb, indicador que concentra dados de fluxo (evasão e repetência) e de aprendizagem, e também está em revisão pelo Inep. O Ideb é levado em conta para a distribuição de recursos públicos e orienta políticas de estados e municípios. 

Se entre as principais qualidades do índice está o fato de ter sido um indicador sintético para traduzir qualidade, agora, muitos pesquisadores da área querem que seja capaz de espelhar, por exemplo, a equidade de um sistema de ensino.

O índice ignora, por exemplo, as crianças que estão fora da escola — e não é pouca gente. Pior: não leva em conta as desigualdades de nível socioeconômico, étnico-raciais e regionais. “Para muitos pesquisadores, o tema da desigualdade deve fazer parte do coração do indicador”, diz Ernesto Faria, que defende que isso aconteça na divulgação dos dados — por exemplo, deixando claro qual é o Ideb quando se leva em conta a população mais atingida pela desigualdade.

“Se a metodologia não mudar, o indicador logo ficará irrelevante para o monitoramento da educação, seja como evidência do atendimento do direito, seja como indicador de qualidade, seja como gerador de orientações para ações pedagógicas”, prevê Francisco Soares.

—————————–

Leia também

As 10 competências da BNCC na prática

Uma nova Fuvest?

—————————–

São muitos os pontos elencados pelos pesquisadores da área, alguns de solução tecnicamente simples, outros mais profundos. De forma geral, o Saeb precisa evoluir conectando as provas às aprendizagens mais significativas no contexto contemporâneo e elevando a régua das expectativas. “Na avaliação dos anos iniciais, os textos ainda são bem curtos, os alunos são apresentados a muitos itens para a identificação de informações, não conseguindo aferir se um leitor está no nível de desenvolvimento mais baixo ou alto”, diz Ernesto.

O mesmo vale para alguns domínios da matemática e das ciências. Com isso, quando comparados a outros exames internacionais, como o Timms e o Pirls, fica claro que a régua — ou seja, o que se espera do aluno brasileiro — é mais baixa. Há outros fatores. Há questões no Pisa que já pressupõem habilidades de uso de softwares de planilhas, consideradas como pré-requisitos em uma educação que prepare os jovens para a vida adulta.

avaliação escolar

Difusão dos recursos baseados em inteligência artificial (IA) generativa atinge em cheio as práticas avaliativas (Foto: Shutterstock)

E aí, a IA…

As avaliações sempre tiveram, na educação brasileira, um papel indutor de políticas, a exemplo do que deverá novamente ocorrer com as mudanças esperadas para o Enem. Este exame tornou-se a mais conhecida das provas oficiais brasileiras. Fala-se dele em um jantar de família, por exemplo, ou nas rodas de conversa entre os jovens. Os pais acompanham seus resultados. E isso já é um grande feito em uma sociedade que acompanha tão de longe a educação.

Inicialmente, o Enem trouxe o tema das competências para o centro do currículo da escola média; depois, influenciou os demais vestibulares, ao tornar-se uma das chaves de acesso às universidades federais e outras instituições que aderiram ao modelo. Agora, é considerado essencial para que a recente reforma do ensino médio vingue — espera-se que a avaliação consolide o modelo dividido entre o núcleo comum e os itinerários formativos e aprofundamento.

Quando a salada da avaliação educacional no Brasil já parecia ter ingredientes demais, o molho complicou mais ainda. A difusão dos recursos baseados em inteligência artificial (IA) generativa atinge em cheio as práticas avaliativas — seja aquela miúda, de caráter formativo, realizada no ambiente escolar como parte do processo de ensino e aprendizagem, seja a dos instrumentos em larga escala, chamada somativa, que visa apenas medir o que se aprendeu de determinado conteúdo.

—————————–

Leia também

Centro Paula Souza integra ensino médio, técnico e superior em cinco anos e sem vestibular

—————————–

O impacto já começa a se tornar realidade em dimensões diferentes da avaliação — como a elaboração de itens, a evolução de metodologias adaptativas, ou seja, que adaptam as questões ao estágio de aprendizagem do aluno em determinadas competências e conteúdos, até a correção e devolutiva simultânea para o aluno.

O tema esteve presente em diversas mesas de um dos mais importantes eventos de tecnologia do mundo, a SXSW Edu, em Austin no Texas (EUA), em março. Para a consultora estratégica Sinead Bovell, a IA generativa vai levar a um redesenho do ecossistema de aprendizagem. “O feedback imediato será essencial e trará mais motivação e engajamento para os alunos, dando visibilidade ao que está aprendendo”, aposta.

A avaliação sempre foi um dos pontos mais sensíveis do trabalho do professor e, por isso, a oferta de soluções por editoras, edtechs e outras empresas vem provocando uma nova corrida ao ouro no mundo das startups. Em um nível mais básico de utilização das novas ferramentas, a própria correção pode ser acelerada com o uso da IA.

Em São Paulo, a Secretaria da Educação começou, em caráter piloto, a corrigir tarefas de casa dos alunos com ferramentas de IA, no projeto TarefaSP. No mesmo sentido, a FTD Educação já está utilizando a inteligência artificial do Google Cloud para corrigir redações manuscritas em escolas públicas de sete estados, com a edtech Pontue. Lendo, interpretando e corrigindo os textos escritos à mão pelos alunos, a ferramenta já está disponível para 38 municípios. A evolução é contínua, e estão previstas para breve ferramentas de detecção de plágio.

—————————–

Leia também

O que é a abordagem Pikler

—————————–

“A tecnologia otimiza o tempo dos educadores, oferecendo feedback aprimorado, análise personalizada do desempenho e correção automática de redações manuscritas. Com isso, os professores podem focar na aprendizagem individual dos estudantes”, garante Alexandre de Olim Cardoso, diretor de inovação e novos negócios da FTD Educação.

Os professores começam a ter acesso também a ferramentas que podem apoiá-los em seu trabalho — inclusive o de preparar provas, o que economiza tempo e abre para o educador a chance de personalizar as avaliações. A Editora do Brasil lançou o Asap Educa, que funciona como um assistente pedagógico via WhatsApp. A decisão de utilizar um aplicativo de mensagens instantâneas teve por princípio superar barreiras tecnológicas enfrentadas pelos docentes — pegando carona em um aplicativo que já faz parte de seu cotidiano.

“Valorizamos a simplicidade como elemento de inclusão digital, especialmente para os educadores com menor maturidade tecnológica. Isso tem sido um fator-chave para a aceitação espontânea e o sucesso da ferramenta”, diz Bruno Palhão, diretor de inovação e tecnologia da Editora do Brasil.

Além de otimizar e aprimorar processos na correção, a inteligência artificial abre espaço para acelerar a análise de conjuntos de informações (hoje já disponíveis com as tecnologias convencionais), como o tempo de resposta, os caminhos testados para resolver um problema, entre outros recursos. Encontrar e comparar padrões é a grande especialidade das IAs, e isso poderá levar a um enriquecimento sem precedentes dos dados levantados sobre a aprendizagem de crianças e jovens.

“Quanto mais informações e especificações você der, com diretrizes adequadas, melhor a inteligência artificial vai reagir. Então, o papel do humano é ainda muito importante, mas a interação com a inteligência artificial traz novas possibilidades e está cada vez mais avançada no campo da avaliação”, diz Ernesto Faria, que já vem fazendo suas próprias testagens.

avaliação

O Ideb ainda não leva em conta as desigualdades socioeconômicas, étnico-raciais e regionais. “Para muitos pesquisadores, o tema da desigualdade deve fazer parte do coração do indicador”, diz o pesquisador Ernesto Faria (Foto: arquivo pessoal)

Desafiando a TRI

Para analistas do mercado, a difusão da inteligência artificial generativa pode desafiar até um paradigma sagrado das avaliações modernas — o uso da Teoria da Resposta ao Item (TRI), princípio teórico e metodológico que permite que níveis de dificuldade entre exames possam ser equivalentes, possibilitando comparações, controle de ‘chutes’ e uma medida mais realista da aprendizagem. É o que está por trás do Enem, por exemplo, em que uma mesma questão certa pode ter peso diferente para cada aluno, conforme outros acertos e erros que cometeu.

Um dos grandes desafios das avaliações em escala baseadas em TRI é construir uma base de itens padronizados — em outras palavras, questões já previamente testadas e associadas a parâmetros que vão torná-las, por exemplo, coerentes com as escalas de questões mais fáceis ou difíceis. É um processo caro e demorado.

Agora, já existem propostas como a startup Premia, que vem buscando caminhos alternativos. A Premia lançou a solução Aprova+, que, segundo seu cofundador Paulo Faia, pesquisador na área de inteligência artificial, é capaz de prever notas com precisão, identificar lacunas de aprendizagem e oferecer recomendações pedagógicas personalizadas.

Conforme assegura, a ferramenta prevê a nota de um aluno em exames como o Enem ou o Saeb a partir da resposta a poucas perguntas, graças a modelos preditivos treinados com dados reais. “Com o avanço dos algoritmos preditivos, deixamos de olhar para a avaliação como fim e passamos a enxergá-la como ponto de partida para a melhoria da aprendizagem”, defende.

—————————–

Leia também

Ajustes nas licenciaturas EAD: falta, ainda, articulação entre teoria e prática, bem como um rearranjo curricular

—————————–

Quaisquer que sejam as vertentes predominantes, o certo é que a avaliação educacional já começou a ser profundamente impactada, especialmente em escolas que visam a alta performance dos alunos — disputando as vagas de maior concorrência nas universidades brasileiras.

É o caso do Colégio Farias Brito, de Fortaleza (CE). Nesta escola, os alunos participam regularmente de olimpíadas científicas nacionais e internacionais, concursos e vestibulares em instituições como o ITA e o IME. No Enem, os alunos ocupam o 1º lugar nos últimos oito anos. Os alunos chegam a fazer nove simulados por ano.

avaliação

No Colégio Farias Brito, CE, a avaliação com inteligência artificial é aplicada desde a educação infantil (Foto: divulgação)

Apesar de as estratégias tradicionais estarem funcionando, o Farias Brito passou a investir também em processos avaliativos com o uso de inteligência artificial, desde a educação infantil. No ensino fundamental – anos iniciais, a fluência leitora dos alunos já é avaliada em plataforma de IA. Nas demais etapas, os dados são essenciais para acompanhar o desenvolvimento de habilidades e o aprendizado de conteúdos, e começaram a ser analisadas plataformas baseadas em inteligência artificial. “A tecnologia tem apoiado a avaliação sob diferentes perspectivas: para o professor, para a equipe técnica e para o estudante”, garante Orlando Lustosa, líder de tecnologia educacional na Organização Educacional Farias Brito.

Qualquer que seja o caminho ou o âmbito — a avaliação censitária em um país de dimensões continentais como base para a construção de boas políticas públicas ou a avaliação cotidiana em contextos específicos —, as escolas brasileiras precisam repensar as formas pelas quais acompanham o desenvolvimento pedagógico dos seus alunos.

Não há uma fórmula única ou perfeita. “O modelo para o Brasil terá de preservar as medições mais básicas, que permitem identificar grandes defasagens de aprendizado, mas também ser capaz de medir habilidades complexas, com uma conexão com o uso de tecnologia mais aplicável ao mundo em que a gente vive. A melhor avaliação é a que consegue atender mais à necessidade de uma escola ou um sistema educacional”, finaliza Ernesto Faria.

Colégio Farias Brito, CE (Foto: divulgação)

——

Revista Educação: referência há 30 anos em reportagens jornalísticas e artigos exclusivos para profissionais da educação básica

——

Escute nosso podcast


Leia Gestão

Hora de reavaliar a avaliação escolar

+ Mais Informações

Tempo da escola: cultura digital e tecnologias da educação

+ Mais Informações

Cultura do cuidado: caminhos da educação na era da hiperconectividade

+ Mais Informações

Os desafios da gestão escolar e a importância do diálogo com as...

+ Mais Informações

Mapa do Site