Blog

Na imagem, consta a imagem digitalizada de um livro de matrícula da Hospedaria de Imigrantes do Brás

Migrações em debate - 04/27/2026

Os limites da IA na pesquisa genealógica

Nicole Alexsandra - Analista de Pesquisa

De forma inegável, a pesquisa genealógica atravessa um momento de transformação, impulsionada pelo desenvolvimento acelerado das tecnologias de Inteligência Artificial. Conforme apontam especialistas em plataformas globais de história da família, a vasta quantidade de informações hoje disponíveis na ponta dos dedos ganhou um novo contorno com sistemas computacionais capazes de imitar o raciocínio humano para executar tarefas complexas [1][2].

Na prática, a IA tem sido aplicada com sucesso para transcrever manuscritos antigos, descobrir conexões em jornais históricos digitalizados, identificar características faciais em fotografias de época e sugerir registros documentais para a construção e expansão de árvores genealógicas [2][3]. Trata-se de um avanço indubitável, que democratiza o acesso ao passado e facilita imensamente os primeiros passos de muitos pesquisadores independentes e interessados em genealogia como um todo.

O Centro de Preservação, Pesquisa e Referência (CPPR) do Museu da Imigração do Estado de São Paulo [4] reconhece e acompanha esse progresso metodológico, pois entendemos que a inovação tecnológica possui a capacidade de atuar como uma força motriz para a preservação da memória [5]. Contudo, o uso entusiástico e por muitas vezes acrítico dessas ferramentas tem gerado reflexos diretos e desafiadores, exigindo uma reflexão aprofundada sobre a natureza da informação gerada por algoritmos. Nesse contexto, como nos lembra o historiador Victor Sobreira, é pertinente considerar que:

“(...) ferramentas como essa geram textos baseados em estatística, sem fazer nenhuma conexão ou distinção entre o que está escrito na internet, o que foi escrito por historiadores ou romancistas e o que se encontra em fontes históricas. O resultado é um texto gramaticalmente coerente, mas sem as bases construídas ao longo de uma pesquisa histórica, o que significa que não é possível verificar e retraçar a origem das informações apresentadas” [6]

Nos últimos meses, tanto presencialmente quanto por e-mail, a equipe do CPPR tem recebido um grande volume de solicitações de pesquisas com informações retiradas de consultas prévias realizadas com assistência de Inteligência Artificial Generativa [7]. Nessas situações, visitantes e pesquisadores apresentam dados aparentemente precisos e definitivos sobre seus antepassados, incluindo nomes específicos de navios, datas exatas de desembarque no Porto de Santos e números detalhados de registro de matrícula na antiga Hospedaria de Imigrantes do Brás. O obstáculo metodológico surge quando, ao se realizar uma pesquisa assertiva no acervo digital do museu, é constatado que tais dados não correspondem à realidade documental. Os registros indicados pelas ferramentas de IA, em grande parte dos casos, simplesmente não existem.

Para compreender a origem dessa discrepância, é essencial analisar como a Inteligência Artificial Generativa opera, à luz das recentes diretrizes acadêmicas sobre o seu uso ético e responsável [8][9]. Os modelos de IA não realizam buscas precisas e em tempo real em todos os arquivos físicos não indexados do mundo, tampouco possuem a capacidade de validação histórica e contextual inerente ao pesquisador humano. Eles funcionam a partir de modelos probabilísticos e estatísticos de linguagem [8]. Quando um pesquisador insere um comando ou pergunta (conhecido popularmente como "prompt") buscando informações específicas sobre um imigrante, o algoritmo vasculha sua vasta base de treinamento para prever a sequência de palavras que melhor responderá àquela solicitação, visando oferecer um texto fluido e conclusivo.

A literatura científica que analisa a criatividade algorítmica aponta que os processos de geração da máquina diferem fundamentalmente da pesquisa humana; a IA busca gerar um produto textualmente aceitável e coerente estruturalmente [10][11]. Se a informação factual exata não estiver disponível em sua base de dados, a natureza preditiva da máquina entra em ação para preencher essas lacunas, "inventando" dados para não deixar o usuário sem uma resposta satisfatória. De acordo com Hessel e Lemes:

“A IA Generativa cria conteúdos por meio de modelos treinados em grande quantidade de conjuntos de dados. Esses modelos aprendem padrões, estilos, estruturas e relações dentro dos dados durante a fase de aprendizagem ou treinamento. Após treinados, eles podem gerar novos conteúdos que são similares em estrutura e estilo aos dados originais.” [12]

Esse fenômeno técnico de invenção baseada em padrões é conhecido como "alucinação" [8]. No contexto da genealogia, a alucinação da IA manifesta-se de forma particularmente insidiosa, pois as respostas geradas são construídas com uma linguagem técnica e altamente verossímil. O sistema é capaz de combinar o sobrenome real de uma família com o nome de um navio que de fato operava naquela exata década, inserindo uma data de chegada plausível e criando um número de matrícula sequencial fictício que imita o padrão dos arquivos, sejam eles registros de matrícula ou listas de bordo.

O resultado final é um relato virtual muito convincente, mas totalmente desprovido de fundamento factual. Essa simulação da verdade histórica exige um cuidado metodológico redobrado e uma postura de constante hesitação investigativa. A verossimilhança, por mais perfeita que seja, não deve ser confundida com a veracidade. Como alertam os manuais de pesquisa, a facilidade de acesso à informação sintetizada por robôs não exime o pesquisador da responsabilidade primordial de corroborar suas evidências em fontes primárias [8][9].

A partir disso, conclui-se que a Inteligência Artificial deve ser encarada estritamente como uma ferramenta de apoio analítico, organizadora de fluxos de trabalho e formuladora de hipóteses, nunca como uma prova documental definitiva. Os resultados oferecidos por esses assistentes virtuais são excelentes pontos de partida direcional. Eles podem, por exemplo, ajudar a identificar variações fonéticas e ortográficas de um sobrenome ao longo dos séculos ou mesmo auxiliar na leitura paleográfica e tradução de certidões e documentos estrangeiros. No entanto, qualquer dado específico referente à chegada, ao navio e ao registro formal do imigrante sugerido pela IA deve ser tratado como uma mera suposição até que seja devidamente localizado e validado pelo registro documental.

A pesquisa histórica, assim como o desenvolvimento da historiografia, como reitera o historiador José Honório Rodrigues, é fundamentada essencialmente na “dependência da utilização e controle das fontes, do aperfeiçoamento da pesquisa e dos métodos, da capacidade interpretativa, da compreensão” [13]. Assim, a árvore genealógica de uma família só se sustenta de forma íntegra e responsável quando as suas raízes estão firmadas em documentos reais, e não em probabilidades estatísticas.

Fica claro, portanto, que o papel da Inteligência Artificial na genealogia contemporânea apenas ganha sentido pleno quando encontra o suporte do registro físico. Ou seja, se a tecnologia nos oferece a hipótese, o documento preservado nos oferece a evidência, criando um diálogo necessário entre a inovação e o vestígio histórico. Assim, nas pesquisas acerca de ancestralidades e genealogia familiar, o discernimento humano permanece como o elo essencial, sendo necessário compreender as sugestões do algoritmo como pistas a serem validadas, e não como respostas definitivas, pois é o que garante o rigor da investigação histórica.

Referências Bibliográficas

[1] TANNER, Abby. Avanços da IA na Genealogia. Blog do FamilySearch. Disponível em: <https://www.familysearch.org/en/blog/ai-developments-genealogy>. Acesso em: 19 mar. 2026.

[2] MacENTEE, Thomas. IA e Genealogia: Aproveitando o Poder da Inteligência Artificial para Pesquisa de História da Família. MyHeritage Knowlegde Base. Disponível em: <https://education.myheritage.com/article/ai-genealogy-harnessing-the-power-of-artificial-intelligence-for-family-history-research/>. Acesso em: 22 abr. 2026.

[3] TANNER, Abby. Desenvolvimentos da IA em genealogia. Blog do FamilySearch, 26 dez. 2024. Disponível em: <https://www.familysearch.org/pt/blog/desenvolvimentos-ia-genealogia-pt>. Acesso em 25 abr. 2026.

[4] O Centro de Preservação, Pesquisa e Referência do Museu da Imigração funciona de terça a sábado (exceto feriados), das 10h às 16h. Também é possível solicitar auxílio à pesquisa através do e-mail: <pesquisa@museudaimigracao.org.br>. Mais informações podem ser encontradas no site do Museu da Imigração: <https://museudaimigracao.org.br/acervo-e-pesquisa/pesquisa/atendimento>.

[5] TAVARES, Maria de Fátima Duarte. Preservação digital: entre a memória e a história. Ciência da Informação, v. 41, n. 1, 2012. Disponível em: <https://brapci.inf.br/v/20001>. Acesso em: 15 abr. 2026.

[6] SOBREIRA, Victor. Um panorama da História da Inteligência Artificial e suas aplicações na pesquisa histórica. Varia Historia, Belo Horizonte, v. 41, e25035, 2025. Disponível em: http://dx.doi.org/10.1590/0104-87752025v41e25035. Acesso em: 25 abr. 2026. p. 18-19.

[7] No Instagram do Museu da Imigração, também pode ser assistido um reels do Coordenador de Formação e Educativo do MI, Henrique Trindade, discutindo acerca das possibilidades de utilização de IA nas pesquisas genealógicas. O vídeo pode ser consultado em: <https://www.instagram.com/reels/DUG6m5Uke-j/>.

[8] SAMPAIO, Rafael Cardoso; SABBATINI, Marcelo; LIMONGI, Ricardo. Diretrizes para o uso ético e responsável da Inteligência Artificial Generativa: um guia prático para pesquisadores. INTERCOM, ABCP, ANPOCS, 2024. Disponível em: <https://prpg.unicamp.br/wp-content/uploads/sites/10/2025/01/livro-diretrizes-ia-1.pdf>. Acesso em 24 abr. 2026.

[9] VERAS, Alan Rommel Rodrigues; OLIVEIRA, Mário André Wanderley. Inteligência Artificial Generativa e formação em pesquisa: reflexões sobre orientação do uso e avaliação da aprendizagem. XVII Encontro Regional Nordeste da ABEM, 2024. Disponível em: <https://abem.mus.br/anais_ernd/v6/papers/2364/public/2364-8732-1-PB.pdf>. Acesso em: 14 abr. 2026.

[10] HESSEL, Ana Maria Di Grado; LEMES, David de Oliveira. Criatividade da Inteligência Artificial Generativa. TECCOGS - Revista Digital de Tecnologias Cognitivas, n. 28, p. 119-130, 2023. Disponível em: <https://revistas.pucsp.br/index.php/teccogs/article/view/67075>. Acesso em 15 abr. 2026.

[11] SANTAELLA, Lucia. A criatividade nos prismas da Inteligência Artificial Generativa. Tríade: Comunicação, Cultura e Mídia, v. 12, 2024. Disponível em: <https://periodicos.uniso.br/triade/article/view/5588>. Acesso em: 18 abr. 2026.

[12] HESSEL, Ana Maria Di Grado; LEMES, David de Oliveira. Criatividade da Inteligência Artificial Generativa. TECCOGS - Revista Digital de Tecnologias Cognitivas, n. 28, p. 119-130, 2023. Disponível em: <https://revistas.pucsp.br/index.php/teccogs/article/view/67075>. Acesso em 15 abr. 2026. p. 128.

[13] RODRIGUES, José Honório. A pesquisa histórica no Brasil. Brasiliana. 1978. p. 121.

Blog

Os limites da IA na pesquisa genealógica

Lea Mas

Reflexões sobre memória e identidade em contextos migratórios

Arte, Migração e Identidade: entre deslocamentos e pertencimentos

Reflexões sobre a proteção jurídica de migrantes e o enfrentamento à xenofobia