Nos últimos anos, algoritmos de aprendizado de máquina vêm sendo propostos para resolver diversos desafios da área de saúde. Um dos requisitos mais importantes para um sistema automatizado movido por visão computacional e técnicas de aprendizado de máquina é que exista uma coleção de centenas (senão milhares) de imagens digitalizadas de alta qualidade e bem curadas, denominados FAIR (Findable, Accessible, Interoperable, and Reusable) data.
A plataforma digital proposta CRIC Searchable Image Database (https://database.cric.com.br/) permite a disponibilização de coleções de imagens digitais de células. Com sua implementação foi possível disponibilizar a coleção CRIC Cervix, constituída por imagens reais de citologia cérvico-vaginal convencional, obtidas a partir do esfregaço de Papanicolaou, as quais foram classificadas por especialistas de acordo com o Sistema Bethesda (nomenclatura padronizada).
O CRIC Searchable Image Database é um ambiente interativo para usuários criarem suas próprias coleções, acessarem coleções já existentes, além de permitir que seja feita a detecção e a quantificação manual de estruturas celulares, assim como o armazenamento dessas informações. Informações sobre a base de dados e a plataforma foram publicadas no artigo “Cric searchable image database as a public platform for conventional pap smear cytology data” disponível em https://doi.org/10.1038/s41597-021-00933-8 na revista Nature - Scientific Data.
A plataforma e a base de dados de células cervicais foram concebidas por alunos da graduação (bolsistas PIBIC/CNPq) do Laboratório XR4GOOD e pós-graduação em Ciência da Computação (PPGCC) e do programa de pós-graduação em Biotecnologia (NUPEB), ambos da UFOP, sob a coordenação das pesquisadoras Dra. Andrea G. Campos Bianchi (PROFICAM-UFOP e PPGCC), Dra. Cláudia Martins Carneiro (DEACL/EFAR e NUPEB - UFOP), Dra. Daniela M. Ushizima filiada ao Lawrence Berkeley National Laboratory (LBL) e à Universidade da Califórnia – Berkeley (UC-Berkeley) e pela Dra. Fátima N. Sombra de Medeiros do Departamento de Engenharia de Teleinformática da Universidade Federal do Ceará (DETI-UFC). Este projeto faz parte de um centro em pesquisa de células criado em 2014 denominado “CRIC - Center for Recognition and Inspection of Cells”, que inclui a Universidade Federal de Ouro Preto, Universidade Federal do Ceará, a Universidade da Califórnia – Berkeley e o Lawrence Berkeley National Laboratory.
De acordo com a Profa. Andrea G. C. Bianchi, “os algoritmos de inteligência artificial utilizam os dados das células presentes no esfregaço, extraem as informações das imagens e as usam para construir modelos para a detecção e/ou classificação das lesões uterinas. Logo, ter um banco de dados com grande diversidade e qualidade das imagens e das lesões é extremamente importante para a criação de modelos mais representativos e confiáveis.”
O banco de dados tem sido usado por diversos pesquisadores na expectativa de proporcionar uma “realidade ampliada/aumentada e acelerada” para o profissional da saúde. Usando esse banco de dados, foi publicado recentemente um trabalho pela aluna de doutorado do PPGCC e funcionária da IBM que atua como Cientista de Dados no AI Center da Vale, Débora Nasser Diniz, pelo Prof. Dr. Marcone Jamilson Freitas Souza (PROFICAM-UFOP e PPGCC), e pelas professoras Andrea e Cláudia. O artigo, A Hierarchical Feature-Based Methodology to Perform Cervical Cancer Classification, disponível em https://www.mdpi.com/2076-3417/11/9/4091, propõe uma metodologia de classificação hierárquica para o rastreamento computadorizado de lesões celulares, além de avaliar o desempenho de vários algoritmos usando a coleção CRIC Cervix. Os resultados indicam que a classificação hierárquica teve melhor desempenho ao usar Random Forest como o classificador principal, particularmente quando comparado com árvores de decisão, k-NN e os métodos Ridge.
Os projetos desenvolvidos pelo CRIC vêm assumindo um papel importante na descoberta de novas metodologias de análise automática de células cervicais que podem ser aplicadas ao sistema de rastreio do câncer cervical, aumentando a qualidade dos exames do Papanicolaou e promovendo a qualidade de vida das mulheres.
Para mais informações sobre o projeto, entre no site http://www2.decom.ufop.br/cric/ e para informações sobre o banco de dados, acesse https://database.cric.com.br/