Resumo — RADIOMICS apresenta-se como uma área de pesquisa emergente objetivando extrair dados de alta dimensionalidade de imagens clínicas. As etapas do RADIOMICS apresentam entradas e saídas bem definidas, as quais cuidadosamente avaliadas fornecem resposta ao tratamento da doença e prognóstico confiáveis. Este artigo apresenta um resumo geral das etapas e visão do RADIOMICS focando em exemplos de utilização e desafios para o futuro.
Palavras-chave — Radiomics, oncologia, diagnóstico por imagem, extração de características, mineração de dados
I. INTRODUÇÃO
Com o aumento de ferramentas computacionais de reconhecimento de padrões e o aumento no tamanho dos bancos de dados, a área de análise de imagens médicas cresceu exponencialmente nesta última década, facilitando o desenvolvimento de processos de extração de recursos quantitativos que resulta na conversão de imagens em dados mineráveis, e, consequentemente tornando-os importantes no apoio à decisão. A esta prática chamamos de RADIOMICS. Estes dados são combinados com outros dados do paciente para o desenvolvimento de modelos altamente capazes de melhorar o diagnóstico, prognóstico e precisão preditiva. Embora amplamente estudado, RADIOMICS é fundamentalmente utilizado em oncologia, pois, conta com o forte apoio do National Cancer Institute (NCI) e Quantitative Imaging Network (QIN) [1]. Conforme Fig. 1, recursos de imagem como, forma, tamanho, volume, textura fornecem informações sobre o fenótipo do tumor, diferentemente de relatórios clínicos ou resultados de exames laboratoriais, mas, quando trabalhados em conjunto fornecem ao RADIOMICS uma possibilidade ilimitada de biomarcadores de imagem que podem potencialmente ajudar na detecção do câncer, diagnóstico, avaliação do prognóstico, previsão de resposta ao tratamento e monitoramento do estado da doença.
II. ETAPAS DO RADIOMICS
A. Aquisição de imagens
Apesar do grande avanço nos exames de ressonância magnética, tomografia computadorizada e tomografia computadorizada por emissão de pósitrons, ainda não há nos centros médicos uma padronização dos protocolos para aquisição e reconstrução de imagens. Contudo, não significa um problema na caracterização de achados radiológicos, é importante o reconhecimento no campo emergente da imagem quantitativa, onde a intenção é gerar imagens médicas com limites descritíveis de viés e variância. Quanto a isto, houve vários esforços para avançar na geração de imagens quantitativas, incluindo a definição de padrões de aquisição e reconstrução nos últimos 15 anos [2].
B. Identificação de volumes de interesse
A identificação de volumes teciduais de valor prognóstico é o núcleo da prática radiológica em oncologia. Diante disso, no instante do diagnóstico do tumor é importante a identificação de tumores suspeitos de volumes de interesse. Ou seja, é significativo análises detalhadas de subvolumes dentro de tumores que podem ter valores prognósticos e normalmente não são identificados devido a limitações espaciais e de contraste. Em RADIOMICS, os chamados subvolumes de interesse podem ser capturados e adicionados as análises. Na prática, captura-se o máximo de dados possíveis no front-end e usa-se a mineração de dados para identificar as características com maior valor prognóstico [3].
C. Segmentação dos volumes de interesse
Em RADIOMICS, a segmentação é reconhecida como um processo crítico, pois várias etapas, dados e características são gerados subsequentes a partir dos volumes segmentados. Segundo [4], a etapa de segmentação é desafiadora, mesmo podendo alcançar uma automação total de órgãos esqueléticos, os tumores possuem bordas indistintas e heterogeneidade morfológicas, o que ainda provoca interessantes debates sobre a segmentação automática ou manual. No entanto, está surgindo um consenso de que a verdade é elusiva e que a segmentação reproduzível ideal é alcançável com a detecção assistida por computador seguida de curadoria manual.
D. Extração de caracteristicas descritivas dos volumes
O coração do RADIOMICS está na extração de dados de alta dimensão para descrever os atributos de volumes de interesse. Recursos semânticos (descrição de lesões) e agnósticos (descritores quantitativos) são as principais caraterísticas extraídas. Os autores de [5] afirmam que houve um grande esforço na definição e extração de mais recursos potencialmente agnósticos, gerando assim, milhares de elementos de dados podendo descrever melhor cada região de volume de interesse.
E. Criação do Banco de dados
Tanto em RADIOMICS quanto em outras situações de processamento e classificação de preditores é de grande importância uma base de dados considerável. Talvez para classificadores binários um pequeno número de amostras sejam suficientes. Porém, quando descrevemos modelos melhores que acomodam variáveis clínicas ou genômicas, aumenta-se a necessidade de grandes conjuntos de dados de alta qualidade. Em RADIOMICS conjuntos maiores de dados fornecem maior poder de execução.
F. Mineração dos dados
Uma vez que conjuntos de dados grandes e de alta qualidade estejam disponíveis, eles podem ser usados para mineração de dados, que se refere ao processo de descoberta de padrões em grandes conjuntos de dados. Esse processo pode usar inteligência artificial, aprendizado de máquina (supervisionado ou não supervisionado) ou abordagens estatísticas. Para esta etapa é ideal que as bases de dados possam armazenar informações do paciente além da imagem, como, variáveis com perfis genômicos (expressão, mutação, polimorfismos), histologia, biomarcadores, históricos de pacientes, dentre outros. O QIN trata essa tarefa como uma inciativa importante, cujo compromisso é depositar conjuntos de dados bem organizados no NCI [5].
III. EXEMPLOS DE UTILIZAÇÃO DO RADIOMICS
Nos últimos 10 anos as pesquisas em RADIOMICS através de imagens de ressonância magnética, tomografia computadorizada e tomografia computadorizada por emissão de pósitrons aumentou consideravelmente. A seguir será relatado alguns avanços descritos em [6,7], que mostram o potencial do RADIOMICS no auxílio substancial do atendimento clínico.
A. Diagnóstico favorável
Um estudo com 147 homens diagnosticados através de biopsia de câncer de próstata, utilizou análise de textura para diferenciação entre tecido cancerígeno e não cancerígeno, utilizando imagens de ressonância magnética com constaste em T2. Cinco características foram avaliadas, entropia, inércia, energia, correlação e homogeneidade, obtendo acerto de 93%.
B. Prognóstico do tumor
Estudos radiogenômicos (estudo da variação genética associado à resposta da radiação) foram os primeiros a mostrar uma relação de características quantitativas da imagem e padrões de expressão gênica em pacientes com câncer. Em um dos estudos, pesquisadores comparam características semânticas definidas pelo radiologista extraídas de imagens de ressonância magnética em pacientes com glioblastoma multiforme, utilizando aprendizado de máquina com uma rede neural, podendo prever padrões globais de expressão gênica.
C. Escolha do tratamento
Recentemente um estudo com 58 mulheres submetidas a tratamento de câncer de mama avançado, sugeriu que a análise da textura nas imagens de ressonância magnética com contraste dinâmico poderia ajudar a prever a resposta à quimioterapia neoadjuvante antes de seu início.
IV. DESAFIOS PARA O RADIOMICS
Anteriormente, neste artigo, já descrevemos alguns desafios técnicos para as etapas individuais no processo do RADIOMICS. A seguir, algumas preocupações mais amplas do processo como um todo.
A. Reprodutibilidade
O estudo de RADIOMICS ainda é considerado uma disciplina jovem. Assim como em outros estudos, por exemplo, a biologia molecular, ele se apresenta como um grande apoio na medicina de precisão. No entanto, é possível que passe por um lento processo de evolução atribuído a várias causas, incluindo a complexidade técnica, overfitting dos dados, falta de padrões para validar resultados, variáveis de confusão não reconhecidas nas bases de dados utilizadas, dentre outras [8]. Uma análise de 2009 dos relatórios de pesquisas biomédicas mostram que 50% dos estudos para avaliar perfil genômico em câncer de próstata e câncer de mama eram muito pobres, insuficientes ou incompletos para serem usados [9]. Cientistas da Amgen (Thousand Oaks, Califórnia) tentaram replicar 53 estudos de referência em câncer, porém, conseguiram reproduzir os resultados originais em apenas 6 estudos [10].
Conforme citado em [11,12] estas questões são suficientemente graves ao ponto de unir mais de 30 periódicos biomédicos de alto impacto para impor padrões comuns para testes estatísticos e melhoria do acesso a dados brutos.
Estabelecer padrões de referência para o desenvolvimento de estudos e sua apresentação na literatura, seria uma possível solução para esses desafios.
B. Grandes volumes de dados
Também conhecidos coloquialmente como Big Data, na medicina, gigabytes de dados são coletados para os pacientes e seus elementos de dados que crescem exponencialmente. Com o crescimento assustador do volume dos grandes bancos de dados, algumas questões ainda estão por se compreender, como por exemplo, o acesso a dados massivos será uma chave para se entender questões fundamentais da ciência básica e aplicada? Ou o aumento nos dados confunde a análise, produz gargalos computacionais e diminui a capacidade de extrair inferências causais válidas? Por estas e outras razões, entendese que em RADIOMICS o campo de Big Data encontra-se em fase inicial [13].
C. Compartilhamento de dados
Um dos maiores desafios para estabelecimento de modelos radiológicos para suporte a decisão é o compartilhamento de dados de imagens. Pode-se desccrever que em RADIOMICS o compratilhamento de dados é especialmente intimidante, pois, os dados devem incluir imagens e principalmente estar de acordo com Health Insurance Portability and Accountability Act, lembrando que uma quantidade substancial de informações de saúde é necessária para construir modelos de complexidade suficiente. O compartilhamento de dados é um desafio comum em todas as pesquisas biomédicas e deve superar questões culturais, administrativas, regulatórias e pessoais [14]. Um exemplo notável e a comunidade Children’s Onclogy Group, que estabeleceu uma história e uma cultura de compartilhamento de dados, e hoje, desfrutam de uma posição privilegiada expandindo seus esforços na inclusão de imagens de análises radiométricas [15]. Vale lembrar que, embora padrões existam ou estejam sendo desenvolvidos em muitas outras áreas, ainda existem lacunas.
V. RADIOMICS: A PRÓXIMA FRONTEIRA NA TOMADA DE DECISÃO CLÍNICA
Há papéis centrais e críticos que os radiologistas podem desempenhar na identificação e organização do front-end e na aplicação de modelos de classificadores no usuário para melhorar a precisão do diagnóstico e do prognóstico.
A. Curadoria de dados de alta qualidade por radiologistas
No dia a dia, os exames radiológicos em geral são avaliados qualitativamente, e muitas vezes produzem relatórios que não seguem uniformidade. Na grande maioria as imagens são arquivadas e raramente revisitadas e, embora existam repositórios com grande número de imagens, os mesmos são praticamente inacessíveis para avaliação da acurácia. Como a coleta de dados de imagem de alta qualidade requer conhecimento especializado para identificar, circunscrever e anotar volumes de interesse, uma ideia viável, é capturar os dados prospectivamente no ponto de atendimento. Vislumbramos assim, uma transição da radiologia clássica, para um novo paradigma no qual o radiologista participa ativamente da curadoria de banco de dados de imagens quantitativas [16].
B. Informática em Saúde
É importante que dados de alta qualidade sejam obtidos durante o acompanhamento e monitoramento dos pacientes. Notadamente esta importância é reconhecida pelos grandes centros, os quais estão investindo em sistemas de registros médicos eletrônicos apropriados para tornar os dados acessíveis e mineráveis. Em RADIOMICS, os dados normalmente não seguem este fluxo, no entanto, já há uma consciência pela mudança com a adoção de relatórios estruturados na radiologia [1].
C. Compartilhamento de dados
Como já discutido anteriormente, a qualidade dos modelos classificadores apresentam tamanhos limitados para sua utilização. Vale lembrar que há melhorias contínuas na aquisição de imagens médicas, sendo assim, diferenças entre aquisição e reconstrução de imagens são covariáveis que devem ser incorporados na mineração de dados quantitativos de imagens. Os desafios enfrentados e resolvidos pela ciência da expressão gênica, sequenciamento e banco de dados de estrutura de proteínas, começaram agora a ser resolvidos pelo compartilhamento de metadados de oncologia. A RADIOMICS, tem um imenso potencial para enriquecer ainda mais as interpretações de imagens e expandir os horizontes da imagem para maior precisão e extração de informações biológicas in vivo [17].
D. Sala de leitura de radiologia do futuro
Com o cenário acima mencionado é importante que o radiologista tenha uma sala para interagir com os softwares de arquivamento de imagens, identificação, segmentação e extração de características de regiões de interesse. Digamos que um paciente tenha resultados anteriores, o software poderá automaticamente identificar características da região de interesse, enviar para um banco de dados compartilhado e realizar um comparativo algoritmicamente com as imagens anteriores permitindo diagnósticos mais precisos [17].
VI. CONCLUSÃO
A visão sobre RADIOMICS é otimista e clara. No futuro previsível, espera-se que os dados recolhidos de exames radiológicos em todo o mundo sejam convertidos em dados de características quantitativas e que esses dados sejam interligados com bases de conhecimento para melhorar a precisão do diagnóstico e o poder preditivo para a tomada de decisão. Certamente deverá haver um esforço multidisciplinar envolvendo tecnologistas da informação, estatísticos, bioinformáticos, biólogos e médicos nos desafios de padronização e compartilhamento de dados. No futuro previsível, a pesquisa em RADIOMICS será concentrada na melhoria dos modelos classificadores para fornecer diagnósticos mais precisos, permitindo melhores cuidados e resultados aos pacientes.
REFERÊNCIAS
[1] Gillies R.J., Kinahan P.E., Hricak H. Radiomics: imagens are more than pictures, they are data. Radiology 2016;278:563–577 CrossRefMedline
[2] Clarke L.P., Sriram R.D., Schilling L.B. Imaging as a Biomarker: Standards for Change Measurements in Therapy workshop summary. Acad Radiol 2008;15(4):501-530.
[3] Gatenby R.A., Grove O., Gillies R.J. Quantitative imaging in cancer evolution and ecology. Radiology 2013;269(1):8-15.
[4] Rios Velazquez E., Aerts H.J., Gu Y., et al. A semiautomatic CT-based ensemble segmentation of lung tumors: comprarison with oncologists’ delineations and with the surgical specimen. Radiother Oncol 2012;105(2):167-173.
[5] Kumar V., Gu Y., Basu S. et al. Radiomics: the process and the challenges. Magn Reson Imaging 2012;30(9):1234-1248.
[6] Davnall F., Yip C.S., Ljungqvist G., et al. Assessment of tumor heterogeneity: an emerging imaging tool for clinical practice? Insights Imagin 2012;3(6):573-589.
[7] O’Connor J.P., Rose C.J., Waterton J.C., Carano R.A., Parker C.J.,
Jackson A. Imaging intratumor heterogeneity: role in therapy response,
resistance, and clinical outcome. Clin Cancer Res 2015;21(2):249-257.
[8] Simon R.M., Paik S., Hayes D.F. Use of archived specimens in
evaluation of prognostic and predictive biomarkers. J Natl Cancer Inst
2009;101(21):1446-1452.
[9] Chalmers I., Glasziou P. Avoidable waste in the production and
reporting of research evidence. Lancet 2009;374(9683):86-89.
[10] Begley C.G., Ellis L.M. Drug development: Raise standards for
preclinical cancer research. Nature 2012;483(7391):531-533.
[11] Journals unite for reproducibility. Nature 2014;515(7525):7.
[12] McNutt M. Journals unite for reproducibility. Science
2014;346(6210):679.
[13] Drawing Causal inference from Big Data.Arthur M. Sackler Colloquia
of the National Academy of Sciences. Https://www.youtube.com/playlist=PLGJm1x3XQeK0NgFOX2Z7Wt
-P5RUZv0Hv. Publicado em 2 de abril de 2015. Aceessado em 5 de
agosto de 2019.
[14] Nelson B. Data sharing: empty archives. Nature 2009;461(7261):160-
163.
[15] Devidas M., london W.N., Anderson J.R. The use of central
laboratories and remote eletronic data capture to risk-adjust therapy for
pediatric acute lymphoblastic leukemia and neuroblastoma. Semin
Oncol 2010;37(1):53-59.
[16] Kahn C.E. Jr. Annotation of figures from the biomedical imaging
literature: a comparative analysis of RadLex and other standardized
vocabularies. Acad radiol 2014;2193):384-392.
[17] Clark K., Vendt B., Smith K., et al. The cancer Imaging Archive
(TCIA): maintaining and iperating a public information repository. J
Digit Imaging 2013;26(6):1045-1057.