ANALISIS KOMPARATIF VISION TRANSFORMER (VIT) DAN RESNET34 UNTUK KLASIFIKASI DIFERENSIAL SUBTIPE KANKER PARU-PARU BERBASIS CITRA CT SCAN
DOI:
https://doi.org/10.22437/jop.v11i2.51327Keywords:
CT scan, Kanker Paru, Vision Transformer, ResNet34, Deep LearningAbstract
Klasifikasi akurat sub-tipe kanker paru-paru merupakan langkah krusial dalam penentuan terapi dan diagnosis dini. Namun, metode diagnostik konvensional berbasis pemeriksaan manual masih menghadapi tantangan seperti variabilitas antar-pengamat dan keterbatasan waktu. Penelitian ini membandingkan performa dua arsitektur deep learning, Vision Transformer (ViT) dan ResNet34, untuk klasifikasi empat sub-tipe kanker paru berdasarkan citra CT scan menggunakan platform Roboflow. Dataset terdiri atas 288 citra CT yang dibagi menjadi empat kelas: adenokarsinoma, karsinoma sel besar, karsinoma sel skuamosa, dan sel normal. Seluruh citra mengalami pra-pemrosesan standar dan augmentasi berbasis arsitektur. Hasil evaluasi menunjukkan bahwa ResNet34 mencapai performa paling optimal dengan akurasi 95,7% dan F1-score 96,3%, serta stabilitas konvergensi yang lebih baik. ViT tetap menunjukkan kompetitif dengan akurasi 94,3% dan F1-score 93,6%, meskipun lebih sensitif terhadap keterbatasan jumlah data. Analisis kualitatif mengungkapkan bahwa kesalahan klasifikasi terutama terjadi pada kasus ambigu dengan kemiripan morfologis, khususnya antara adenokarsinoma dan karsinoma sel skuamosa. Dalam kondisi tersebut, ViT lebih sering salah mengklasifikasikan, sementara ResNet34 meskipun tepat dalam prediksi, menghasilkan tingkat keyakinan rendah (0,56), yang mengindikasikan keraguan model terhadap sampel sulit. Penelitian ini juga menunjukkan bahwa arsitektur CNN konvensional seperti ResNet34 lebih unggul dibandingkan arsitektur transformer dalam keterbatasan data. Model yang dikembangkan memiliki potensi untuk diintegrasikan dalam sistem pendukung keputusan klinis berbasis AI guna mempercepat proses analisis diagnostik
Downloads
References
Ciresan, D. C., Giusti, A., Gambardella, L. M., & Schmidhuber, J. (2013). Mitosis detection in breast cancer histology images with deep neural networks. Medical Image Computing and Computer-Assisted Intervention – MICCAI 2013, 411–418.
Chomean, S., Khemtonglang, N., Mukda, E., & Kaset, C. (2025). AI-powered body fluid cell classification: Development and validation using Roboflow and YOLOv11n framework. Telematics and Informatics Reports, 19, 100243.
Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, S., Unterthiner, T., ... & Houlsby, G. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR).
He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep Residual Learning for Image Recognition. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 770–778.
Le, T. T., Nguyen-Truong, V.-T., Duong, Q. V. N., Phan, N. T. L., Dao, P. N. T., Mavuso, M. F., ... & Quang, K. T. (2025). Deep learning-based classification of colorectal cancer in histopathology images for category detection. Biology Methods and Protocols, 10(1).
Lin, C. K., Chang, J., Huang, C. C., Wen, Y. F., Ho, C. C., & Cheng, Y. C. (2021). Effectiveness of convolutional neural networks in the interpretation of pulmonary cytologic images in endobronchial ultrasound procedures. Cancer Medicine, 10(24), 9047–9057. https://doi.org/10.1002/cam4.4383
Redmon, J., Divvala, S., Girshick, R., & Farhadi, A. (2016). You Only Look Once: Unified, Real-Time Object Detection. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 779–788.
Roboflow. (2024). Roboflow Platform Documentation: Classification Models and Training Overview.
Sokolova, M., & Lapalme, P. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 420–435.
Sumber Data Kaggle. (n.d.). Lung Cancer Histopathology Images Dataset. Repositori data Kaggle. https://www.kaggle.com/datasets/borhanitrash/lung-cancer-ct-scan-dataset
Wehbe, A., Dellepiane, S., & Minetti, I. (2024). Enhanced Lung Cancer Detection and TNM Staging Using YOLOv8 and TNMClassifier: An Integrated Deep Learning Approach for CT Imaging. IEEE Access, Volume 6(2024).
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Rahma Cindy Syuherman, Nasywa Aldira, Farah Dilla, Rahayu A.G., Syifa Qalbi, Vemilia Zahira, Sri Oktamuliani

This work is licensed under a Creative Commons Attribution 4.0 International License.





