ANALISIS KOMPARATIF VISION TRANSFORMER (VIT) DAN RESNET34 UNTUK KLASIFIKASI DIFERENSIAL SUBTIPE KANKER PARU-PARU BERBASIS CITRA CT SCAN

Authors

  • Rahma Cindy Syuherman Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas
  • Nasywa Aldira Departemen Fisika
  • Farah Dilla Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas
  • Rahayu A.G. Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas
  • Syifa Qalbi Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas
  • Vemilia Zahira Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas
  • Sri Oktamuliani Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas

DOI:

https://doi.org/10.22437/jop.v11i2.51327

Keywords:

CT scan, Kanker Paru, Vision Transformer, ResNet34, Deep Learning

Abstract

Klasifikasi akurat sub-tipe kanker paru-paru merupakan langkah krusial dalam penentuan terapi dan diagnosis dini. Namun, metode diagnostik konvensional berbasis pemeriksaan manual masih menghadapi tantangan seperti variabilitas antar-pengamat dan keterbatasan waktu. Penelitian ini membandingkan performa dua arsitektur deep learning, Vision Transformer (ViT) dan ResNet34, untuk klasifikasi empat sub-tipe kanker paru berdasarkan citra CT scan menggunakan platform Roboflow. Dataset terdiri atas 288 citra CT yang dibagi menjadi empat kelas: adenokarsinoma, karsinoma sel besar, karsinoma sel skuamosa, dan sel normal. Seluruh citra mengalami pra-pemrosesan standar dan augmentasi berbasis arsitektur. Hasil evaluasi menunjukkan bahwa ResNet34 mencapai performa paling optimal dengan akurasi 95,7% dan F1-score 96,3%, serta stabilitas konvergensi yang lebih baik. ViT tetap menunjukkan kompetitif dengan akurasi 94,3% dan F1-score 93,6%, meskipun lebih sensitif terhadap keterbatasan jumlah data. Analisis kualitatif mengungkapkan bahwa kesalahan klasifikasi terutama terjadi pada kasus ambigu dengan kemiripan morfologis, khususnya antara adenokarsinoma dan karsinoma sel skuamosa. Dalam kondisi tersebut, ViT lebih sering salah mengklasifikasikan, sementara ResNet34 meskipun tepat dalam prediksi, menghasilkan tingkat keyakinan rendah (0,56), yang mengindikasikan keraguan model terhadap sampel sulit. Penelitian ini juga menunjukkan bahwa arsitektur CNN konvensional seperti ResNet34 lebih unggul dibandingkan arsitektur transformer dalam keterbatasan data. Model yang dikembangkan memiliki potensi untuk diintegrasikan dalam sistem pendukung keputusan klinis berbasis AI guna mempercepat proses analisis diagnostik

Downloads

Download data is not yet available.

Author Biographies

Rahma Cindy Syuherman, Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas

Rahma Cindy Syuherman merupakan mahasiswa Program Sarjana (S1) Fisika dengan peminatan Fisika Medik di Universitas Andalas. Minat penelitiannya meliputi fisika pencitraan medis, dosimetri radiasi, dan aplikasi fisika dalam bidang kesehatan. Saat ini, ia terlibat dalam penelitian terkait fisika pencitraan medis

Nasywa Aldira, Departemen Fisika

Nasywa Aldira merupakan mahasiswa Program Sarjana (S1) Fisika dengan peminatan Fisika Medik di Universitas Andalas. Minat penelitiannya meliputi fisika pencitraan medis, dosimetri radiasi, dan aplikasi fisika dalam bidang kesehatan. Saat ini, ia terlibat dalam penelitian terkait fisika pencitraan medis

Farah Dilla, Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas

Farah Dilla merupakan mahasiswa Program Sarjana (S1) Fisika dengan peminatan Fisika Medik di Universitas Andalas. Minat penelitiannya meliputi fisika pencitraan medis, dosimetri radiasi, dan aplikasi fisika dalam bidang kesehatan. Saat ini, ia terlibat dalam penelitian terkait fisika pencitraan medis

Rahayu A.G., Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas

Rahayu merupakan mahasiswa Program Sarjana (S1) Fisika dengan peminatan Fisika Medik di Universitas Andalas. Minat penelitiannya meliputi fisika pencitraan medis, dosimetri radiasi, dan aplikasi fisika dalam bidang kesehatan. Saat ini, ia terlibat dalam penelitian terkait fisika pencitraan medis

Syifa Qalbi, Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas

Syifa Qalbi merupakan mahasiswa Program Sarjana (S1) Fisika dengan peminatan Fisika Medik di Universitas Andalas. Minat penelitiannya meliputi fisika pencitraan medis, dosimetri radiasi, dan aplikasi fisika dalam bidang kesehatan. Saat ini, ia terlibat dalam penelitian terkait fisika pencitraan medis

Vemilia Zahira, Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas

Vemilia Zahira merupakan mahasiswa Program Sarjana (S1) Fisika dengan peminatan Fisika Medik di Universitas Andalas. Minat penelitiannya meliputi fisika pencitraan medis, dosimetri radiasi, dan aplikasi fisika dalam bidang kesehatan. Saat ini, ia terlibat dalam penelitian terkait fisika pencitraan medis

Sri Oktamuliani, Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas

Seorang dosen di Departemen Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas. 

References

Ciresan, D. C., Giusti, A., Gambardella, L. M., & Schmidhuber, J. (2013). Mitosis detection in breast cancer histology images with deep neural networks. Medical Image Computing and Computer-Assisted Intervention – MICCAI 2013, 411–418.

Chomean, S., Khemtonglang, N., Mukda, E., & Kaset, C. (2025). AI-powered body fluid cell classification: Development and validation using Roboflow and YOLOv11n framework. Telematics and Informatics Reports, 19, 100243.

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, S., Unterthiner, T., ... & Houlsby, G. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR).

He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep Residual Learning for Image Recognition. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 770–778.

Le, T. T., Nguyen-Truong, V.-T., Duong, Q. V. N., Phan, N. T. L., Dao, P. N. T., Mavuso, M. F., ... & Quang, K. T. (2025). Deep learning-based classification of colorectal cancer in histopathology images for category detection. Biology Methods and Protocols, 10(1).

Lin, C. K., Chang, J., Huang, C. C., Wen, Y. F., Ho, C. C., & Cheng, Y. C. (2021). Effectiveness of convolutional neural networks in the interpretation of pulmonary cytologic images in endobronchial ultrasound procedures. Cancer Medicine, 10(24), 9047–9057. https://doi.org/10.1002/cam4.4383

Redmon, J., Divvala, S., Girshick, R., & Farhadi, A. (2016). You Only Look Once: Unified, Real-Time Object Detection. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 779–788.

Roboflow. (2024). Roboflow Platform Documentation: Classification Models and Training Overview.

Sokolova, M., & Lapalme, P. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 420–435.

Sumber Data Kaggle. (n.d.). Lung Cancer Histopathology Images Dataset. Repositori data Kaggle. https://www.kaggle.com/datasets/borhanitrash/lung-cancer-ct-scan-dataset

Wehbe, A., Dellepiane, S., & Minetti, I. (2024). Enhanced Lung Cancer Detection and TNM Staging Using YOLOv8 and TNMClassifier: An Integrated Deep Learning Approach for CT Imaging. IEEE Access, Volume 6(2024).

Downloads

Published

2026-04-20

How to Cite

Syuherman, R. C., Aldira, N., Dilla, F., A.G., R., Qalbi, S., Zahira, V., & Oktamuliani, S. (2026). ANALISIS KOMPARATIF VISION TRANSFORMER (VIT) DAN RESNET34 UNTUK KLASIFIKASI DIFERENSIAL SUBTIPE KANKER PARU-PARU BERBASIS CITRA CT SCAN. JOURNAL ONLINE OF PHYSICS, 11(2), 132–140. https://doi.org/10.22437/jop.v11i2.51327