p-ISSN: 1306-696x | e-ISSN: 1307-7945

Quick Search

Scopus CiteScore SCImago Journal & Country Rank
Performance of ChatGPT-4o in Thoracic Trauma: A Comparative Evaluation with Guidelines [Ulus Travma Acil Cerrahi Derg]
Ulus Travma Acil Cerrahi Derg. Ahead of Print: UTD-47087

Performance of ChatGPT-4o in Thoracic Trauma: A Comparative Evaluation with Guidelines

İsmail Dal1, Mehmet Yıldırım2
1Kastamonu University
2Dr. Siyami Ersek Thoracic and Cardiovascular Surgery Training and Research Hospital

Aim: This study aims to evaluate the performance of Chat GPT-4o in thoracic trauma management by comparing its responses to established clinical guidelines.
Methods: Five major thoracic surgery guidelines were reviewed, including the Advanced Trauma Life Support (ATLS) Guidelines 2018, Eastern Association for the Surgery of Trauma (EAST) Guidelines 2020, Evaluation and management of traumatic pneumothorax: A Western Trauma Association critical decisions algorithm 2022, European Trauma Course (ETC) Guidelines 2016, and NICE Guidelines for Trauma 2020. Fifty open-ended questions were developed based on these guidelines and submitted to Chat GPT-4o. Five thoracic surgery specialists evaluated the AI's responses using a 5-point Likert scale.
Results: Chat GPT-4o achieved an average score of 4.76 ± 0.57 on the 50-question evaluation.
Discussion: Chat GPT-4o excelled in questions derived from well-defined guidelines, demonstrating its ability to synthesize and apply guideline-based medical knowledge. Its performance aligns with previous studies in urological trauma and emergency medicine, which reported similar reliability. However, its reliance on pre-existing data limits its effectiveness in addressing highly nuanced or novel clinical scenarios. These findings underscore its potential as a complementary tool in guideline-driven medical contexts while emphasizing the need for clinical oversight in complex cases.
Conclusion: Chat GPT-4o performed strongly in thoracic trauma management questions, demonstrating minimal errors and high reliability. These results suggest it could serve as a valuable support tool for clinical decision-making, particularly in scenarios guided by established protocols. Further exploration into broader medical domains is warranted.

Keywords: Thoracic Trauma, Clinical Decision Support Systems, Artificial Intelligence in Medicine, Guideline Adherence, Natural Language Processing.

Torasik Travmada ChatGPT-4o Performansı: Kılavuzlara Dayalı Karşılaştırmalı Değerlendirme

İsmail Dal1, Mehmet Yıldırım2
1Kastamonu Üniversitesi
2Dr. Siyami Ersek Göğüs Kalp ve Damar Cerrahisi Eğitim ve Araştırma Hastanesi

Amaç: Bu çalışma, Chat GPT-4o'nun thorakal travma yönetimindeki performansını, yanıtlarını belirli klinik kılavuzlarla karşılaştırarak değerlendirmeyi amaçlamaktadır.
Yöntemler: Beş ana thorakal cerrahi kılavuz incelendi; bunlar arasında 2018 yılına ait Advanced Trauma Life Support (ATLS) Kılavuzları, 2020 yılına ait Eastern Association for the Surgery of Trauma (EAST) Kılavuzları, 2022 yılına ait Evaluation and Management of Traumatic Pneumothorax: A Western Trauma Association Critical Decisions Algorithm, 2016 yılına ait European Trauma Course (ETC) Kılavuzları ve 2020 yılına ait NICE Trauma Kılavuzları yer almaktadır. Bu kılavuzlara dayalı olarak 50 açık uçlu soru geliştirilmiş ve Chat GPT-4o'ya sunulmuştur. Beş thorakal cerrahi uzmanı, yapay zekânın yanıtlarını 5 dereceli Likert ölçeği ile değerlendirmiştir.
Bulgular: Chat GPT-4o, 50 soruluk değerlendirmede ortalama 4,76 ± 0,57 puan almıştır.
Tartışma: Chat GPT-4o, iyi tanımlanmış kılavuzlardan türetilen sorularda başarılı olmuş ve kılavuzlara dayalı tıbbi bilgiyi sentezleme ve uygulama yeteneğini göstermiştir. Performansı, ürolojik travma ve acil tıp alanındaki önceki çalışmalarla uyumludur ve benzer güvenilirlik bildirilmiştir. Ancak, mevcut verilere dayalı çalışması, oldukça ayrıntılı veya yeni klinik senaryoları ele almadaki etkinliğini sınırlamaktadır. Bu bulgular, kılavuz odaklı tıbbi bağlamlarda, özellikle karmaşık vakalarda klinik denetim gerekliliğine vurgu yaparak, onun tamamlayıcı bir araç olarak potansiyelini vurgulamaktadır.
Sonuç: Chat GPT-4o, thorakal travma yönetimi sorularında güçlü bir performans sergilemiş, hataları minimumda tutmuş ve yüksek güvenilirlik göstermiştir. Bu sonuçlar, özellikle belirlenmiş protokollerle yönlendirilen senaryolarda, klinik karar verme sürecinde değerli bir destek aracı olabileceğini göstermektedir. Daha geniş tıbbi alanlarda daha fazla araştırma yapılması gereklidir.

Anahtar Kelimeler: Torakal Travma, Klinik Karar Destek Sistemleri, Tıpta Yapay Zeka, Kılavuzlara Uyum, Doğal Dil İşleme.

Corresponding Author: İsmail Dal, Türkiye
Manuscript Language: English
×
APA
NLM
AMA
MLA
Chicago
Copied!
CITE