Sipas një studimi të publikuar në JAMA Pediatrics, ChatGPT tregon mangësi shumë serioze në fushën e pediatrisë. Duke testuar versionin GPT-4 të chatbot-it në rastet klinike të fëmijëve të sëmurë, hulumtimi zbuloi se saktësia diagnostike ishte vetëm 17%.
Në praktikë, kur bëhet fjalë për formulimin e diagnozave për pacientët pediatrikë, ChatGPT është i gabuar në 83% të rasteve. Një performancë jashtëzakonisht negative që nxjerr në pah sesi chatbot OpenAI ka ende shumë kufizime në trajtimin e kompleksitetit të mjekësisë për fëmijë.
Për të testuar aftësitë diagnostikuese të ChatGPT në pediatri, studiuesit përdorën 100 raste klinike reale të botuara midis 2013 dhe 2023 në revista të specializuara mjekësore. Këto janë raste të paraqitura si situata apo kuize, në të cilat ofrohet i njëjti informacion në dispozicion të mjekëve që kanë ekzaminuar ata pacientë pediatrikë. Objektivi është të formulohet diagnoza e saktë bazuar në të dhënat klinike të raportuara. Chatbot-i u testua më pas në të njëjtat 100 raste, për të vlerësuar kapacitetin e tij diagnostikues në krahasim me mjekët ekspertë në pediatri.
ChatGPT dështon në testet në 100 raste pediatrike
Studiuesit nxorën tekstin përkatës nga 100 raste klinike të botës reale të botuara midis 2013 dhe 2023 dhe e futën atë si një kërkesë, më pas i kërkuan chatbot-it të jepte një diagnozë. Rezultatet ishin zhgënjyese: ChatGPT dha diagnozën e saktë vetëm në 17 raste nga 100. Në 72 raste e kishte keqdiagnostikuar qartë, ndërsa në 11 të tjerat dha përgjigje jo të plota.
Sipas studiuesve, kjo është për shkak të faktit se, ndryshe nga të rriturit, mosha është një faktor kyç në pacientët pediatrikë që ChatGPT nuk arrin ta marrë në konsideratë në mënyrë adekuate. Rrjedhimisht, ata arrijnë në përfundimin se chatbot nuk është aspak i përshtatshëm për trajtimin e rasteve klinike pediatrike, duke pasur parasysh shkallën shumë të lartë të gabimeve diagnostikuese.
ChatGPT është i pamjaftueshëm në pediatri, por ka vend për përmirësim
Prandaj, studimi thekson se ChatGPT nuk mund të zëvendësojë mjekët pediatër në afat të shkurtër, duke pasur parasysh shkallën shumë të lartë të gabimeve diagnostike të gjetura. Megjithatë, autorët theksojnë se analizimi i dobësive mund të ndihmojë në përmirësimin e chatbot-it në të ardhmen. Në veçanti, ChatGPT përpiqet të krijojë marrëdhënie të njohura midis kushteve, gjë që një mjek me përvojë e bën instinktivisht.
Për ta bërë ChatGPT më të besueshëm, studiuesit sugjerojnë trajnimin e tij ekskluzivisht mbi literaturën autoritative mjekësore pediatrike, në vend të informacionit gjenerik nga interneti që mund të jetë i pasaktë. Kjo mund të rrisë saktësinë e diagnostikimit në një sektor kompleks siç është pediatria.
Discussion about this post