Boston’daki Beth Israel Deaconess Tıp Merkezi’nde dahiliye uzmanı olan Dr. Adam Rodman, yapay zekayı kullanmak üzere oluşturulan sohbet robotlarının doktorların hastalıkları teşhis etmesine yardımcı olacağını kendinden emin bir şekilde bekliyordu.
Yanılmıştı.
Bunun yerine, Dr. Rodman’ın tasarıma yardım ettiği bir çalışmada, geleneksel kaynakların yanı sıra ChatGPT-4 verilen doktorların, bota erişimi olmayan doktorlardan yalnızca biraz daha iyi sonuçlar elde ettiği ortaya çıktı. Ve araştırmacıları şaşırtacak şekilde, ChatGPT tek başına doktorlardan daha iyi performans gösterdi.
Dr. Rodman, “Şok oldum” dedi.
OpenAI şirketine ait chatbot, bir vaka raporundan tıbbi bir durumu teşhis ederken ve nedenini açıklarken ortalama yüzde 90 puan aldı. Chatbot’u kullanmak üzere rastgele atanan doktorlar ortalama yüzde 76 puan aldı. Kullanmamak üzere rastgele atananların ortalama puanı yüzde 74 oldu.
Çalışma, chatbot’un üstün performansından daha fazlasını gösterdi.
Bir chatbot potansiyel olarak daha iyi bir teşhis önerse bile doktorların bazen koydukları teşhise olan sarsılmaz inançlarını ortaya çıkardı.
Çalışma, doktorların işleri için yapay zeka araçlarına maruz kalmasına rağmen çok az kişinin chatbotların yeteneklerinden nasıl yararlanacağını bildiğini gösterdi. Sonuç olarak yapay zeka sistemlerinin karmaşık teşhis sorunlarını çözme ve teşhislerine yönelik açıklamalar sunma yeteneğinden yararlanamadılar.
Teşhis konusunda değerli ikinci görüşler sunan Dr. Rodman, yapay zeka sistemlerinin “doktor genişleticileri” olması gerektiğini söyledi.