Memublikasikan karya di jurnal Science adalah pencapaian besar bagi banyak peneliti. Namun bagi Adam Rodman, seorang dokter spesialis penyakit dalam dan peneliti AI klinis, pencapaian tersebut justru memunculkan keresahan.

Pada Kamis (18/7), Rodman dan timnya menerbitkan kumpulan eksperimen yang salah satunya menggunakan data nyata dari unit gawat darurat di Boston. Hasilnya menunjukkan model bahasa besar dari OpenAI mampu mengungguli dokter dalam mengevaluasi diagnosis dan penalaran klinis berbasis kasus.

Bagi Rodman, yang juga merupakan salah satu penulis senior dalam studi tersebut, temuan ini merupakan jawaban terhadap tantangan yang dilontarkan dalam jurnal Science pada tahun 1959. Kala itu, sebuah makalah menjelaskan bagaimana sistem pendukung keputusan klinis dapat dinilai mampu mendiagnosis lebih baik daripada manusia. "Dan kini, mereka terbukti bisa melakukannya," kata Rodman.

Namun, Rodman menyoroti kekhawatirannya terhadap tren pemasaran AI generatif—seperti chatbot—yang semakin gencar, baik kepada pasien maupun tenaga medis. Ia khawatir eksperimen ilmiah yang menggunakan kasus simulasi atau data historis hanya akan disalahartikan sebagai bukti bahwa AI aman dan efektif untuk digunakan dalam perawatan pasien secara langsung.

Menurutnya, penerapan AI dalam dunia medis memerlukan standar yang jauh lebih ketat sebelum dapat diandalkan dalam praktik klinis sehari-hari.

Sumber: STAT News