مطالعه ای که توسط دانشگاه کمبریج انجام شد نشان داد دانش بالینی و مهارت های استدلال GPT-4 به سطح چشم پزشکان متخصص نزدیک می شود.
GPT-4 – یک “مدل زبان بزرگ” – بر روی پزشکان در مراحل مختلف حرفه آنها، از جمله پزشکان غیرمتخصص جوان، و پزشکان کارآموز و متخصص چشم مورد آزمایش قرار گرفت. به هر یک از آنها مجموعه ای از 87 سناریو بیمار که شامل یک مشکل چشمی خاص بود ارائه شد و از آنها خواسته شد تا با انتخاب از بین چهار گزینه، تشخیص یا مشاوره در مورد درمان ارائه دهند.
GPT-4 به طور قابل توجهی در آزمون نسبت به پزشکان غیرمتخصص جوان که از نظر سطح دانش تخصصی چشم قابل مقایسه با پزشکان عمومی هستند، امتیاز بهتری کسب کرد.
GPT-4 نمرات مشابهی را با چشم پزشکان کارآموز و متخصص کسب کرد – اگرچه پزشکان برتر امتیاز بالاتری گرفتند.
محققان می گویند که مدل های زبان بزرگ به احتمال زیاد جایگزین متخصصان مراقبت های بهداشتی نمی شوند، اما پتانسیل بهبود مراقبت های بهداشتی را به عنوان بخشی از گردش کار بالینی دارند.
آنها می گویند که مدل های پیشرفته زبان بزرگ مانند GPT-4 می تواند برای ارائه توصیه های مرتبط با چشم، تشخیص و پیشنهادات مدیریتی در زمینه های کاملاً کنترل شده، مانند تریاژ بیماران، یا جایی که دسترسی به متخصصان مراقبت های بهداشتی متخصص محدود است مفید باشد. .
دکتر Arun Thirunavukarasu میگوید: «ما میتوانیم بهطور واقعبینانه هوش مصنوعی را در تریاژ بیماران مبتلا به مشکلات چشمی به کار ببریم تا تصمیم بگیریم که کدام موارد اورژانسی هستند که باید فوراً توسط یک متخصص ویزیت شوند، کدامها میتوانند توسط پزشک عمومی ببینند، و کدام موارد نیازی به درمان ندارند.» نویسنده اصلی این مطالعه، که او در دوران دانشجویی در دانشکده پزشکی بالینی دانشگاه کمبریج انجام داد.
وی افزود: «این مدلها میتوانند از الگوریتمهای واضحی که قبلاً استفاده میشد پیروی کنند، و ما دریافتیم که GPT-4 در پردازش علائم و نشانههای چشمی برای پاسخ به سؤالات پیچیدهتر، به خوبی پزشکان متخصص است.
با توسعه بیشتر، مدلهای زبان بزرگ میتوانند به پزشکان عمومی که در تلاش برای دریافت توصیههای فوری از چشم پزشکان هستند، توصیه کنند. مردم در بریتانیا بیش از همیشه منتظر مراقبت از چشم هستند.
حجم زیادی از متن بالینی برای کمک به تنظیم دقیق و توسعه این مدل ها مورد نیاز است، و کار در سراسر جهان برای تسهیل این امر ادامه دارد.
محققان می گویند که مطالعه آنها نسبت به مطالعات مشابه قبلی برتری دارد زیرا آنها توانایی های هوش مصنوعی را به جای مجموعه ای از نتایج معاینه با پزشکان شاغل مقایسه کردند.
Thirunavukarasu، که اکنون در حال حاضر است، گفت: “پزشکان در تمام طول حرفه خود برای امتحانات تجدید نظر نمی کنند. ما می خواستیم ببینیم هوش مصنوعی در مقابل دانش و توانایی های در محل پزشکان شاغل چگونه عمل می کند.” دکتر بنیاد آکادمیک در بیمارستان های دانشگاه آکسفورد NHS Foundation Trust.
وی افزود: “ما همچنین باید قابلیت ها و محدودیت های مدل های تجاری موجود را مشخص کنیم، زیرا ممکن است بیماران از قبل از آنها – به جای اینترنت – برای مشاوره استفاده کنند.”
این آزمون شامل سوالاتی در مورد طیف وسیعی از مشکلات چشمی، از جمله حساسیت شدید به نور، کاهش بینایی، ضایعات، خارش و درد چشم بود که از کتاب درسی مورد استفاده برای آزمایش چشم پزشکان کارآموز گرفته شده بود. این کتاب درسی به صورت رایگان در اینترنت در دسترس نیست، بنابراین بعید است که محتوای آن در مجموعه داده های آموزشی GPT-4 گنجانده شده باشد.
نتایج امروز در مجله منتشر شده است سلامت دیجیتال PLOS.
حتی با در نظر گرفتن استفاده آینده از هوش مصنوعی، فکر می کنم پزشکان همچنان مسئول مراقبت از بیمار خواهند بود. مهمترین چیز این است که بیماران را برای تصمیم گیری در مورد اینکه آیا می خواهند سیستم های کامپیوتری درگیر شوند یا نه، توانمند کنیم. این یک تصمیم فردی برای هر بیمار خواهد بود.”
دکتر ع.س. Arun Thirunavukarasu، نویسنده اصلی این مطالعه
GPT-4 و GPT-3.5 – یا «ترانسفورماتورهای از پیش آموزشدیده مولد» – بر روی مجموعه دادههای حاوی صدها میلیارد کلمه از مقالات، کتابها و سایر منابع اینترنتی آموزش داده شدهاند. اینها دو نمونه از مدلهای زبان بزرگ هستند. سایر مواردی که به طور گسترده مورد استفاده قرار می گیرند عبارتند از Pathways Language Model 2 (PaLM 2) و Large Language Model Meta AI 2 (LLaMA 2).
این مطالعه همچنین GPT-3.5، PaLM2، و LLaMA را با مجموعه سوالات یکسانی آزمایش کرد. GPT-4 پاسخ های دقیق تری از همه آنها داد.
GPT-4 به ربات چت آنلاین ChatGPT قدرت میدهد تا پاسخهای سفارشی به درخواستهای انسانی ارائه دهد. در ماههای اخیر، ChatGPT توجه قابل توجهی را در پزشکی برای دستیابی به عملکرد عالی در معاینات دانشکده پزشکی و ارائه پیامهای دقیقتر و همدلانهتر از پزشکان انسانی در پاسخ به سؤالات بیمار به خود جلب کرده است.
حوزه مدل های زبان بزرگ با هوش مصنوعی بسیار سریع در حال حرکت است. از زمان انجام این مطالعه، مدل های پیشرفته تری منتشر شده است – که ممکن است حتی به سطح چشم پزشکان متخصص نزدیک تر باشد.
منبع:
مرجع مجله:
تیروناووکاراسو، ای جی، و همکاران (2024) مدل های زبان بزرگ به دانش بالینی و استدلال در سطح متخصص در چشم پزشکی: یک مطالعه مقطعی سر به سر. سلامت دیجیتال PLOS. doi.org/10.1371/journal.pdig.0000341.
Source link