گوگل AMIE: هوش مصنوعی پزشکی AMIE یاد می‌گیرد تصاویر پزشکی را «ببیند» - آیصدر

گوگل در آخرین تحقیق خود روی AMIE (کاوشگر هوش پزشکی گویا)، به هوش مصنوعی تشخیصی‌اش توانایی درک اطلاعات تصویری پزشکی را می‌دهد.

تصور کن با یک هوش مصنوعی در مورد یک نگرانی سلامتی صحبت می‌کنی، و به‌جای اینکه فقط حرف‌های تو را پردازش کند، بتواند عکس آن جوش نگران‌کننده را ببیند یا نتیجه‌ی نوار قلبت (ECG) را تفسیر کند. این هدفی‌ست که گوگل در پی رسیدن به آن است.

پیش‌تر می‌دانستیم AMIE در گفت‌وگوهای پزشکی متنی امیدبخش ظاهر شده، طبق پژوهشی که در مجله‌ی Nature منتشر شده بود. اما بیایید واقع‌بین باشیم: پزشکی واقعی فقط به حرف زدن محدود نمی‌شود.

پزشکان به‌شدت به چیزهایی که می‌بینند وابسته‌اند — مثل شرایط پوستی، داده‌های دستگاه‌ها و گزارش‌های آزمایشگاه. همان‌طور که تیم گوگل به‌درستی اشاره می‌کند، حتی پلتفرم‌های پیام‌رسان ساده هم «اجازه می‌دهند اطلاعات چندرسانه‌ای ایستا (مثل تصاویر و اسناد) گفت‌وگوها را غنی‌تر کنند.»

هوش مصنوعی فقط متنی، بخش بزرگی از پازل را نداشت. سوال اصلی، به‌گفته‌ی پژوهشگران، این بود که: «آیا مدل‌های زبانی بزرگ (LLMها) می‌توانند گفت‌وگوهای تشخیصی بالینی را انجام دهند که این نوع اطلاعات پیچیده‌تر را هم در خود بگنجانند؟»

گوگل به AMIE یاد می‌دهد که ببیند و استدلال کند

مهندسان گوگل مدل AMIE را با استفاده از نسخه‌ی Flash از مدل Gemini 2.0 تقویت کرده‌اند که به‌عنوان مغز عملیات عمل می‌کند. آن‌ها این مدل را با چیزی ترکیب کرده‌اند که به آن «چارچوب استدلال آگاه از وضعیت» می‌گویند. به زبان ساده، این یعنی هوش مصنوعی فقط یک سناریوی از پیش تعیین‌شده را دنبال نمی‌کند؛ بلکه مکالمه را بر اساس چیزهایی که تا الان یاد گرفته و چیزهایی که هنوز باید بفهمد، تطبیق می‌دهد.

این عملکرد شباهت زیادی به شیوه‌ی کار یک پزشک انسانی دارد: سرنخ‌هایی جمع‌آوری می‌کند، ایده‌هایی درباره‌ی آنچه ممکن است مشکل باشد شکل می‌دهد، و سپس برای محدود کردن احتمالات، درخواست اطلاعات خاص‌تری – از جمله شواهد تصویری – می‌کند.

گوگل توضیح می‌دهد:
«این قابلیت به AMIE اجازه می‌دهد تا در مواقع لازم، موارد چند‌حالته‌ی مرتبط را درخواست کند، یافته‌های آن‌ها را به‌درستی تفسیر کند، این اطلاعات را به‌طور یکپارچه در گفت‌وگوی جاری وارد کند، و از آن‌ها برای بهبود تشخیص استفاده کند.»

تصور کن مکالمه به‌صورت مرحله‌ای پیش می‌رود: ابتدا جمع‌آوری سابقه‌ی بیمار، سپس حرکت به‌سوی تشخیص و پیشنهادات درمانی، و در نهایت پیگیری. این هوش مصنوعی به‌طور مداوم درک خودش را ارزیابی می‌کند و اگر متوجه کمبودی شود – مثلاً لازم باشد عکسی از پوست یا نتیجه‌ی آزمایشگاهی ببیند – خودش درخواست می‌کند.

برای این‌که به این سطح از دقت برسند، بدون اینکه بارها و بارها روی افراد واقعی آزمایش انجام دهند، گوگل یک آزمایشگاه شبیه‌سازی دقیق ساخت.

گوگل موارد شبه‌بیمار واقعی خلق کرد و تصاویر و داده‌های پزشکی واقع‌گرایانه را از منابعی مثل پایگاه داده‌ی PTB-XL برای نوار قلب (ECG) و مجموعه‌ی تصویری SCIN برای بیماری‌های پوستی استخراج کرد، و سپس با استفاده از Gemini، پیش‌زمینه‌های قابل‌قبول و داستان‌های منطقی برای آن‌ها ایجاد کرد. سپس به AMIE اجازه دادند تا در این محیط شبیه‌سازی‌شده با بیماران مجازی گفت‌وگو کند و به‌صورت خودکار عملکردش را در زمینه‌هایی مانند دقت تشخیص و اجتناب از خطا (یا «توهم‌زدگی») ارزیابی کند.

آزمون عملی مجازی: گوگل AMIE را در میدان عمل آزمایش می‌کند

آزمون واقعی در قالبی برگزار شد که شبیه به نحوه‌ی ارزیابی دانشجویان پزشکی طراحی شده بود: آزمون ساختاریافته‌ی عینی بالینی (OSCE).

گوگل یک مطالعه‌ی از راه دور را با ۱۰۵ سناریوی پزشکی متفاوت اجرا کرد. بازیگران واقعی که برای ایفای نقش بیمار به‌طور یکسان آموزش دیده بودند، یا با نسخه‌ی چند‌حالته‌ی جدید AMIE یا با پزشکان عمومی انسانی (PCPs) تعامل داشتند. این گفت‌وگوها از طریق یک رابط کاربری انجام شد که در آن «بیمار» می‌توانست تصاویر بارگذاری کند، درست مانند کاری که ممکن است در یک اپلیکیشن پیام‌رسان مدرن انجام دهید.

پس از پایان مکالمات، پزشکان متخصص (در زمینه‌های پوست، قلب، و پزشکی داخلی) و خود بازیگران نقش بیمار، این گفت‌وگوها را بررسی کردند.

پزشکان انسانی تمام جنبه‌ها را ارزیابی کردند: از نحوه‌ی جمع‌آوری سابقه‌ی پزشکی، دقت تشخیص، کیفیت برنامه‌ی درمانی پیشنهادی، تا مهارت‌های ارتباطی و همدلی – و البته اینکه هوش مصنوعی تا چه اندازه اطلاعات تصویری را به‌درستی تفسیر کرده بود.

بخوانید:نقش یادگیری ماشین در ارتقاء امنیت کانتینرهای ابری بومی (Cloud-Native)

نتایج شگفت‌انگیز از کلینیک شبیه‌سازی‌شده

اینجاست که ماجرا واقعاً جالب می‌شود. در این مقایسه‌ی رودررو در محیط کنترل‌شده‌ی مطالعه، گوگل دریافت که AMIE نه تنها عملکرد خوبی داشت، بلکه در بسیاری از موارد از پزشکان انسانی پیشی گرفت.

این هوش مصنوعی از نظر تفسیر داده‌های چندحالته‌ای که در طی گفت‌وگوها به اشتراک گذاشته می‌شد، نسبت به پزشکان عمومی انسانی نمره‌ی بهتری گرفت. همچنین در دقت تشخیص هم امتیاز بالاتری کسب کرد، و لیست تشخیص‌های افتراقی (فهرست رتبه‌بندی‌شده‌ی شرایط احتمالی) که ارائه داد، طبق نظر متخصصان، دقیق‌تر و کامل‌تر از موارد ارائه‌شده توسط پزشکان انسانی بود.

پزشکان متخصصی که رونوشت‌ها را بررسی کردند، اغلب عملکرد AMIE را در اکثر زمینه‌ها بهتر ارزیابی کردند. آن‌ها به‌ویژه به «کیفیت تفسیر تصاویر و استدلال»، کامل بودن بررسی‌های تشخیصی، منطقی بودن برنامه‌های درمانی، و توانایی‌اش در هشدار دادن در شرایط اضطراری اشاره کردند.

شاید یکی از یافته‌های شگفت‌انگیزتر، نظر بازیگران نقش بیمار بود: آن‌ها اغلب هوش مصنوعی را در این گفت‌وگوهای متنی، همدل‌تر و قابل اعتمادتر از پزشکان انسانی می‌دانستند.

و از منظر ایمنی، نکته‌ی مهم این بود که در مطالعه، تفاوت آماری معناداری بین میزان خطاهای AMIE در تفسیر تصاویر (یعنی برداشت‌های نادرست یا اصطلاحاً “هالوسینیشن”) و پزشکان انسانی مشاهده نشد.

فناوری هیچ‌گاه درجا نمی‌زند، بنابراین گوگل برخی آزمایش‌های اولیه با جایگزینی مدل Gemini 2.0 Flash با نسخه‌ی جدیدتر Gemini 2.5 Flash نیز انجام داد.

با استفاده از همان چارچوب شبیه‌سازی، نتایج حاکی از پیشرفت‌های بیشتر بودند، به‌ویژه در دقت تشخیص (Top-3 Accuracy) و پیشنهاد برنامه‌های درمانی مناسب.

با وجود امیدبخش بودن نتایج، تیم پژوهش تأکید می‌کند که این‌ها صرفاً نتایج خودکار هستند، و «ارزیابی دقیق توسط پزشکان متخصص برای تأیید این مزایای عملکردی کاملاً ضروری است.»

واقعیت‌هایی که نباید نادیده گرفت

گوگل صادقانه به محدودیت‌های این پروژه اشاره می‌کند. آن‌ها به‌روشنی اعلام کرده‌اند:
«این مطالعه یک سیستم تحقیقاتی را در یک ارزیابی به سبک OSCE با استفاده از بازیگران نقش بیمار بررسی می‌کند، که به‌طور قابل توجهی پیچیدگی‌های مراقبت در دنیای واقعی را بازتاب نمی‌دهد.»

سناریوهای شبیه‌سازی‌شده، هرچقدر هم دقیق طراحی شده باشند، هرگز نمی‌توانند کاملاً جایگزین شرایط پیچیده، خاص و غیرقابل پیش‌بینی بیماران واقعی در یک کلینیک شلوغ شوند. همچنین گوگل تأکید می‌کند که رابط چت (متنی) نمی‌تواند غنای یک مشاوره واقعی حضوری یا تصویری را منتقل کند.

خب، قدم بعدی چیست؟ حرکت با احتیاط به‌سمت دنیای واقعی.
گوگل در حال حاضر با مرکز پزشکی Beth Israel Deaconess همکاری می‌کند تا در قالب یک مطالعه تحقیقاتی، عملکرد AMIE را در محیط‌های واقعی درمانی، با رضایت بیماران، بررسی کند.

پژوهشگران همچنین اذعان دارند که در نهایت باید فراتر از متن و تصاویر ثابت بروند و به سمت پردازش و درک ویدیو و صدا به‌صورت بلادرنگ حرکت کنند—چیزی که امروزه در خدمات پزشکی از راه دور (تله‌مدیسین) رایج است.

دادن توانایی «دیدن» و تفسیر شواهد تصویری به هوش مصنوعی—یعنی همان نوع داده‌هایی که پزشکان هر روز با آن‌ها سر و کار دارند—نمایی اولیه از آینده‌ای است که در آن هوش مصنوعی می‌تواند به یاری بیماران و پزشکان بیاید.
اما رسیدن از این نتایج امیدوارکننده به ابزاری ایمن و قابل اعتماد برای مراقبت‌های روزمره پزشکی، مسیر طولانی‌ای دارد که نیازمند حرکت محتاطانه و دقیق است.