
گوگل در آخرین تحقیق خود روی AMIE (کاوشگر هوش پزشکی گویا)، به هوش مصنوعی تشخیصیاش توانایی درک اطلاعات تصویری پزشکی را میدهد.
تصور کن با یک هوش مصنوعی در مورد یک نگرانی سلامتی صحبت میکنی، و بهجای اینکه فقط حرفهای تو را پردازش کند، بتواند عکس آن جوش نگرانکننده را ببیند یا نتیجهی نوار قلبت (ECG) را تفسیر کند. این هدفیست که گوگل در پی رسیدن به آن است.
پیشتر میدانستیم AMIE در گفتوگوهای پزشکی متنی امیدبخش ظاهر شده، طبق پژوهشی که در مجلهی Nature منتشر شده بود. اما بیایید واقعبین باشیم: پزشکی واقعی فقط به حرف زدن محدود نمیشود.
پزشکان بهشدت به چیزهایی که میبینند وابستهاند — مثل شرایط پوستی، دادههای دستگاهها و گزارشهای آزمایشگاه. همانطور که تیم گوگل بهدرستی اشاره میکند، حتی پلتفرمهای پیامرسان ساده هم «اجازه میدهند اطلاعات چندرسانهای ایستا (مثل تصاویر و اسناد) گفتوگوها را غنیتر کنند.»
هوش مصنوعی فقط متنی، بخش بزرگی از پازل را نداشت. سوال اصلی، بهگفتهی پژوهشگران، این بود که: «آیا مدلهای زبانی بزرگ (LLMها) میتوانند گفتوگوهای تشخیصی بالینی را انجام دهند که این نوع اطلاعات پیچیدهتر را هم در خود بگنجانند؟»
گوگل به AMIE یاد میدهد که ببیند و استدلال کند
مهندسان گوگل مدل AMIE را با استفاده از نسخهی Flash از مدل Gemini 2.0 تقویت کردهاند که بهعنوان مغز عملیات عمل میکند. آنها این مدل را با چیزی ترکیب کردهاند که به آن «چارچوب استدلال آگاه از وضعیت» میگویند. به زبان ساده، این یعنی هوش مصنوعی فقط یک سناریوی از پیش تعیینشده را دنبال نمیکند؛ بلکه مکالمه را بر اساس چیزهایی که تا الان یاد گرفته و چیزهایی که هنوز باید بفهمد، تطبیق میدهد.
این عملکرد شباهت زیادی به شیوهی کار یک پزشک انسانی دارد: سرنخهایی جمعآوری میکند، ایدههایی دربارهی آنچه ممکن است مشکل باشد شکل میدهد، و سپس برای محدود کردن احتمالات، درخواست اطلاعات خاصتری – از جمله شواهد تصویری – میکند.
گوگل توضیح میدهد:
«این قابلیت به AMIE اجازه میدهد تا در مواقع لازم، موارد چندحالتهی مرتبط را درخواست کند، یافتههای آنها را بهدرستی تفسیر کند، این اطلاعات را بهطور یکپارچه در گفتوگوی جاری وارد کند، و از آنها برای بهبود تشخیص استفاده کند.»
تصور کن مکالمه بهصورت مرحلهای پیش میرود: ابتدا جمعآوری سابقهی بیمار، سپس حرکت بهسوی تشخیص و پیشنهادات درمانی، و در نهایت پیگیری. این هوش مصنوعی بهطور مداوم درک خودش را ارزیابی میکند و اگر متوجه کمبودی شود – مثلاً لازم باشد عکسی از پوست یا نتیجهی آزمایشگاهی ببیند – خودش درخواست میکند.
برای اینکه به این سطح از دقت برسند، بدون اینکه بارها و بارها روی افراد واقعی آزمایش انجام دهند، گوگل یک آزمایشگاه شبیهسازی دقیق ساخت.
گوگل موارد شبهبیمار واقعی خلق کرد و تصاویر و دادههای پزشکی واقعگرایانه را از منابعی مثل پایگاه دادهی PTB-XL برای نوار قلب (ECG) و مجموعهی تصویری SCIN برای بیماریهای پوستی استخراج کرد، و سپس با استفاده از Gemini، پیشزمینههای قابلقبول و داستانهای منطقی برای آنها ایجاد کرد. سپس به AMIE اجازه دادند تا در این محیط شبیهسازیشده با بیماران مجازی گفتوگو کند و بهصورت خودکار عملکردش را در زمینههایی مانند دقت تشخیص و اجتناب از خطا (یا «توهمزدگی») ارزیابی کند.
آزمون عملی مجازی: گوگل AMIE را در میدان عمل آزمایش میکند
آزمون واقعی در قالبی برگزار شد که شبیه به نحوهی ارزیابی دانشجویان پزشکی طراحی شده بود: آزمون ساختاریافتهی عینی بالینی (OSCE).
گوگل یک مطالعهی از راه دور را با ۱۰۵ سناریوی پزشکی متفاوت اجرا کرد. بازیگران واقعی که برای ایفای نقش بیمار بهطور یکسان آموزش دیده بودند، یا با نسخهی چندحالتهی جدید AMIE یا با پزشکان عمومی انسانی (PCPs) تعامل داشتند. این گفتوگوها از طریق یک رابط کاربری انجام شد که در آن «بیمار» میتوانست تصاویر بارگذاری کند، درست مانند کاری که ممکن است در یک اپلیکیشن پیامرسان مدرن انجام دهید.
پس از پایان مکالمات، پزشکان متخصص (در زمینههای پوست، قلب، و پزشکی داخلی) و خود بازیگران نقش بیمار، این گفتوگوها را بررسی کردند.
پزشکان انسانی تمام جنبهها را ارزیابی کردند: از نحوهی جمعآوری سابقهی پزشکی، دقت تشخیص، کیفیت برنامهی درمانی پیشنهادی، تا مهارتهای ارتباطی و همدلی – و البته اینکه هوش مصنوعی تا چه اندازه اطلاعات تصویری را بهدرستی تفسیر کرده بود.
بخوانید:نقش یادگیری ماشین در ارتقاء امنیت کانتینرهای ابری بومی (Cloud-Native)
نتایج شگفتانگیز از کلینیک شبیهسازیشده
اینجاست که ماجرا واقعاً جالب میشود. در این مقایسهی رودررو در محیط کنترلشدهی مطالعه، گوگل دریافت که AMIE نه تنها عملکرد خوبی داشت، بلکه در بسیاری از موارد از پزشکان انسانی پیشی گرفت.
این هوش مصنوعی از نظر تفسیر دادههای چندحالتهای که در طی گفتوگوها به اشتراک گذاشته میشد، نسبت به پزشکان عمومی انسانی نمرهی بهتری گرفت. همچنین در دقت تشخیص هم امتیاز بالاتری کسب کرد، و لیست تشخیصهای افتراقی (فهرست رتبهبندیشدهی شرایط احتمالی) که ارائه داد، طبق نظر متخصصان، دقیقتر و کاملتر از موارد ارائهشده توسط پزشکان انسانی بود.
پزشکان متخصصی که رونوشتها را بررسی کردند، اغلب عملکرد AMIE را در اکثر زمینهها بهتر ارزیابی کردند. آنها بهویژه به «کیفیت تفسیر تصاویر و استدلال»، کامل بودن بررسیهای تشخیصی، منطقی بودن برنامههای درمانی، و تواناییاش در هشدار دادن در شرایط اضطراری اشاره کردند.
شاید یکی از یافتههای شگفتانگیزتر، نظر بازیگران نقش بیمار بود: آنها اغلب هوش مصنوعی را در این گفتوگوهای متنی، همدلتر و قابل اعتمادتر از پزشکان انسانی میدانستند.
و از منظر ایمنی، نکتهی مهم این بود که در مطالعه، تفاوت آماری معناداری بین میزان خطاهای AMIE در تفسیر تصاویر (یعنی برداشتهای نادرست یا اصطلاحاً “هالوسینیشن”) و پزشکان انسانی مشاهده نشد.
فناوری هیچگاه درجا نمیزند، بنابراین گوگل برخی آزمایشهای اولیه با جایگزینی مدل Gemini 2.0 Flash با نسخهی جدیدتر Gemini 2.5 Flash نیز انجام داد.
با استفاده از همان چارچوب شبیهسازی، نتایج حاکی از پیشرفتهای بیشتر بودند، بهویژه در دقت تشخیص (Top-3 Accuracy) و پیشنهاد برنامههای درمانی مناسب.
با وجود امیدبخش بودن نتایج، تیم پژوهش تأکید میکند که اینها صرفاً نتایج خودکار هستند، و «ارزیابی دقیق توسط پزشکان متخصص برای تأیید این مزایای عملکردی کاملاً ضروری است.»
واقعیتهایی که نباید نادیده گرفت
گوگل صادقانه به محدودیتهای این پروژه اشاره میکند. آنها بهروشنی اعلام کردهاند:
«این مطالعه یک سیستم تحقیقاتی را در یک ارزیابی به سبک OSCE با استفاده از بازیگران نقش بیمار بررسی میکند، که بهطور قابل توجهی پیچیدگیهای مراقبت در دنیای واقعی را بازتاب نمیدهد.»
سناریوهای شبیهسازیشده، هرچقدر هم دقیق طراحی شده باشند، هرگز نمیتوانند کاملاً جایگزین شرایط پیچیده، خاص و غیرقابل پیشبینی بیماران واقعی در یک کلینیک شلوغ شوند. همچنین گوگل تأکید میکند که رابط چت (متنی) نمیتواند غنای یک مشاوره واقعی حضوری یا تصویری را منتقل کند.
خب، قدم بعدی چیست؟ حرکت با احتیاط بهسمت دنیای واقعی.
گوگل در حال حاضر با مرکز پزشکی Beth Israel Deaconess همکاری میکند تا در قالب یک مطالعه تحقیقاتی، عملکرد AMIE را در محیطهای واقعی درمانی، با رضایت بیماران، بررسی کند.
پژوهشگران همچنین اذعان دارند که در نهایت باید فراتر از متن و تصاویر ثابت بروند و به سمت پردازش و درک ویدیو و صدا بهصورت بلادرنگ حرکت کنند—چیزی که امروزه در خدمات پزشکی از راه دور (تلهمدیسین) رایج است.
دادن توانایی «دیدن» و تفسیر شواهد تصویری به هوش مصنوعی—یعنی همان نوع دادههایی که پزشکان هر روز با آنها سر و کار دارند—نمایی اولیه از آیندهای است که در آن هوش مصنوعی میتواند به یاری بیماران و پزشکان بیاید.
اما رسیدن از این نتایج امیدوارکننده به ابزاری ایمن و قابل اعتماد برای مراقبتهای روزمره پزشکی، مسیر طولانیای دارد که نیازمند حرکت محتاطانه و دقیق است.


