نسخه پادکست مقاله “کلود ۴ آنتروپیک: آغاز عصری نو برای عاملهای هوشمند و برنامهنویسی با هوش مصنوعی” را گوش دهید.

شرکت Anthropic از خانواده مدلهای جدید Claude 4 رونمایی کرده و به نظر میرسد این نسخه، جهشی بزرگ برای کسانی باشد که روی ساخت دستیارهای هوش مصنوعی نسل جدید یا ابزارهای برنامهنویسی کار میکنند. ستارههای این نسخه، مدل قدرتمند Claude Opus 4 و مدل همهفنحریف Claude Sonnet 4 هستند.
Anthropic اهداف بلندپروازانهای دارد و اعلام کرده که این مدلها با هدف «پیشبرد استراتژیهای هوش مصنوعی مشتریان در همه حوزهها» طراحی شدهاند. آنها مدل Opus 4 را ابزاری معرفی کردهاند برای «گسترش مرزهای برنامهنویسی، تحقیق، نویسندگی و اکتشافات علمی»، در حالی که Sonnet 4 بهعنوان «ارتقایی فوری نسبت به نسخه Sonnet 3.7» توصیف شده که آماده است «عملکردی در سطح پیشرفته را به کاربردهای روزمره بیاورد.»
کلود Opus 4 : قهرمان جدید برنامهنویسی
وقتی آنتروپیک از Claude Opus 4 بهعنوان «قویترین مدل ساختهشده تاکنون و بهترین مدل برنامهنویسی جهان» یاد میکنه، طبیعتاً توجه همه جلب میشه. اونها برای این ادعا عدد و رقم هم دارن: Opus 4 در آزمونهای مهم صنعتی صدرنشین شده — با امتیاز ۷۲.۵٪ در SWE-bench و ۴۳.۲٪ در Terminal-bench.
اما این مدل فقط برای دویدنهای کوتاه ساخته نشده؛ Opus 4 برای مسیرهای طولانی طراحی شده، با تمرکز بر «عملکرد پایدار در کارهای طولانیمدت که به تمرکز بالا و هزاران مرحله نیاز دارن.» تصور کن یه هوش مصنوعی بتونه «چند ساعت بهطور مداوم کار کنه» — چیزی که آنتروپیک ادعا میکنه این مدل از پسش برمیاد.
این پیشرفتی عظیم نسبت به مدلهای قبلی Sonnet محسوب میشه و میتونه افقهای جدیدی رو برای تواناییهای عاملهای هوش مصنوعی باز کنه، بهویژه در مسائلی که به پایداری و پشتکار واقعی نیاز دارن.
Claude Sonnet 4: مناسب برای کارهای روزمره و عاملهای هوشمند
در حالی که Opus 4 مثل یک قهرمان سنگینوزن ظاهر شده، Claude Sonnet 4 داره خودش رو بهعنوان یک اسب کاری همهکاره نشون میده؛ مدلی که نوید افزایش چشمگیر عملکرد در طیف وسیعی از کاربردها رو میده. بازخوردهای اولیه از کسانی که نسخهی آزمایشی رو دیدن، بسیار مثبت بوده.
برای مثال، GitHub میگه که Claude Sonnet 4 در سناریوهای عاملمحور (agentic) بسیار عالی عمل میکنه و اونقدر تحت تأثیر قرار گرفتن که «برنامه دارن از این مدل بهعنوان مدل پایه برای عامل کدنویسی جدید در GitHub Copilot استفاده کنن.» این یعنی یه تأییدیهی سنگین و معتبر.
منتقد فناوری، Manus هم تحت تأثیر قرار گرفته و به «پیشرفت در اجرای دستورات پیچیده، استدلال شفاف، و خروجیهای زیبا از نظر بصری» اشاره کرده.
بازخورد مثبت از طرف iGent هم ادامه داره: «گزارش شده که Sonnet 4 در توسعهی خودکار اپلیکیشنهای چندویژگی عملکرد درخشانی داشته، و همچنین در حل مسئله و ناوبری در پایگاههای کد پیشرفت قابلتوجهی نشون داده — نرخ خطای ناوبری از ۲۰٪ به نزدیک صفر رسیده.» این میتونه نحوهی کار تیمهای توسعه رو متحول کنه.
Sourcegraph هم دید مثبتی داره و این مدل رو یک «جهش بزرگ در توسعهی نرمافزار» توصیف کرده — مدلی که تمرکز بیشتری داره، مسائل رو عمیقتر درک میکنه، و کدهایی با کیفیت زیباتر تولید میکنه.
در نهایت، Augment Code گزارش داده که با Sonnet 4 «نرخ موفقیت بالاتر، ویرایشهای دقیقتر در کد، و عملکرد دقیقتری در کارهای پیچیده» دیده شده، به همین دلیل اونا این مدل رو بهعنوان مدل اصلی خودشون انتخاب کردن.
حالتهای ترکیبی و لذتهای توسعهدهندهای
یکی از ویژگیهای واقعاً هوشمندانه در خانوادهی Claude 4، ماهیت ترکیبی (Hybrid) اونهاست. هم Opus 4 و هم Sonnet 4 میتونن در دو حالت مختلف کار کنن:
-
یکی برای پاسخهای تقریباً آنی که اغلب بهشون نیاز داریم،
-
و یکی دیگه برای «تفکر طولانیتر جهت استدلال عمیقتر.»
این حالت «تفکر عمیقتر» در پلنهای Pro، Max، Team و Enterprise برای Claude فعال خواهد بود.
اما خبر خوب برای همه اینه که Sonnet 4 بههمراه این حالت تفکر عمیق، برای کاربران رایگان هم در دسترس خواهد بود — حرکتی فوقالعاده برای در دسترسپذیرتر کردن هوش مصنوعی در سطح بالا.
علاوه بر این،آنتروپیک داره ابزارهای جدید و جذابی برای توسعهدهندهها در API خودش ارائه میده، با هدف افزایش توانمندی در ساخت عاملهای هوشمند پیچیدهتر:
🔹 ابزار اجرای کد (Code execution tool): این ابزار به مدلها اجازه میده که کد رو واقعاً اجرا کنن — که دروازهای باز میکنه به سمت برنامههای تعاملی و حل مسئلهی پیشرفته.
🔹 اتصالدهنده MCP: توسط آنتروپیک معرفی شده و باعث میشه تبادل اطلاعات بین دستیارهای هوش مصنوعی و محیطهای نرمافزاری استاندارد بشه.
🔹 API کار با فایلها (Files API): باعث میشه مدل بتونه مستقیماً با فایلها کار کنه — قابلیتی که برای خیلی از کارهای واقعی ضروریه.
🔹 کش کردن promptها (Prompt caching): حالا توسعهدهندهها میتونن promptهایی که زیاد استفاده میشن رو تا یک ساعت کش کنن — شاید جزئی بهنظر بیاد، ولی میتونه تأثیر زیادی روی سرعت و بهرهوری بذاره، مخصوصاً برای درخواستهای تکراری.
پیشتاز در عملکرد واقعی دنیای واقعی
آنتروپیک به شدت تأکید داره که «مدلهای Claude 4 در آزمون SWE-bench Verified پیشتاز هستن» — معیاری که عملکرد مدلها در وظایف واقعی مهندسی نرمافزار رو میسنجه.
اما فقط بحث کدنویسی نیست!
اونها تأکید میکنن که این مدلها عملکرد قویای در حوزههای مختلف دارن، از جمله:
🔹 کدنویسی،
🔹 استدلال،
🔹 قابلیتهای چندرسانهای (multimodal)،
🔹 و وظایف عاملیتمحور (agentic tasks).
با وجود جهش در تواناییها، قیمتگذاری همچنان ثابت مانده
آنتروپیک علیرغم ارتقاء بزرگ مدلها، قیمتها رو ثابت نگه داشته.
🔹 Claude Opus 4
-
قیمت ورودی: ۱۵ دلار برای هر یک میلیون توکن ورودی
-
قیمت خروجی: ۷۵ دلار برای هر یک میلیون توکن خروجی
🔹 Claude Sonnet 4
-
قیمت ورودی: ۳ دلار برای هر یک میلیون توکن ورودی
-
قیمت خروجی: ۱۵ دلار برای هر یک میلیون توکن خروجی
این ثبات قیمتی قطعاً خبر خوبی برای کاربران فعلی محسوب میشه.
دسترسی گسترده
هر دو مدل Claude Opus 4 و Claude Sonnet 4 اکنون از طریق API رسمی آنتروپیک قابل استفاده هستن،
و همچنین روی پلتفرمهای Amazon Bedrock و Google Cloud Vertex AI نیز در دسترس قرار گرفتن.
🔧 این دسترسی گسترده باعث میشه که توسعهدهندهها و شرکتها در سراسر جهان بتونن آزمایش، تست و ادغام این ابزارها رو خیلی راحتتر انجام بدن.
حرکت قاطع آنتروپیک برای ارتقای هوش مصنوعی
با عرضهی این مدلهای جدید و ابزارهای مخصوص توسعهدهندهها،
Anthropic نشون داده که عزم جدی برای تقویت توانمندیهای هوش مصنوعی داره —
بهویژه در زمینههای پیچیدهای مثل کدنویسی و رفتار عاملهای خودمختار (autonomous agents).
🔋 به لطف این نوآوریها، دنیای هوش مصنوعی در آستانهی جهشی جدی قرار گرفته.


