غول جدید OpenAI مدل o3-mini برای همه رایگان شد!

فهرست مطالب

خلاصه (In Short)

پس از اینکه آزمایشگاه چینی DeepSeek مدل R1 خود را به‌صورت رایگان منتشر کرد، OpenAI نیز مدل پیشروی خود با نام o3-mini را برای تمام کاربران ChatGPT رایگان کرد.
کاربران ChatGPT Plus به مدل قدرتمندتر o3-mini-high دسترسی دارند که در کدنویسی (Coding)، علوم (Science)، ریاضیات (Math) و استدلال (Reasoning) برتری دارد.
هر دو مدل از امروز عرضه می‌شوند. کاربران رایگان ChatGPT می‌توانند با انتخاب گزینه «Reason» از o3-mini استفاده کنند.

مقدمه

آزمایشگاه هوش مصنوعی چینی DeepSeek اخیراً مدل استدلالی در سطح o1 با نام R1 را به‌صورت رایگان در اختیار تمام کاربران سراسر جهان قرار داده است. این اقدام غیرمنتظره، بازار سهام فناوری آمریکا را تحت تأثیر قرار داد و به نظر می‌رسد یکی از دلایلی باشد که OpenAI را ترغیب کرد تا سریع‌تر مدل‌های پیشروی خود را منتشر کند. در نهایت، امروز OpenAI مدل قدرتمند o3-mini را به‌صورت رایگان برای تمام کاربران ChatGPT عرضه کرد.

پیش از این، کاربران رایگان ChatGPT تنها به مدل بسیار کوچک‌تر “GPT-4o mini” دسترسی داشتند و گاهی از GPT-4o نیز استفاده می‌کردند. اما اکنون همه کاربران می‌توانند به مدل o3-mini که در دسامبر سال گذشته معرفی شده بود، دسترسی داشته باشند. شایان ذکر است که مدل‌های سری o3 به‌دلیل موفقیت در شکستن رکورد ARC-AGI benchmark (معیار ارزیابی هوش مصنوعی پیشرفته) شهرت یافتند.

معرفی OpenAI o3-mini

OpenAI o3-mini به‌عنوان جدیدترین و مقرون‌به‌صرفه‌ترین مدل در سری مدل‌های استدلال (Reasoning Series) معرفی شده است. این مدل، ضمن ارائه توانایی چشمگیر در حوزه STEM (علوم، ریاضیات و کدنویسی)، هزینه پایین و تأخیر کم (Low Cost & Low Latency) مشابه OpenAI o1-mini را حفظ می‌کند.

ویژگی‌های کلیدی

پشتیبانی از Function Calling و Structured Outputs:
این مدل از function calling (فراخوانی تابع)، Structured Outputs (خروجی‌های ساختاریافته) و developer messages (پیام‌های توسعه‌دهنده) پشتیبانی می‌کند و از همان ابتدا برای محیط تولید (Production-Ready) آماده است.
قابلیت Streaming (استریم):
مانند مدل‌های قبلی (OpenAI o1-mini و OpenAI o1-preview)، این مدل نیز از استریم پشتیبانی می‌کند.
Reasoning Effort قابل تنظیم:
توسعه‌دهندگان می‌توانند از میان سه سطح low، medium و high، بسته به نیازشان انتخاب کنند. این انعطاف‌پذیری به مدل اجازه می‌دهد در چالش‌های پیچیده «بیشتر فکر کند» یا در مواقع نیاز به سرعت، تأخیر را کاهش دهد.
بدون پشتیبانی از Vision Capabilities:
این مدل از قابلیت‌های بصری پشتیبانی نمی‌کند و برای وظایف بینایی (Vision Tasks)، همچنان باید از OpenAI o1 استفاده شود.

دسترسی برای کاربران ChatGPT

کاربرهای رایگان

اکنون به مدل پیشرفته دسترسی دارند: برای اولین بار، کاربران رایگان ChatGPT به یک مدل قدرتمند استدلالی دسترسی پیدا می‌کنند. برای استفاده، کافی است در پیام‌نویس (Message Composer) گزینه «Reason» را انتخاب کنید.

کاربران Plus، Team و Pro

o3-mini به‌عنوان جایگزین o1-mini: این مدل در بخش انتخابگر مدل (model picker) جایگزین o1-mini می‌شود و علاوه بر تأخیر کمتر، محدودیت نرخ (Rate Limit) بیشتری به شما می‌دهد.
سه برابر شدن محدودیت پیام: محدودیت پیام روزانه برای کاربران Plus و Team از ۵۰ پیام به ۱۵۰ پیام افزایش یافته است.
دسترسی به o3-mini-high: کاربرانی که اشتراک ChatGPT Plus دارند، می‌توانند از مدل قدرتمندتر o3-mini-high استفاده کنند که در کدنویسی، ریاضیات و علوم کارایی بهتری دارد. برای کاربرانی که اشتراک Pro دارند (۲۰۰ دلار در ماه)، دسترسی نامحدود به هر دو مدل o3-mini و o3-mini-high فراهم است.

دلایل مهم برای آپدیت

جایگزینی o1-mini: o3-mini نرخ پاسخگویی بهتر و تأخیر کمتری دارد و برای وظایف STEM و حل مشکلات منطقی توصیه می‌شود.
پشتیبانی از Search: ادغام اولیه با موتور جستجو باعث شده تا پاسخ‌های به‌روز همراه با لینک منابع وب فراهم شود.

بررسی عملکرد مدل‌های OpenAI o3-mini و o3-mini-high

مقایسه با DeepSeek R1

با ورود DeepSeek R1، بازار شاهد مدل‌های قدرتمند رایگان دیگری هم بود. برای رقابت، OpenAI تصمیم گرفت o3-mini را رایگان عرضه کند. این اقدام باعث می‌شود اکنون کاربران آزادانه بین دو گزینه جذاب انتخاب داشته باشند:

DeepSeek R1: مدل استدلالی در سطح o1، رایگان برای همه
OpenAI o3-mini: مدل استدلالی مقرون‌به‌صرفه، اکنون رایگان برای همه

نتایج کلیدی در بنچمارک‌ها

AIME 2024 (مسابقات ریاضی رقابتی)
- o3-mini با سطح تلاش متوسط (medium) تقریباً به عملکرد o1 می‌رسد و در سطح بالا (high) نتایج بهتری هم ارائه می‌دهد.
Codeforces (مسابقات کدنویسی رقابتی)
- o3-mini در تمام حالات از o1-mini بهتر عمل می‌کند و در سطح تلاش متوسط با o1 برابری دارد.
SWE-bench Verified (آزمون مهندسی نرم‌افزار)
- o3-mini بالاترین عملکرد را در بین مدل‌های فعلی کسب کرده است و با سطح تلاش بالا (high) حتی نتایج بهتری نیز به دست می‌آورد.
GPQA Diamond (سؤالات سطح دکترا در علوم زیستی، شیمی و فیزیک)
- o3-mini در سطح تلاش پایین، بالاتر از o1-mini و در سطح تلاش بالا، نزدیک به o1 عمل می‌کند.
- o3-mini-high در بیشتر بنچمارک‌ها بهتر از o1 عمل می‌کند، اما در همین آزمون GPQA Diamond گاهی o1 عملکرد بهتری دارد.

Competition Math (AIME 2024)

غول جدید OpenAI مدل o3-mini برای همه رایگان شد! sso plus اس اس او پلاس

سرعت و کارایی (Latency & Efficiency)

در تست‌های A/B، o3-mini پاسخ‌ها را به‌طور میانگین ۲۴٪ سریع‌تر از o1-mini ارائه می‌دهد (۷.۷ ثانیه در برابر ۱۰.۱۶ ثانیه).
مدل o3-mini (medium) حدود ۲۵۰۰ میلی‌ثانیه سریع‌تر به نخستین توکن پاسخ می‌دهد.
در مقایسه با GPT-4o، o3-mini از لحاظ تأخیر بسیار نزدیک عمل می‌کند که پیشرفت بزرگی محسوب می‌شود.

Latency comparison between o1-mini and o3-mini (medium)

ایمنی (Safety)

برای اطمینان از پاسخ‌های ایمن، از رویکرد Deliberative Alignment (ترازسازی متفکرانه) استفاده کرده‌ایم. همان‌طور که در مدل OpenAI o1 شاهد بودیم، o3-mini نیز در ارزیابی‌های Safety و جلوگیری از Jailbreak نتایج قابل‌توجهی کسب کرده است.

در ارزیابی محتوای ممنوعه (Disallowed Content Evaluations)، این مدل مدیریت خوبی نشان داده است.
در Jailbreak Evaluations، نرخ موفقیت حملات را به‌طور محسوسی کاهش داده و پاسخ‌های ایمن‌تری ارائه داده است.

پیش از انتشار عمومی، ریسک‌های ایمنی o3-mini مانند بررسی آمادگی (Preparedness)، Red-Teaming خارجی (External Red-Teaming) و ارزیابی‌های چندگانه بررسی شدند. برای جزئیات بیشتر، می‌توانید به o3-mini system card (کارت سیستمی o3-mini) مراجعه کنید.

Disallowed content evaluations

نتیجه‌گیری نهایی

OpenAI o3-mini با ویژگی‌های استثنایی در Cost-Effective Reasoning (استدلال مقرون‌به‌صرفه)، توانایی بالا در STEM (علوم، ریاضی و کدنویسی)، سرعت پاسخگویی بهتر و هزینه پایین، تجربه جدیدی را برای کاربران رایگان و پولی ChatGPT فراهم کرده است. هم‌زمان، ورود DeepSeek R1 به بازار نشان می‌دهد که رقابت در فضای هوش مصنوعی داغ‌تر از همیشه است و این به نفع کاربران خواهد بود.

با کاهش ۹۵٪ هزینه هر توکن از زمان معرفی GPT-4، OpenAI همچنان به پیشرفت مدل‌هایش متعهد است تا هوش مصنوعی پیشرفته، مقرون‌به‌صرفه و ایمن برای همگان در دسترس باشد. اگر کاربر رایگان ChatGPT هستید، هم‌اکنون می‌توانید از o3-mini استفاده کنید. برای کاربران پولی نیز o3-mini-high در دسترس است تا با سرعت و هوشمندی بیشتر، پیچیده‌ترین مسائل را حل کنند.

Artificial Intelligence