خلاصه (In Short)
- پس از اینکه آزمایشگاه چینی DeepSeek مدل R1 خود را بهصورت رایگان منتشر کرد، OpenAI نیز مدل پیشروی خود با نام o3-mini را برای تمام کاربران ChatGPT رایگان کرد.
- کاربران ChatGPT Plus به مدل قدرتمندتر o3-mini-high دسترسی دارند که در کدنویسی (Coding)، علوم (Science)، ریاضیات (Math) و استدلال (Reasoning) برتری دارد.
- هر دو مدل از امروز عرضه میشوند. کاربران رایگان ChatGPT میتوانند با انتخاب گزینه «Reason» از o3-mini استفاده کنند.
مقدمه
آزمایشگاه هوش مصنوعی چینی DeepSeek اخیراً مدل استدلالی در سطح o1 با نام R1 را بهصورت رایگان در اختیار تمام کاربران سراسر جهان قرار داده است. این اقدام غیرمنتظره، بازار سهام فناوری آمریکا را تحت تأثیر قرار داد و به نظر میرسد یکی از دلایلی باشد که OpenAI را ترغیب کرد تا سریعتر مدلهای پیشروی خود را منتشر کند. در نهایت، امروز OpenAI مدل قدرتمند o3-mini را بهصورت رایگان برای تمام کاربران ChatGPT عرضه کرد.
پیش از این، کاربران رایگان ChatGPT تنها به مدل بسیار کوچکتر “GPT-4o mini” دسترسی داشتند و گاهی از GPT-4o نیز استفاده میکردند. اما اکنون همه کاربران میتوانند به مدل o3-mini که در دسامبر سال گذشته معرفی شده بود، دسترسی داشته باشند. شایان ذکر است که مدلهای سری o3 بهدلیل موفقیت در شکستن رکورد ARC-AGI benchmark (معیار ارزیابی هوش مصنوعی پیشرفته) شهرت یافتند.
معرفی OpenAI o3-mini
OpenAI o3-mini بهعنوان جدیدترین و مقرونبهصرفهترین مدل در سری مدلهای استدلال (Reasoning Series) معرفی شده است. این مدل، ضمن ارائه توانایی چشمگیر در حوزه STEM (علوم، ریاضیات و کدنویسی)، هزینه پایین و تأخیر کم (Low Cost & Low Latency) مشابه OpenAI o1-mini را حفظ میکند.
ویژگیهای کلیدی
-
پشتیبانی از Function Calling و Structured Outputs:
این مدل از function calling (فراخوانی تابع)، Structured Outputs (خروجیهای ساختاریافته) و developer messages (پیامهای توسعهدهنده) پشتیبانی میکند و از همان ابتدا برای محیط تولید (Production-Ready) آماده است. -
قابلیت Streaming (استریم):
مانند مدلهای قبلی (OpenAI o1-mini و OpenAI o1-preview)، این مدل نیز از استریم پشتیبانی میکند. -
Reasoning Effort قابل تنظیم:
توسعهدهندگان میتوانند از میان سه سطح low، medium و high، بسته به نیازشان انتخاب کنند. این انعطافپذیری به مدل اجازه میدهد در چالشهای پیچیده «بیشتر فکر کند» یا در مواقع نیاز به سرعت، تأخیر را کاهش دهد. -
بدون پشتیبانی از Vision Capabilities:
این مدل از قابلیتهای بصری پشتیبانی نمیکند و برای وظایف بینایی (Vision Tasks)، همچنان باید از OpenAI o1 استفاده شود.
دسترسی برای کاربران ChatGPT
کاربرهای رایگان
- اکنون به مدل پیشرفته دسترسی دارند: برای اولین بار، کاربران رایگان ChatGPT به یک مدل قدرتمند استدلالی دسترسی پیدا میکنند. برای استفاده، کافی است در پیامنویس (Message Composer) گزینه «Reason» را انتخاب کنید.
کاربران Plus، Team و Pro
- o3-mini بهعنوان جایگزین o1-mini: این مدل در بخش انتخابگر مدل (model picker) جایگزین o1-mini میشود و علاوه بر تأخیر کمتر، محدودیت نرخ (Rate Limit) بیشتری به شما میدهد.
- سه برابر شدن محدودیت پیام: محدودیت پیام روزانه برای کاربران Plus و Team از ۵۰ پیام به ۱۵۰ پیام افزایش یافته است.
- دسترسی به o3-mini-high: کاربرانی که اشتراک ChatGPT Plus دارند، میتوانند از مدل قدرتمندتر o3-mini-high استفاده کنند که در کدنویسی، ریاضیات و علوم کارایی بهتری دارد. برای کاربرانی که اشتراک Pro دارند (۲۰۰ دلار در ماه)، دسترسی نامحدود به هر دو مدل o3-mini و o3-mini-high فراهم است.
دلایل مهم برای آپدیت
- جایگزینی o1-mini: o3-mini نرخ پاسخگویی بهتر و تأخیر کمتری دارد و برای وظایف STEM و حل مشکلات منطقی توصیه میشود.
- پشتیبانی از Search: ادغام اولیه با موتور جستجو باعث شده تا پاسخهای بهروز همراه با لینک منابع وب فراهم شود.
بررسی عملکرد مدلهای OpenAI o3-mini و o3-mini-high
مقایسه با DeepSeek R1
با ورود DeepSeek R1، بازار شاهد مدلهای قدرتمند رایگان دیگری هم بود. برای رقابت، OpenAI تصمیم گرفت o3-mini را رایگان عرضه کند. این اقدام باعث میشود اکنون کاربران آزادانه بین دو گزینه جذاب انتخاب داشته باشند:
- DeepSeek R1: مدل استدلالی در سطح o1، رایگان برای همه
- OpenAI o3-mini: مدل استدلالی مقرونبهصرفه، اکنون رایگان برای همه
نتایج کلیدی در بنچمارکها
-
AIME 2024 (مسابقات ریاضی رقابتی)
- o3-mini با سطح تلاش متوسط (medium) تقریباً به عملکرد o1 میرسد و در سطح بالا (high) نتایج بهتری هم ارائه میدهد.
-
Codeforces (مسابقات کدنویسی رقابتی)
- o3-mini در تمام حالات از o1-mini بهتر عمل میکند و در سطح تلاش متوسط با o1 برابری دارد.
-
SWE-bench Verified (آزمون مهندسی نرمافزار)
- o3-mini بالاترین عملکرد را در بین مدلهای فعلی کسب کرده است و با سطح تلاش بالا (high) حتی نتایج بهتری نیز به دست میآورد.
-
GPQA Diamond (سؤالات سطح دکترا در علوم زیستی، شیمی و فیزیک)
- o3-mini در سطح تلاش پایین، بالاتر از o1-mini و در سطح تلاش بالا، نزدیک به o1 عمل میکند.
- o3-mini-high در بیشتر بنچمارکها بهتر از o1 عمل میکند، اما در همین آزمون GPQA Diamond گاهی o1 عملکرد بهتری دارد.
Competition Math (AIME 2024)

سرعت و کارایی (Latency & Efficiency)
- در تستهای A/B، o3-mini پاسخها را بهطور میانگین ۲۴٪ سریعتر از o1-mini ارائه میدهد (۷.۷ ثانیه در برابر ۱۰.۱۶ ثانیه).
- مدل o3-mini (medium) حدود ۲۵۰۰ میلیثانیه سریعتر به نخستین توکن پاسخ میدهد.
- در مقایسه با GPT-4o، o3-mini از لحاظ تأخیر بسیار نزدیک عمل میکند که پیشرفت بزرگی محسوب میشود.
Latency comparison between o1-mini and o3-mini (medium)

ایمنی (Safety)
برای اطمینان از پاسخهای ایمن، از رویکرد Deliberative Alignment (ترازسازی متفکرانه) استفاده کردهایم. همانطور که در مدل OpenAI o1 شاهد بودیم، o3-mini نیز در ارزیابیهای Safety و جلوگیری از Jailbreak نتایج قابلتوجهی کسب کرده است.
- در ارزیابی محتوای ممنوعه (Disallowed Content Evaluations)، این مدل مدیریت خوبی نشان داده است.
- در Jailbreak Evaluations، نرخ موفقیت حملات را بهطور محسوسی کاهش داده و پاسخهای ایمنتری ارائه داده است.
پیش از انتشار عمومی، ریسکهای ایمنی o3-mini مانند بررسی آمادگی (Preparedness)، Red-Teaming خارجی (External Red-Teaming) و ارزیابیهای چندگانه بررسی شدند. برای جزئیات بیشتر، میتوانید به o3-mini system card (کارت سیستمی o3-mini) مراجعه کنید.
Disallowed content evaluations

نتیجهگیری نهایی
OpenAI o3-mini با ویژگیهای استثنایی در Cost-Effective Reasoning (استدلال مقرونبهصرفه)، توانایی بالا در STEM (علوم، ریاضی و کدنویسی)، سرعت پاسخگویی بهتر و هزینه پایین، تجربه جدیدی را برای کاربران رایگان و پولی ChatGPT فراهم کرده است. همزمان، ورود DeepSeek R1 به بازار نشان میدهد که رقابت در فضای هوش مصنوعی داغتر از همیشه است و این به نفع کاربران خواهد بود.
با کاهش ۹۵٪ هزینه هر توکن از زمان معرفی GPT-4، OpenAI همچنان به پیشرفت مدلهایش متعهد است تا هوش مصنوعی پیشرفته، مقرونبهصرفه و ایمن برای همگان در دسترس باشد. اگر کاربر رایگان ChatGPT هستید، هماکنون میتوانید از o3-mini استفاده کنید. برای کاربران پولی نیز o3-mini-high در دسترس است تا با سرعت و هوشمندی بیشتر، پیچیدهترین مسائل را حل کنند.