اولین مدل متن باز OpenAI بعد از 6 سال (GPT-OSS)

اولین مدل متن باز OpenAI بعد از 6 سال (GPT-OSS) SSO پلاس

مقدمه

عرضه مدل‌های GPT-OSS توسط شرکت OpenAI در تاریخ ۵ اوت ۲۰۲۵، نقطه عطفی در تاریخ هوش مصنوعی به‌شمار می‌آید و بازگشت مهمی به سمت مدل‌های با وزن باز پس از پنج سال انتشار مدل‌های عمدتاً بسته محسوب می‌شود.

OpenAI ابتدا در سال ۲۰۱۹ با GPT-2 به پیشرفت‌های بزرگی دست یافت، اما پس از آن به مدل‌های بسته روی آورد. با این حال، تقاضای جهانی رو به رشدی برای شفافیت بیشتر، قابلیت شخصی‌سازی و اجرای محلی مدل‌ها، منجر به معرفی GPT-OSS شد؛ دو مدل با مجوز Apache 2.0 با نام‌های GPT-OSS-120b و GPT-OSS-20b. این مدل‌ها به پژوهشگران، توسعه‌دهندگان و کسب‌وکارها اجازه می‌دهند تا مدل‌ها را دانلود، بررسی، اصلاح و بر روی سخت‌افزار شخصی خود بهینه‌سازی کنند و وابستگی به راهکارهای ابری را کاهش دهند.

مشخصات سریع

مدل تعداد پارامترها نیازمندی حافظه GPU مجوز
GPT-OSS-120b ۱۲۰ میلیارد ۸۰ گیگابایت Apache 2.0
GPT-OSS-20b ۲۰ میلیارد ۱۶ گیگابایت Apache 2.0

از فضای ابری به محلی GPT-OSS

از ابر به لوکال: مشخصات مدل و گزینه‌های پیاده‌سازی

  • GPT-OSS-120b: دارای ۱۲۰ میلیارد پارامتر؛ نیازمند حدود ۸۰ گیگابایت حافظه GPU.

  • GPT-OSS-20b: دارای ۲۰ میلیارد پارامتر؛ بهینه‌شده برای GPUهای ۱۶ گیگابایتی.

  • مجوز Apache 2.0 برای تسهیل شفافیت و شخصی‌سازی.

  • این دو مدل عملکردی تقریباً هم‌ارز با o4‑mini و o3‑mini ارائه می‌دهند.

  • دسترسی آسان از طریق Hugging Face، Azure AI Foundry، AWS، و Databricks فراهم شده و مجوز Apache 2.0 اجازه کاربرد تجاری و سفارشی‌سازی وسیع را می‌دهد

مزایای جامعه هوش مصنوعی با عرضه GPT-OSS

دموکراتیزه کردن هوش مصنوعی

  • اجرای مقرون‌به‌صرفه و شخصی‌سازی مدل‌ها بر روی سخت‌افزار محلی.

  • سرعت‌بخشی به نوآوری از طریق همکاری آزاد.

  • توانمندسازی کسب‌وکارهای کوچک‌تر، مراکز آموزشی و پژوهشگران مستقل.

چالش‌ها و محدودیت‌های فنی

عملکرد و ایمنی و خطرات بالقوه GPT-OSS 

  • اگرچه GPT‑OSS در معیارهای استنتاج عملکردی نزدیک به مدل‌های بسته دارد، در برخی آزمون‌ها مانند PersonQA کمی فاصله عملکردی مشاهده شده است.

  • OpenAI ادعا کرده این مدل‌ها با دقیق‌ترین آزمایش‌های ایمنی تست شده‌اند و حتی نسخه‌های دستکاری‌شده با اهداف مخرب نیز ناکارآمد شناخته شده‌اند؛ با این حال، نگرانی در مورد سوءاستفاده و حملات jailbreak همچنان مطرح است.

چشم‌انداز آینده

تأثیرات اجتماعی و رقابتی

  • با انتشار این مدل‌ها، OpenAI قصد دارد فضای رقابت با META (مدل LLaMA) و شرکت‌های چینی مانند DeepSeek را بازتر کند؛ مدلی که در ژانویه همین سال منتشر شد و عملکردی رقابتی داشت.
  • افزایش استفاده از معماری‌های MoE (Mixture-of-Experts) و بهینه‌سازی‌های دقت ترکیبی و مشارکت فعال جامعه جهانی انتظار می‌رود.

کاربرد عملی GPT-OSS

  • استفاده عملی و بهینه‌سازی زودهنگام GPT-OSS برای کاربردهای تخصصی صنعتی، با نمایش مزایای فوری و قابلیت شخصی‌سازی.

یکی از شرکت‌های نوپا در حوزه پزشکی، پس از دانلود مدل GPT‑OSS‑20b، آن را برای تحلیل داده‌های تخصصی بیماران آموزش داده و توانسته سرعت پردازش را افزایش دهد و وابستگی به سرورهای مرکزی را کاهش دهد. این نمونه به روشنی نشان می‌دهد که نسخه سبک‌تر چگونه مزیت جابه‌جایی و سفارشی‌سازی فوری را به‌همراه دارد.

نتیجه‌گیری 


GPT-OSS نه تنها هوش مصنوعی با وزن باز را احیا می‌کند، بلکه مسیر آینده توسعه هوش مصنوعی را متحول می‌سازد. ماهیت شفاف و قابلیت اجرای محلی آن مزایای عملیاتی قابل توجهی همچون کاهش هزینه‌ها و فرصت‌های نوآوری فراهم می‌کند. با این وجود، ذی‌نفعان باید با چالش‌های سخت‌افزاری و مسائل ایمنی همچون آسیب‌پذیری در برابر jailbreak و… مواجه شوند. با تشویق مشارکت فعال در ارزیابی‌های متن‌باز و تطبیق با زیرساخت‌های ترکیبی (hybrid) هوش مصنوعی، GPT-OSS نوید پیشرفت سریع‌تر و مشارکتی‌تر در حوزه هوش مصنوعی را می‌دهد و استاندارد جدیدی را در اکوسیستم مدل‌های باز تعریف می‌کند.

خلاصه نکات کلیدی

  • اولین انتشار مدل متن کامل OpenAI در بازه‌ای بیش از پنج سال.

  • دسترسی و قابلیت اجرا محلی روی سخت‌افزار معمولی بدون نیاز به ابر.

  • عملکرد رقابتی با مدل‌های بسته قدیمی شرکت.

  • تحریک نوآوری از طریق مدل‌های سبک‌تر قابل شخصی‌سازی.

  • نیاز به توجه ایمنی چون خطر سوءاستفاده یا تولید محتوا اشتباه.

  • حرکت رهبرانه‌ای در رقابت جهانی هوش مصنوعی برابر META و DeepSeek.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *