تغییر بزرگتری در فناوری اعلام شده است

اخبار

admiin 27 مهر1402 بدون نظر

facebook

Twitter

facebook

Gmail

اخبار تکنولوژی

اخبار تکنولوژی در یک ماه اخیر

شماره 1 – LongCat-Flash-Thinking: مدل استدلال متن‌باز پیشرو

شرکت Meituan چین در ۲۳ سپتامبر ۲۰۲۵ مدل LongCat-Flash-Thinking را معرفی کرد، یک مدل استدلال متن‌باز با ۵۶۰ میلیارد پارامتر که تنها ۲۷ میلیارد پارامتر را در هر توکن فعال می‌کند. این مدل در بنچمارک‌های ریاضی نتایج برجسته‌ای کسب کرد و به ۹۹.۲ درصد در MATH500 رسید که عملاً با GPT-5 برابری می‌کند. ویژگی کلیدی این مدل کارایی استثنایی آن در استدلال عاملی است که مصرف توکن متوسط را ۶۴.۵ درصد کاهش می‌دهد. مدل با استفاده از روش‌های آموزشی پیشرفته شامل یادگیری تقویتی در مقیاس بزرگ و یک سیستم DORA که سرعت آموزش را سه برابر می‌کند، توسعه یافته است. LongCat-Flash-Thinking به صورت متن‌باز تحت مجوز MIT منتشر شده و از طریق API با سهمیه رایگان ۵۰۰,۰۰۰ توکن در روز در دسترس است.

شماره 2 – DeepSeek-V3.1-Terminus: بهبود در استفاده از ابزار و سازگاری زبانی

DeepSeek در ۲۳ سپتامبر ۲۰۲۵ نسخه DeepSeek-V3.1-Terminus را معرفی کرد که بر بهبود استفاده عاملی از ابزارها و کاهش اشتباهات ترکیب زبان‌ها تمرکز دارد. در بنچمارک‌ها، Terminus بهبودهای قابل توجهی در SimpleQA (۹۶.۸ در مقابل ۹۳.۴) و BrowseComp (۳۸.۵ در مقابل ۳۰.۰) نشان داد. مدل در دو حالت عملیاتی ارائه می‌شود: deepseek-chat برای وظایف سریع با قابلیت فراخوانی تابع، و deepseek-reasoner برای استدلال عمیق‌تر با پشتیبانی از ۱۲۸,۰۰۰ توکن زمینه. این مدل به صورت کاملاً متن‌باز تحت مجوز MIT منتشر شده و از طریق Hugging Face، DashScope و APIهای شخص ثالث قابل دسترسی است. قیمت‌گذاری API بر اساس استفاده از توکن است: ۰.۰۷ دلار به ازای میلیون توکن ورودی (cache hit) و ۱.۶۸ دلار به ازای میلیون توکن خروجی.

شماره 3 – RexBERT: انکودر تخصصی برای تجارت الکترونیک

RexBERT در ۲۰ سپتامبر ۲۰۲۵ معرفی شد، یک خانواده مدل‌های انکودر متنی تخصصی برای تجارت الکترونیک که بر روی ۲.۳+ تریلیون توکن آموزش دیده‌اند. این مدل‌ها معماری ModernBERT را با یک فرآیند پیش‌آموزش سه‌مرحله‌ای ترکیب می‌کنند: Pre-training عمومی، Context Extension، و Decay بر روی ۳۵۰ میلیارد توکن خاص تجارت الکترونیک. RexBERT با ۲-۳ برابر کمتر پارامتر، عملکرد بهتری نسبت به انکودرهای عمومی مانند سری ModernBERT در وظایف خاص دامنه ارائه می‌دهد. همراه با مدل، مجموعه داده Ecom-niverse با ۳۵۰ میلیارد توکن از منابع متنی متنوع تجارت الکترونیک نیز منتشر شده است. مدل برای کاربردهایی مانند جستجوی محصول، استخراج ویژگی‌ها، طبقه‌بندی و وظایف embedding بهینه شده و به صورت متن‌باز در Hugging Face قابل دسترسی است.

شماره 4 – Qwen3-TTS-Flash: موتور تبدیل متن به گفتار چندزبانه

Qwen در ۲۲ سپتامبر ۲۰۲۵ مدل Qwen3-TTS-Flash را معرفی کرد، یک موتور تبدیل متن به گفتار نسل بعدی که برای زبان‌های چینی و انگلیسی بهینه شده است. مدل ۱۷ صدای پیش‌تنظیم شده را در ۱۰ زبان پشتیبانی می‌کند و از ۹+ گویش چینی شامل کانتونی، هوکین و سیچوانی پشتیبانی می‌کند. Qwen3-TTS-Flash با تاخیر فوق‌العاده کم ۹۷ میلی‌ثانیه برای اولین بسته، قابلیت تطبیق خودکار لحن و مدیریت قوی متن را ارائه می‌دهد. بنچمارک‌ها نشان می‌دهند که این مدل نرخ خطای کلمه (WER) پیشرو در صنعت را برای زبان‌های چینی، انگلیسی، ایتالیایی و فرانسوی دارد و از رقبایی مانند SeedTTS، MiniMax و GPT-4o Audio Preview پیشی می‌گیرد. مدل از طریق پلتفرم DashScope ابری Alibaba با قیمت ۰.۸ یوان (حدود ۱۵ سنت) به ازای ۱۰,۰۰۰ کاراکتر قابل دسترسی است.

شماره 5 – Qwen3-Omni: مدل چندوجهی یکپارچه

Qwen3-Omni در سپتامبر ۲۰۲۵ به عنوان یک مدل پایه چندوجهی end-to-end معرفی شد که قادر به درک متن، صدا، تصویر و ویدیو و تولید پاسخ‌های جریانی در متن و گفتار طبیعی در زمان واقعی است. مدل ۱۱۹ زبان برای متن، ۱۹ زبان برای ورودی گفتار و ۱۰ زبان برای خروجی گفتار را پردازش می‌کند، با تاخیر قابل توجه ۲۱۱ میلی‌ثانیه برای پاسخ‌ها. Qwen3-Omni در ۲۲ مورد از ۳۶ بنچمارک صوتی و صوتی-تصویری عملکرد پیشرو در صنعت (SOTA) را به دست آورده و شامل ویژگی‌هایی مانند کنترل انعطاف‌پذیر از طریق system prompts و فراخوانی ابزار داخلی است. Qwen نسخه‌های متن‌باز مانند Qwen3-Omni-30B-A3B-Instruct برای دنبال کردن دستورات و Qwen3-Omni-30B-A3B-Thinking برای استدلال پیشرفته را منتشر کرده است. معماری بر اساس چارچوب Thinker-Talker با ارتقاهایی مانند جایگزینی انکودر صوتی Whisper با Audio Transformer ساخته شده است.

شماره 6 – Perplexity Email Assistant: دستیار هوش مصنوعی برای مدیریت ایمیل

Perplexity در ۲۲ سپتامبر ۲۰۲۵ Email Assistant را راه‌اندازی کرد، یک ابزار AI که مستقیماً با حساب‌های Gmail و Outlook یکپارچه می‌شود و وظایف ایمیل را خودکار می‌کند. دستیار می‌تواند پیش‌نویس‌های ایمیل را با لحن و سبک مکالمه کاربر بنویسد، پیام‌ها را سازماندهی کند، زمان‌های جلسه را پیشنهاد دهد و در رشته‌های ایمیل شرکت کند. کاربران می‌توانند با CC کردن [email protected] در هر رشته ایمیل، دستیار را فعال کنند که سپس دسترسی به تقویم، توانایی‌های مدیریت در دسترس و برچسب‌گذاری خودکار را دارد. Perplexity تأکید می‌کند که Email Assistant از نظر امنیتی با SOC 2 و GDPR سازگار است و هرگز بر روی داده‌های کاربر آموزش نمی‌بیند. این ویژگی به طور انحصاری برای اشتراک Max Perplexity با قیمت ۲۰۰ دلار در ماه در دسترس است که یک قیمت پرمیوم برای کاربران سازمانی و اجرایی است.