اخبار تکنولوژی
اخبار تکنولوژی در یک ماه اخیر
شماره 1 – LongCat-Flash-Thinking: مدل استدلال متنباز پیشرو
شرکت Meituan چین در ۲۳ سپتامبر ۲۰۲۵ مدل LongCat-Flash-Thinking را معرفی کرد، یک مدل استدلال متنباز با ۵۶۰ میلیارد پارامتر که تنها ۲۷ میلیارد پارامتر را در هر توکن فعال میکند. این مدل در بنچمارکهای ریاضی نتایج برجستهای کسب کرد و به ۹۹.۲ درصد در MATH500 رسید که عملاً با GPT-5 برابری میکند. ویژگی کلیدی این مدل کارایی استثنایی آن در استدلال عاملی است که مصرف توکن متوسط را ۶۴.۵ درصد کاهش میدهد. مدل با استفاده از روشهای آموزشی پیشرفته شامل یادگیری تقویتی در مقیاس بزرگ و یک سیستم DORA که سرعت آموزش را سه برابر میکند، توسعه یافته است. LongCat-Flash-Thinking به صورت متنباز تحت مجوز MIT منتشر شده و از طریق API با سهمیه رایگان ۵۰۰,۰۰۰ توکن در روز در دسترس است.
شماره 2 – DeepSeek-V3.1-Terminus: بهبود در استفاده از ابزار و سازگاری زبانی
DeepSeek در ۲۳ سپتامبر ۲۰۲۵ نسخه DeepSeek-V3.1-Terminus را معرفی کرد که بر بهبود استفاده عاملی از ابزارها و کاهش اشتباهات ترکیب زبانها تمرکز دارد. در بنچمارکها، Terminus بهبودهای قابل توجهی در SimpleQA (۹۶.۸ در مقابل ۹۳.۴) و BrowseComp (۳۸.۵ در مقابل ۳۰.۰) نشان داد. مدل در دو حالت عملیاتی ارائه میشود: deepseek-chat برای وظایف سریع با قابلیت فراخوانی تابع، و deepseek-reasoner برای استدلال عمیقتر با پشتیبانی از ۱۲۸,۰۰۰ توکن زمینه. این مدل به صورت کاملاً متنباز تحت مجوز MIT منتشر شده و از طریق Hugging Face، DashScope و APIهای شخص ثالث قابل دسترسی است. قیمتگذاری API بر اساس استفاده از توکن است: ۰.۰۷ دلار به ازای میلیون توکن ورودی (cache hit) و ۱.۶۸ دلار به ازای میلیون توکن خروجی.
شماره 3 – RexBERT: انکودر تخصصی برای تجارت الکترونیک
RexBERT در ۲۰ سپتامبر ۲۰۲۵ معرفی شد، یک خانواده مدلهای انکودر متنی تخصصی برای تجارت الکترونیک که بر روی ۲.۳+ تریلیون توکن آموزش دیدهاند. این مدلها معماری ModernBERT را با یک فرآیند پیشآموزش سهمرحلهای ترکیب میکنند: Pre-training عمومی، Context Extension، و Decay بر روی ۳۵۰ میلیارد توکن خاص تجارت الکترونیک. RexBERT با ۲-۳ برابر کمتر پارامتر، عملکرد بهتری نسبت به انکودرهای عمومی مانند سری ModernBERT در وظایف خاص دامنه ارائه میدهد. همراه با مدل، مجموعه داده Ecom-niverse با ۳۵۰ میلیارد توکن از منابع متنی متنوع تجارت الکترونیک نیز منتشر شده است. مدل برای کاربردهایی مانند جستجوی محصول، استخراج ویژگیها، طبقهبندی و وظایف embedding بهینه شده و به صورت متنباز در Hugging Face قابل دسترسی است.
شماره 4 – Qwen3-TTS-Flash: موتور تبدیل متن به گفتار چندزبانه
Qwen در ۲۲ سپتامبر ۲۰۲۵ مدل Qwen3-TTS-Flash را معرفی کرد، یک موتور تبدیل متن به گفتار نسل بعدی که برای زبانهای چینی و انگلیسی بهینه شده است. مدل ۱۷ صدای پیشتنظیم شده را در ۱۰ زبان پشتیبانی میکند و از ۹+ گویش چینی شامل کانتونی، هوکین و سیچوانی پشتیبانی میکند. Qwen3-TTS-Flash با تاخیر فوقالعاده کم ۹۷ میلیثانیه برای اولین بسته، قابلیت تطبیق خودکار لحن و مدیریت قوی متن را ارائه میدهد. بنچمارکها نشان میدهند که این مدل نرخ خطای کلمه (WER) پیشرو در صنعت را برای زبانهای چینی، انگلیسی، ایتالیایی و فرانسوی دارد و از رقبایی مانند SeedTTS، MiniMax و GPT-4o Audio Preview پیشی میگیرد. مدل از طریق پلتفرم DashScope ابری Alibaba با قیمت ۰.۸ یوان (حدود ۱۵ سنت) به ازای ۱۰,۰۰۰ کاراکتر قابل دسترسی است.
شماره 5 – Qwen3-Omni: مدل چندوجهی یکپارچه
Qwen3-Omni در سپتامبر ۲۰۲۵ به عنوان یک مدل پایه چندوجهی end-to-end معرفی شد که قادر به درک متن، صدا، تصویر و ویدیو و تولید پاسخهای جریانی در متن و گفتار طبیعی در زمان واقعی است. مدل ۱۱۹ زبان برای متن، ۱۹ زبان برای ورودی گفتار و ۱۰ زبان برای خروجی گفتار را پردازش میکند، با تاخیر قابل توجه ۲۱۱ میلیثانیه برای پاسخها. Qwen3-Omni در ۲۲ مورد از ۳۶ بنچمارک صوتی و صوتی-تصویری عملکرد پیشرو در صنعت (SOTA) را به دست آورده و شامل ویژگیهایی مانند کنترل انعطافپذیر از طریق system prompts و فراخوانی ابزار داخلی است. Qwen نسخههای متنباز مانند Qwen3-Omni-30B-A3B-Instruct برای دنبال کردن دستورات و Qwen3-Omni-30B-A3B-Thinking برای استدلال پیشرفته را منتشر کرده است. معماری بر اساس چارچوب Thinker-Talker با ارتقاهایی مانند جایگزینی انکودر صوتی Whisper با Audio Transformer ساخته شده است.
شماره 6 – Perplexity Email Assistant: دستیار هوش مصنوعی برای مدیریت ایمیل
Perplexity در ۲۲ سپتامبر ۲۰۲۵ Email Assistant را راهاندازی کرد، یک ابزار AI که مستقیماً با حسابهای Gmail و Outlook یکپارچه میشود و وظایف ایمیل را خودکار میکند. دستیار میتواند پیشنویسهای ایمیل را با لحن و سبک مکالمه کاربر بنویسد، پیامها را سازماندهی کند، زمانهای جلسه را پیشنهاد دهد و در رشتههای ایمیل شرکت کند. کاربران میتوانند با CC کردن [email protected] در هر رشته ایمیل، دستیار را فعال کنند که سپس دسترسی به تقویم، تواناییهای مدیریت در دسترس و برچسبگذاری خودکار را دارد. Perplexity تأکید میکند که Email Assistant از نظر امنیتی با SOC 2 و GDPR سازگار است و هرگز بر روی دادههای کاربر آموزش نمیبیند. این ویژگی به طور انحصاری برای اشتراک Max Perplexity با قیمت ۲۰۰ دلار در ماه در دسترس است که یک قیمت پرمیوم برای کاربران سازمانی و اجرایی است.


