علیبابا،از معرفی یک مدل هوش مصنوعی جدید به نام QVQ-Max خبر داده است.
این مدل استدلال بصری به کاربران این امکان را میدهد که علاوه بر تعامل با متن، تصاویر و ویدیوها را نیز درک و تحلیل کنند. به گفته علیبابا، این مدل بهویژه در تجزیه و تحلیل محتوای بصری و شناسایی عناصر کلیدی در تصاویر و ویدیوها توانمند است.
کاربران با استفاده از این مدل میتوانند در زمینههای مختلفی از جمله طراحی تصویر و تولید اسکریپت ویدیو از قابلیتهای آن بهرهبرداری کنند.
هوش مصنوعی QVQ-Max علاوه بر کاربردهای متنی معمولی، قادر است در حل مسائل پیچیده ریاضی و فزیک که شامل نمودارها هستند، یا حتی راهنمایی در پخت غذا با استفاده از تصاویر دستور پخت، کمک کند. این مدل به کاربران کمک میکند تا در محیطهای کاری، آموزشی و حتی زندگی شخصی خود وظایف مختلفی را با استفاده از تواناییهای بصری انجام دهند.
شرکت علیبابا اعلام کرده است که هوش مصنوعی QVQ-Max تنها نسخه اولیه این مدل است و در نسخههای آینده قصد دارد ویژگیهای آن را بهبود بخشد. این شرکت برنامه دارد تا دقت شناسایی تصاویر را بهبود بخشد و قابلیت مدل را برای انجام وظایف چندمرحلهای و پیچیده افزایش دهد. علاوه بر این، علیبابا به دنبال گسترش استفاده از این مدل به ابزارهای تأیید و تولید بصری است.
کاربران برای شروع کار با QVQ-Max میتوانند به وبسایت chat.qwen.ai مراجعه و مدل را از منوی مدلها انتخاب کنند. سپس میتوانند با استفاده از کادر چت، از امکانات بصری این مدل بهرهبرداری نمایند.