به گزارش سایت خبری وی دنج، استارتاپ فرانسوی Mistral که به عنوان یکی از پیشروان هوش مصنوعی در اروپا شناخته میشود، مدل جدیدی به نام Pixtral 12B را معرفی کرده که توانایی پردازش همزمان تصاویر و متن را داراست. این مدل با ۱۲ میلیارد پارامتر ساخته شده و حجمی حدود ۲۴ گیگابایت دارد. Mistral این مدل را برای استفاده تحقیقاتی و آکادمیک به صورت رایگان در دسترس قرار داده است، اما برای استفاده تجاری نیاز به مجوز پرداختی دارد. Pixtral 12B روی پلتفرمهای معروفی مانند GitHub و Hugging Face قابل دانلود و تنظیم است.
دسترسی سریع به مطالب
اهمیت پارامترها در مدلهای هوش مصنوعی
مدلهای هوش مصنوعی بر اساس تعداد پارامترهای خود ارزیابی میشوند. پارامترها به نوعی نشانگر توانایی حل مسئله یک مدل هستند و مدلهایی که تعداد بیشتری پارامتر دارند، معمولاً عملکرد بهتری نسبت به مدلهای با پارامترهای کمتر دارند. مدل Pixtral 12B با ۱۲ میلیارد پارامتر خود، یکی از مدلهای پیشرفتهای است که توانایی پردازش و تحلیل دادههای پیچیده را داراست.
قابلیتهای جدید Pixtral 12B
Pixtral 12B بر پایه مدل متنمحور Nemo 12B ساخته شده و میتواند به سؤالات مرتبط با تصاویر پاسخ دهد. این مدل میتواند تصاویر با هر اندازهای را از طریق آدرسهای اینترنتی (URLs) یا بهصورت کدگذاری شده با فرمت base64 پردازش کند. این ویژگی مشابه با دیگر مدلهای چندوجهی (multimodal) مانند خانواده Claude از شرکت Anthropic و GPT-4 است.
از جمله وظایفی که این مدل میتواند انجام دهد، میتوان به تولید توضیحات برای تصاویر (captioning) و شمارش تعداد اشیاء موجود در یک تصویر اشاره کرد. این قابلیتها، Pixtral 12B را به ابزاری قدرتمند برای کاربران حرفهای و توسعهدهندگان تبدیل میکند که به دنبال تحلیل دادههای چندوجهی هستند.
دسترسی به Pixtral 12B و چالشهای موجود
هرچند Pixtral 12B بهتازگی معرفی شده، اما هنوز هیچ نمونهای از نسخههای نمایشی (demos) آنلاین این مدل برای استفاده عمومی وجود ندارد. با این حال، Sophia Yang، مسئول روابط توسعهدهندگان Mistral، اعلام کرده است که Pixtral 12B به زودی در پلتفرمهای چتبات و API این شرکت به نامهای Le Chat و Le Platforme در دسترس خواهد بود.
منبع دادهها و چالشهای حقوقی
هنوز مشخص نیست که Mistral از چه دادههایی برای توسعه Pixtral 12B استفاده کرده است. بیشتر مدلهای مولد هوش مصنوعی با استفاده از حجم وسیعی از دادههای عمومی از اینترنت آموزش میبینند. با این حال، برخی از این دادهها ممکن است شامل محتوای دارای حق نشر باشند. بسیاری از شرکتهای ارائهدهنده مدلهای هوش مصنوعی استدلال میکنند که استفاده از این دادهها تحت قوانین “استفاده منصفانه” مجاز است، اما صاحبان حقوق کپی رایت مخالف این موضوع هستند و پروندههای حقوقی متعددی علیه شرکتهای بزرگی مانند OpenAI و Midjourney برای توقف این روند ثبت شده است.
این چالشها نشان میدهد که توسعه مدلهای هوش مصنوعی مولد با استفاده از دادههای عمومی همچنان یک مسئله بحثبرانگیز است که ممکن است در آینده تغییرات مهمی در روند آموزش و توسعه این مدلها ایجاد کند.
استراتژی Mistral و جایگاه آن در دنیای هوش مصنوعی
Mistral تنها یک سال است که به عنوان یک استارتاپ فعال در حوزه هوش مصنوعی شناخته میشود، اما با سرعتی چشمگیر به یکی از بازیگران اصلی این صنعت در اروپا تبدیل شده است. این شرکت بهتازگی در یک دوره جذب سرمایه موفق به جمعآوری ۶۴۵ میلیون دلار شده است که ارزش آن را به ۶ میلیارد دلار رسانده است. این سرمایهگذاری بزرگ، نشانهای از اعتماد سرمایهگذاران به استراتژی و آینده Mistral است.
استراتژی Mistral شامل انتشار مدلهای “باز” و رایگان برای تحقیقات و استفادههای غیرتجاری است، در حالی که مدلهای مدیریتشده و خدمات مشاورهای برای مشتریان شرکتی در دسترس قرار میگیرد. این رویکرد میتواند Mistral را به یکی از رقبای جدی OpenAI در اروپا تبدیل کند.
آینده Pixtral 12B و نقش آن در توسعه هوش مصنوعی
معرفی Pixtral 12B نشاندهنده تمرکز Mistral بر توسعه مدلهای چندوجهی است که میتوانند همزمان با دادههای تصویری و متنی کار کنند. این نوع مدلها کاربردهای گستردهای در حوزههایی مانند پزشکی، تجارت الکترونیک، تولید محتوای دیجیتال و تحلیل دادههای بزرگ دارند. به عنوان مثال، در صنعت پزشکی، مدلهایی مانند Pixtral 12B میتوانند به تحلیل تصاویر پزشکی و ارائه توضیحات دقیق کمک کنند. در تجارت الکترونیک نیز این مدلها میتوانند به بهبود جستجوهای تصویری و توصیف کالاها کمک کنند.
با توجه به پیشرفت سریع Mistral و رشد سرمایهگذاریها در این حوزه، انتظار میرود که این شرکت به توسعه بیشتر مدلهای هوش مصنوعی بپردازد و جایگاه خود را در بازار جهانی تقویت کند.
نتیجهگیری
Pixtral 12B به عنوان یکی از مدلهای پیشرفته هوش مصنوعی، قابلیتهای جدیدی را برای کاربران به ارمغان آورده است. توانایی پردازش همزمان تصاویر و متن، این مدل را به یک ابزار قدرتمند برای تحلیل دادههای چندوجهی تبدیل میکند. با وجود چالشهای حقوقی مرتبط با دادههای آموزشی، Mistral همچنان به توسعه مدلهای نوآورانه ادامه میدهد و استراتژیهای خود را برای مقابله با این چالشها تدوین میکند.
آینده Mistral و Pixtral 12B روشن به نظر میرسد، بهویژه با توجه به سرمایهگذاریهای اخیر و تمرکز این شرکت بر توسعه مدلهای باز و چندوجهی. این استارتاپ فرانسوی به سرعت در حال تبدیل شدن به یکی از بازیگران اصلی دنیای هوش مصنوعی است و میتواند نقش مهمی در آینده این صنعت ایفا کند.