جمینی؛ تلاش گوگل برای نسل جدید هوش مصنوعی

جمینی خانواده مدل‌های هوش مصنوعی گوگل است که توسط Google DeepMind توسعه یافته و توانایی پردازش همزمان متن، تصویر، صدا، ویدئو و کد را دارد.

به گزارش فصل سوم، این فناوری به‌عنوان یکی از مهم‌ترین پروژه‌های هوش مصنوعی گوگل، در محصولات مختلف این شرکت به کار گرفته شده و نقش کلیدی در رقابت گوگل در حوزه هوش مصنوعی ایفا می‌کند.

جمینی (Gemini) خانواده‌ای از مدل‌های هوش مصنوعی گوگل است که توسط Google DeepMind توسعه یافته و به‌عنوان جانشین مدل‌های پیشین این شرکت از جمله PaLM و LaMDA معرفی شده است. این فناوری که ابتدا در قالب چت‌بات «بارد» در اختیار کاربران قرار گرفت، از سال ۲۰۲۴ با نام جمینی شناخته می‌شود و به یکی از مهم‌ترین محصولات گوگل در رقابت جهانی هوش مصنوعی تبدیل شده است.

ویژگی اصلی جمینی، چندوجهی بودن (Multimodal) آن است؛ به این معنا که می‌تواند به‌طور همزمان متن، تصویر، صدا، ویدئو و کدهای برنامه‌نویسی را پردازش و تولید کند. گوگل این مدل‌ها را در نسخه‌های مختلفی از جمله Nano، Pro، Ultra و Flash عرضه کرده تا نیازهای متنوع کاربران، توسعه‌دهندگان و کسب‌وکارها را پوشش دهد.

جمینی در بسیاری از محصولات و خدمات گوگل ادغام شده و در ابزارهایی مانند موتور جست‌وجو، تلفن‌های هوشمند اندرویدی و دستیارهای هوشمند به کار گرفته می‌شود. گوگل هدف از توسعه این فناوری را ایجاد تعامل طبیعی‌تر میان انسان و رایانه و افزایش توانایی سیستم‌های هوشمند در درک و پردازش اطلاعات عنوان کرده است.

با این حال، مسیر توسعه جمینی بدون چالش نبوده است. این محصول از زمان معرفی با انتقادهایی درباره دقت پاسخ‌ها، تولید اطلاعات نادرست و برخی خطاهای مرتبط با تولید تصویر مواجه شد. گوگل در واکنش به این انتقادها، بخشی از قابلیت‌های سیستم را بازنگری و اصلاح کرد و اعلام کرد که توسعه و بهبود مدل‌ها به‌صورت مستمر ادامه خواهد یافت.

امروزه جمینی یکی از مهم‌ترین سرمایه‌گذاری‌های گوگل در حوزه هوش مصنوعی محسوب می‌شود و نقش محوری در راهبرد این شرکت برای رقابت با سایر بازیگران بزرگ این صنعت ایفا می‌کند. روند توسعه این فناوری نشان می‌دهد که گوگل قصد دارد هوش مصنوعی را به بخش جدایی‌ناپذیر خدمات و محصولات آینده خود تبدیل کند.

هوش مصنوعی

اقتصاد

۱۴۰۵/۰۳/۱۶ ۰۹:۵۹:۳۹