جمینی؛ تلاش گوگل برای نسل جدید هوش مصنوعی
جمینی خانواده مدلهای هوش مصنوعی گوگل است که توسط Google DeepMind توسعه یافته و توانایی پردازش همزمان متن، تصویر، صدا، ویدئو و کد را دارد.
به گزارش فصل سوم، این فناوری بهعنوان یکی از مهمترین پروژههای هوش مصنوعی گوگل، در محصولات مختلف این شرکت به کار گرفته شده و نقش کلیدی در رقابت گوگل در حوزه هوش مصنوعی ایفا میکند.
جمینی (Gemini) خانوادهای از مدلهای هوش مصنوعی گوگل است که توسط Google DeepMind توسعه یافته و بهعنوان جانشین مدلهای پیشین این شرکت از جمله PaLM و LaMDA معرفی شده است. این فناوری که ابتدا در قالب چتبات «بارد» در اختیار کاربران قرار گرفت، از سال ۲۰۲۴ با نام جمینی شناخته میشود و به یکی از مهمترین محصولات گوگل در رقابت جهانی هوش مصنوعی تبدیل شده است.
ویژگی اصلی جمینی، چندوجهی بودن (Multimodal) آن است؛ به این معنا که میتواند بهطور همزمان متن، تصویر، صدا، ویدئو و کدهای برنامهنویسی را پردازش و تولید کند. گوگل این مدلها را در نسخههای مختلفی از جمله Nano، Pro، Ultra و Flash عرضه کرده تا نیازهای متنوع کاربران، توسعهدهندگان و کسبوکارها را پوشش دهد.
جمینی در بسیاری از محصولات و خدمات گوگل ادغام شده و در ابزارهایی مانند موتور جستوجو، تلفنهای هوشمند اندرویدی و دستیارهای هوشمند به کار گرفته میشود. گوگل هدف از توسعه این فناوری را ایجاد تعامل طبیعیتر میان انسان و رایانه و افزایش توانایی سیستمهای هوشمند در درک و پردازش اطلاعات عنوان کرده است.
با این حال، مسیر توسعه جمینی بدون چالش نبوده است. این محصول از زمان معرفی با انتقادهایی درباره دقت پاسخها، تولید اطلاعات نادرست و برخی خطاهای مرتبط با تولید تصویر مواجه شد. گوگل در واکنش به این انتقادها، بخشی از قابلیتهای سیستم را بازنگری و اصلاح کرد و اعلام کرد که توسعه و بهبود مدلها بهصورت مستمر ادامه خواهد یافت.
امروزه جمینی یکی از مهمترین سرمایهگذاریهای گوگل در حوزه هوش مصنوعی محسوب میشود و نقش محوری در راهبرد این شرکت برای رقابت با سایر بازیگران بزرگ این صنعت ایفا میکند. روند توسعه این فناوری نشان میدهد که گوگل قصد دارد هوش مصنوعی را به بخش جداییناپذیر خدمات و محصولات آینده خود تبدیل کند.