مجله همراکت

معرفی هوش مصنوعی جمینی Gemini + نحوه استفاده

هوش مصنوعی جمینی
فهرست مطلب

در دنیایی که هر روز شاهد نوآوری‌های بی‌پایان در عرصه‌ی هوش مصنوعی هستیم، گوگل با رونمایی از هوش مصنوعی جمینی، گامی فراتر از پیش برداشته و طلایه‌دار عصری نو در این حوزه شده است. هوش مصنوعی گوگل جمینی فراتر از یک پلتفرم هوش مصنوعی، یار و همراه‌ای هوشمند است که با قدرت تحلیل، یادگیری و ارائه راه‌حل‌های خلاقانه، در زمینه‌های مختلف یاری‌گر شما خواهد بود. از تجزیه و تحلیل‌های پیچیده داده‌های حجیم گرفته تا خلق محتواهای بدیع و جذاب، جمینی با اتکا به مدل‌های متنوع خود، قدرتی بی‌نظیر را در اختیار شما قرار می‌دهد که تاکنون تجربه نکرده‌اید. در این مقاله، سفری به ژرفای این ابزار شگفت‌انگیز خواهیم داشت و با نحوه‌ کارکرد بهینه و هر آنچه که باید درباره‌ی جمینی بدانید آشنا خواهیم شد.

گوگل جمینی Gemini چیست؟

گوگل جمینی (Gemini)، که قبلاً با نام بارد (Bard) شناخته می‌شد، یک ابزار مبتنی بر هوش مصنوعی (AI) برای گفتگوی ماشینی است که توسط گوگل طراحی شده است. این ابزار با استفاده از پردازش زبان طبیعی (NLP) و یادگیری ماشین، مکالمات انسانی را شبیه‌سازی می‌کند. جمینی علاوه بر تکمیل نتایج جستجوی گوگل، می‌تواند در وب‌سایت‌ها، پلتفرم‌های پیام‌رسانی یا برنامه‌های کاربردی ادغام شود تا پاسخ‌های طبیعی و واقع‌گرایانه به سوالات کاربران ارائه دهد. جمینی گوگل یک مجموعه از مدل‌های بزرگ زبان مصنوعی چندوجهی (Multimodal AI Large Language Models) است که توانایی درک زبان، صوت، کد و ویدیو را دارا می باشد، این قابلیت چندوجهی به جمینی توانایی استدلال چندوجهی (Cross-Modal Reasoning) می‌بخشد، به عبارت دیگر، جمینی می‌تواند بر اساس توالی‌ای از انواع مختلف داده‌های ورودی، از جمله صدا، تصاویر و متن، استدلال کند. برای مثال، جمینی قادر است برای حل مسائل پیچیده، یادداشت‌های دست‌نویس، نمودارها و دیاگرام‌ها را درک کند. معماری این ابزار از ورود مستقیم متن، تصاویر، شکل موج‌های صوتی و فریم‌های ویدیویی به صورت توالی‌های درهم‌آمیخته پشتیبانی می‌کند.

نسخه ۱.۰ جمینی در تاریخ ۶ دسامبر ۲۰۲۳ معرفی شد و توسط واحد کسب‌وکار دیپ‌مایندِ گوگل متعلق به شرکت آلفابت، که بر تحقیق و توسعه هوش مصنوعی پیشرفته تمرکز دارد، ساخته شده است. در کنار سایر کارکنان گوگل، سرگئی برین، هم‌بنیانگذار گوگل، در توسعه مدل‌های بزرگ زبان مصنوعی جمینی مشارکت داشته است. با زمان عرضه، جمینی به عنوان پیشرفته‌ترین مجموعه‌ی مدل‌های بزرگ زبان مصنوعی در گوگل شناخته شد. این مدل پیش از تغییر نام بارد، هسته‌ی اصلی آن بود و مدل پیشین گوگل با نام «مدل زبان مسیرها» را کنار زد.

جزئیات انواع مدل‌های جمینی

در زمان رونمایی جمینی در تاریخ ۶ دسامبر ۲۰۲۳، اعلام شد که این مجموعه از چندین مدل با اندازه‌های مختلف تشکیل شده است که هر کدام برای مجموعه‌ی خاصی از موارد استفاده و محیط‌های استقرار طراحی شده‌اند.

  • مدل Gemini Nano

نسخه بسیار کوچک‌تری از مدل‌های Gemini Pro و Ultra به حساب می‌رود که از خانواده‌ جمینی برای کاربرد بر روی دستگاه‌های هوشمند طراحی شده است. این مدل در دو نسخه‌ی «نانو-۱» با ۱.۸ میلیارد پارامتر و «نانو-۲» با ۳.۲۵ میلیارد پارامتر عرضه می‌شود. از جمله‌ی دستگاه‌هایی که مدل Nano در آن تعبیه شده، تلفن هوشمند گوگل پیکسل ۸ پرو است.

  • مدل Gemini Pro

این مدل بر عملکرد و استقرار در مقیاس بالا تمرکز دارد. از تاریخ ۱۳ دسامبر ۲۰۲۳، گوگل امکان دسترسی به مدل Pro جمنای را از طریق سرویس‌های Google Cloud Vertex AI و Google AI Studio فراهم کرده است. این نسخه رایگان قابل دسترس است و می‌توان برای نوشتن گزارش‌ها، ترجمه متون با حجم متوسط و تولید محتوای خلاقانه استفاده شود، همچنین، نسخه‌ای از مدل Pro جمینی برای پشتیبانی از فناوری کدزنی هوش مصنوعی تولیدکننده‌ (AlphaCode 2) به کار گرفته می‌شود.

  • مدل Gemini Ultra 

قدرتمندترین و تواناترین مدل جمینی است که برای انجام وظایف بسیار پیچیده  با ترکیب دانش ۵۷ حوزه مختلف تحت عنوان ریاضیات، تاریخ، فیزیک، پزشکی، حقوق و اخلاق قادر به انجام آزمون‌های دانش جهانی و حل مسائل پیچیده استطراحی شده است.

قابلیت و کاربرد جمینی گوگل

مدل‌های جمینی گوگل به لطف ماهیت چندوجهی خود توانایی درک در طیف گسترده‌ای از زمینه‌ها کاربرد دارند. این قابلیت حتی امکان ترکیب انواع مختلف ورودی برای تولید خروجی را فراهم می‌کند. در اینجا به برخی از موارد استفاده‌ی جمینی اشاره می‌کنیم:

چند رسانه ای بودن و استدلال

  • تولید محتوا: جمینی می‌تواند در تولید انواع محتوا از جمله متن، کد، اسکریپت، ایمیل، نامه و گزارش به کار گرفته شود.
  • ترجمه زبان: از قابلیت‌های ترجمه چندزبانه‌ی قدرتمندی برخوردار است و می‌تواند به ترجمه دقیق و روان بین زبان‌های مختلف کمک کند.
  • پاسخ به سوالات پیچیده: گوگل جمینی قادر است به پرسش‌های پیچیده و چندوجهی در حوزه‌های مختلف پاسخ دهد.
  • تحلیل داده: با استفاده از جمینی می‌توان داده‌های حجیم و پیچیده را در قالب‌های مختلف از جمله متن، تصویر، صدا و ویدیو تجزیه و تحلیل کرد.
  • خلاصه سازی اطلاعات: می‌توان با کمک جمینی متون، ایمیل‌ها و سایر اطلاعات حجیم را به خلاصه‌های مفید و قابل فهم تبدیل کند.
  • ایجاد رابط‌های کاربری تعاملی: جمینی در طراحی رابط‌های کاربری صوتی و تصویری تعاملی کاربرد دارد.
  • تولید کد: این ابزار به توسعه‌دهندگان کمک می‌کند تا به صورت خودکار کدهای کامپیوتری تولید کنند.
  • آموزش و یادگیری: جمنای‌ میتواند به عنوان یک ابزار آموزشی تعاملی برای دانش‌آموزان و دانشجویان در مقاطع مختلف به کار رود.

مورد استفاده برای کسب‌وکارها

مدل‌های جمینی می‌توانند در راستای بهبود فرآیندهای مختلف کسب‌وکار به کار گرفته شوند. در اینجا به برخی از این موارد استفاده اشاره می‌کنیم:

  • خلاصه‌سازی متن: مدل‌های جمینی قادرند محتوای استخراج‌شده از انواع مختلف داده‌ها را خلاصه کنند. این قابلیت برای سازماندهی ایمیل‌ها، گزارش‌ها و سایر اسناد متنی حجیم کاربرد دارد.
  • تولید متن: جمینی می‌تواند بر اساس دستورات و راهنمایی‌های کاربران، انواع مختلف متن از جمله ایمیل، نامه، اسکریپت و گزارش را تولید کند. همچنین، امکان استفاده از این قابلیت در قالب یک رابط چت‌بات پرسش و پاسخ نیز وجود دارد.
  • ترجمه زبان: قابلیت‌های چندزبانه‌ی قدرتمند جمینی امکان ترجمه دقیق و روان بین بیش از ۱۰۰ زبان را فراهم می‌کند. این قابلیت برای برقراری ارتباط با شرکای تجاری بین‌المللی و ترجمه اسناد و محتوا به زبان‌های مختلف بسیار مفید است.
  • درک تصویر: این ابزار قادر است بدون نیاز به ابزار جانبی تشخیص شخصیت نوری، داده‌های تصویری پیچیده مانند نمودارها، اشکال و دیاگرام‌ها را تجزیه و تحلیل کند. این قابلیت در شرح تصاویر و پاسخ به سؤالات تصویری کاربرد دارد. برای مثال، یک وب‌سایت تجارت الکترونیک می‌تواند از جَمینی برای شرح خودکار تصاویر محصولات استفاده کند.
  • پردازش صدا: جمنای از قابلیت تشخیص گفتار در بیش از ۱۰۰ زبان و همچنین امکان ترجمه صوتی پشتیبانی می‌کند. این قابلیت در مواردی مانند مراکز تماس بین‌المللی، زیرنویس خودکار ویدیوها و رونوشت‌نویسی جلسات کاربرد دارد.
  • درک ویدیو: جمنای می‌تواند فریم‌های ویدیویی را پردازش و درک کند تا به سؤالات پاسخ دهد و توضیحات متنی تولید کند. این قابلیت در تحلیل ویدیوهای آموزشی، تحلیل رفتار مشتری و نظارت امنیتی کاربرد دارد.
  • استدلال چندوجهی: یکی از نقاط قوت کلیدی جمینی، استدلال هوش مصنوعی چندوجهی (Multimodal Reasoning) است. در این شیوه، انواع مختلف داده‌ها مانند متن، تصویر، صدا و ویدیو را می‌توان در یک دستورالعمل ترکیب کرد تا خروجی مورد نظر تولید شود. به عنوان مثال، یک شرکت رسانه‌ای می‌تواند از جمینی برای ایجاد خودکار زیرنویس ویدیو بر اساس متن فیلمنامه و صدای گفتگو استفاده کند.
  • تحلیل و تولید کد: می‌توان کد نوشته شده به زبان‌های برنامه‌نویسی رایج مانند پایتون، جاوا، ++C و Go را درک و توضیح دهد و همچنین کد جدید تولید کند. این قابلیت در خودکارسازی فرآیندهای توسعه نرم‌افزار، رفع باگ‌های کد و ایجاد اسناد فنی کاربرد دارد.

استفاده در محصولات و سرویس‌های گوگل

گوگل جمینی را به عنوان یک مدل پایه توسعه داده است تا به طور گسترده در سرویس‌های مختلف گوگل ادغام شود. همچنین، توسعه‌دهندگان می‌توانند از آن برای ساخت برنامه‌های کاربردی خود استفاده کنند. در اینجا برخی از برنامه‌های کاربردی که از جَمینی بهره می‌برند، آورده شده است:

  • آلفاکد ۲ (AlphaCode 2): ابزار تولید کد آلفاکد ۲ که توسط واحد دیپ‌مایندِ گوگل ساخته شده است، از نسخه‌ی سفارشی‌شده‌ی جمینی پرو استفاده می‌کند.
  • گوگل پیکسل (Google Pixel): گوشی هوشمند پیکسل ۸ پرو ساخت گوگل، اولین دستگاهی است که برای اجرای جمینی نانو طراحی شده است. جمینی قابلیت‌های جدیدی را در برنامه‌های موجود گوگل، مانند خلاصه‌سازی در برنامه‌ی ضبط صدا (Recorder) و پاسخ هوشمند (Smart Reply) در صفحه‌کلید Gboard برای برنامه‌های پیام‌رسان، به کار می‌اندازد.
  • اندروید ۱۴ (Android 14): پیکسل ۸ پرو اولین گوشی هوشمند اندرویدی است که از مزایای جمینی بهره‌مند می‌شود. توسعه‌دهندگان اندروید می‌توانند از طریق قابلیت سیستم هوش مصنوعی هسته (AICore) با جمینی نانو برنامه‌نویسی کنند.
  • استودیوی هوش مصنوعی گوگل (Google AI Studio): توسعه‌دهندگان می‌توانند با استفاده از ابزار تحت وب استودیوی هوش مصنوعی گوگل، نمونه‌های اولیه و برنامه‌هایی با جمینی بسازند.
  • جستجو (Search): گوگل در تلاش است تا از جمینی در تجربه‌ی تولید جستجو برای کاهش تأخیر و ارتقای کیفیت نتایج استفاده کند.

چگونگی عملکرد هوش مصنوعی جمینی گوگل

عملکرد جمینی گوگل بر اساس آموزش اولیه با حجم عظیمی از داده‌ها استوار است. پس از آموزش، این مدل از چندین تکنیک شبکه‌های عصبی برای درک محتوا، پاسخ به سؤالات، تولید متن و خروجی استفاده می‌کند. به‌طور خاص، مدل‌های بزرگ زبان مصنوعی جمینی از معماری شبکه عصبی مبتنی بر مدل ترانسفورماتور بهره می‌برند. این معماری برای پردازش توالی‌های طولانی با زمینه‌های مختلف در انواع گوناگون داده‌ها، از جمله متن، صدا و ویدیو، تقویت شده است. واحد دیپ‌مایندِ گوگل با به‌کارگیری سازوکارهای کارآمد توجه در دیکودرِ ترانسفورماتور، به مدل‌ها در پردازش زمینه‌های طولانی و چندوجهی یاری می‌رساند.

چالش‌های جمینی و رویکرد گوگل برای ایمن‌سازی

یکی از چالش‌های کلیدی مدل‌های بزرگ زبان مصنوعی (LLMs)، خطر جانب‌داری و محتوای بالقوه‌ی سمی است. بر اساس گفته‌ی گوگل، جمینی برای کمک به تأمین امنیت LLM، تحت آزمایش‌های ایمنی گسترده و اقدامات کاهشی در برابر خطراتی مانند جانب‌داری و سمیت قرار گرفته است.
برای اطمینان بیشتر از عملکرد صحیح جمینی، این مدل‌ها با معیارهای دانشگاهی در حوزه‌های زبان، تصویر، صدا، ویدیو و کد مورد سنجش قرار گرفتند. گوگل به عموم مردم اطمینان داده است که به مجموعه‌ای از اصول هوش مصنوعی پایبند است.

محدودیت‌های جمینی گوگل

  • به‌رغم قابلیت‌های فراوان، هوش مصنوعی جمینی همچنان با برخی محدودیت‌ها مواجه است که می‌تواند برای کاربران بالقوه تردید ایجاد کند. این محدودیت‌ها عبارتند از:
  • داده‌های آموزشی: همه چت‌بات‌های هوش مصنوعی مانند جمینی، نیازمند یادگیری برای ارائه پاسخ‌های صحیح هستند. برای دستیابی به این هدف، مدل‌ها باید بر اساس اطلاعات دقیق و بدون خطا آموزش ببینند. در عین حال، آن‌ها باید توانایی شناسایی اطلاعات نادرست یا گمراه‌کننده را نیز داشته باشند.
  • جانبداری و آسیب بالقوه: فرآیند آموزش هوش مصنوعی، به دلیل وجود اطلاعات جدید برای یادگیری، روندی بی‌پایان و نیازمند پردازش سنگین است. گوگل ادعا می‌کند که در توسعه‌ی تمام مدل‌های جمینی، از شیوه‌های مسئولانه پیروی کرده است. این شامل ارزیابی‌های گسترده برای کمک به کاهش خطر جانبداری و آسیب‌های بالقوه‌ی ناشی از آن می‌شود.
  •  میزان اصالت و خلاقیت محتوایی: این محدودیت، به ویژه در نسخه‌ی رایگان جمینی مشهود است. نسخه‌ی رایگان در پردازش دستورات پیچیده که شامل مراحل و ظرافت‌های متعدد هستند، با مشکل مواجه می‌شود و خروجی مناسبی ارائه نمی‌دهد. دلیل این امر آن است که نسخه‌ی رایگان بر پایه‌ی مدل LLM محدودتری به نام جمینی پرو بنا شده است؛ در مقابل، نسخه‌های پولی این پلتفرم، دسترسی به قابلیت‌های پیشرفته‌تری را ارائه می‌دهند.

Gemini در مقابل GPT-3 و GPT-4

جمینی ساخت گوگل، رقیب مستقیم مدل‌های GPT-3 و GPT-4 از OpenAI است. جدول زیر برخی ویژگی‌های کلیدی جمینی گوگل و محصولات OpenAI را با هم مقایسه می‌کند:

ویژگی ها جمینی Gemini GPT-3 GPT-4
سازنده گوگل OpenAI OpenAI
نسخه های موجود Pro، Nano، Ultra نسخه‌های مختلف با سطوح دسترسی متفاوت نسخه‌های مختلف با سطوح دسترسی متفاوت
حوزه های برتری درک چندوجهی (متن، کد، تصویر، صدا)، خلاقیت در تولید محتوا استدلال منطقی، کدزنی استدلال منطقی، سرعت پردازش
دسترسی پذیری زبان بیش از ۴۵ زبان چندین زبان چندین زبان
محدودیت ها درک زمینه و بافت کلام، پتانسیل جانبداری خلاقیت محدود، نیاز به منابع زیاد خلاقیت محدود، نگرانی‌های امنیتی
درک زبان طبیعی درک گسترده و عمیق زبان، به ویژه در تولید متن‌های خلاقانه ___ عملکرد بهتر در استدلال عمومی و وظایف روزمره
زبان های برنامه نویسی عملکرد بهتر در تولید کد و تحلیل کد برنامه‌نویسی ___ قوی در تولیذ تحلیل کد
هزینه استفاده یک نسخه‌ی رایگان به همراه نسخه‌های پولی با قابلیت‌های بیشتر دارای نسخه‌های رایگان و پولی دارای نسخه‌های رایگان و پولی

به طور کلی، انتخاب بین جمینی و GPT به نیازهای خاص شما بستگی دارد. اگر به دنبال یک چت‌بات چندزبانه با قابلیت‌های چندوجهی و دسترسی به مدل رایگان هستید، جمینی ممکن است انتخاب بهتری باشد. اگر اولویت شما تولید محتوای خلاقانه‌ی متنی است، GPT نیز گزینه‌ مناسبی به شمار می‌رود.

نحوه ثبت نام و ساخت اکانت در گوگل جمینی

برای استفاده از این ابزار شگفت‌انگیز، اولین قدم ایجاد یک حساب کاربری رایگان است. فرآیندی که در نگاه اول ممکن است کمی پیچیده به نظر برسد، با طراحی ساده و کاربرپسند خود، تجربه‌ای آسان و بی‌دغدغه را برای هر فردی، فارغ از سطح دانش فنی او، رقم می‌زند. تنها پیش‌نیاز برای ورود به جمینی، داشتن یک حساب جیمیل است. حسابی که به سادگی و در عرض چند دقیقه قابل‌ساخت است و به شما امکان می‌دهد تا از تمامی خدمات و ویژگی‌های حرفه‌ای این هوش مصنوعی قدرتمند بهره‌مند شوید.

قدم اول داشتن حساب جیمیل

کلید ورود به دنیای جمینی، داشتن یک حساب جیمیل است. جیمیل به عنوان یکی از محبوب‌ترین سرویس‌های ایمیل جهان، دروازه‌ای به سوی گستره عظیمی از خدمات گوگل، از جمله هوش مصنوعی جمینی، به شمار می‌رود. اگر هنوز حساب جیمیل ندارید، نگران نباشید! ایجاد یک حساب جدید کاملاً رایگان و آسان است. کافیست مراحل زیر را دنبال کنید:

  1. بر روی دکمه «ایجاد حساب» کلیک نمایید.
  2. فرم ثبت‌نام را با اطلاعات دقیق و صحیح خود تکمیل کنید.
  3. پس از مطالعه و پذیرش شرایط استفاده، حساب کاربری جیمیل شما آماده استفاده خواهد بود.

قدم دوم دسترسی به اینترنت

برای اینکه بتوانید از تمام توانایی‌های جمینی، هوش مصنوعی قدرتمند گوگل، بهره ببرید، به یک اتصال به اینترنت پایدار نیاز دارید. برای اینکه تجربه‌ای بی‌دغدغه از جمینی داشته باشید، دو نکته کلیدی را در نظر داشته باشید:

  1. استفاده از VPN: اگر از شبکه خصوصی مجازی یا VPN استفاده می‌کنید، برای پایداری و بدون مشکل بودن اتصالتان، موقعیت مکانی خود را به ایالات متحده آمریکا تغییر دهید.
  2. به‌روز بودن دستگاه و مرورگر: جمینی بر روی اکثر دستگاه‌های مدرن قابل‌دسترسی است. برای اطمینان از عملکرد روان و بدون مشکل، از به‌روز بودن دستگاه و مرورگر وب خود اطمینان حاصل کنید.

قدم سوم ساخت حساب کاربری در جمینی

اکنون که با پیش‌نیازهای استفاده از جمینی آشنا شدید، وقت آن است که حساب کاربری خود را ساخته و به دنیای شگفت‌انگیز این هوش مصنوعی قدرتمند قدم بگذارید. فرآیند ساخت حساب کاربری جمینی بسیار ساده و سریع است و در عرض چند دقیقه می‌توانید از امکانات بی‌نظیر آن بهره‌مند شوید. مراحل زیر را برای ساخت حساب کاربری هوش مصنوعی جمینی گوگل دنبال کنید:

  1. ورود به وب‌سایت جمینی
  2. ورود به حساب کاربری
  3. در صفحه اصلی، بر روی دکمه «ورود» یا «ثبت‌نام» کلیک کنید. (اگر از قبل حساب کاربری گوگل دارید، با استفاده از همان حساب می‌توانید وارد جمینایی شوید. در غیر این صورت، باید ابتدا یک حساب جیمیل بسازید.)
  4. در صورت نیاز، اطلاعات ورود به حساب جیمیل خود را وارد کرده و مراحل تأیید هویت را تکمیل نمایید.
  5. پس از ورود به حساب کاربری، فرم ثبت‌نام جمینی را که به شما نمایش داده می‌شود، تکمیل کنید.

دسترسی به جمینی گوگل برای چه کسانی امکان‌پذیر است؟

دسترسی به جمینی گوگل در سطح گسترده‌ای از جهان امکان‌پذیر است. در زمان نگارش این متن، نسخه‌ی حرفه‌ای جمینی در بیش از ۲۳۰ کشور و منطقه در دسترس قرار دارد و نسخه‌ی پیشرفته‌ی آن در بیش از ۱۵۰ کشور قابل استفاده است. با این حال، برای رعایت قوانین و مقررات حاکم بر هوش مصنوعی، محدودیت‌هایی سنی برای استفاده از این سرویس وجود دارد.

آیا هوش مصنوعی جمینی گوگل توانایی تولید تصویر را دارد؟

جمینی قابلیت تولید تصویر دارد، البته با محدودیت‌هایی موقت، جمینی در حال حاضر از مدل هوش مصنوعی گوگل به نام (Imagen 2) برای تبدیل متن به تصویر استفاده می‌کند که به این ابزار قابلیت تولید تصویر می‌بخشد. با این حال، در اواخر فوریه‌ی ۲۰۲۴، قابلیت تولید تصویر جمینی به دلیل نمایش تصاویر حاوی نادرستی‌های واقعی، متوقف شد تا مورد بازنگری و اصلاح قرار گیرد. گوگل قصد دارد این قابلیت را بهبود بخشد تا جمینی بتواند در بلندمدت یک ابزار چندوجهی باقی بماند.

هزینه استفاده از جمینی گوگل

زمانی که بارد در دسترس عموم قرار گرفت، گوگل هیچ صحبتی در مورد پولی بودن این سرویس به میان نیاورد. همچنین، سابقه‌ی گوگل نشان نمی‌داد که این شرکت برای خدمات خود، به جز موارد سازمانی در سرویس Google Cloud، هزینه‌ای دریافت کند. بنابراین، فرض بر این بود که این چت‌بات در موتور جستجوی پایه‌ گوگل ادغام شود و به صورت رایگان در دسترس باشد.
پس از تغییر نام بارد به جمینی در تاریخ ۸ فوریه ۲۰۲۴، گوگل علاوه بر وب‌اپلیکیشن رایگان، نسخه‌ی پولی را نیز معرفی کرد. در حال حاضر، استفاده از مدل‌های Pro و Nano با ثبت‌نام رایگان امکان‌پذیر است. اما دسترسی به مدل Ultra تنها از طریق نسخه‌ی پیشرفته‌ی جمینی با پرداخت ماهانه‌ قابل‌حصول است. کاربران برای دریافت نسخه‌ی پیشرفته، نیازمند اشتراک در Google One AI Premium هستند.

بروزرسانی‌های اخیر جمینی گوگل

در ماه مه ۲۰۲۴، گوگل در کنفرانس Google I/O از پیشرفت‌های بیشتر در مدل جمینی ۱.۵ پرو رونمایی کرد. این بروزرسانی‌ها شامل بهبود عملکرد در بخش ترجمه، کدزنی و استدلال منطقی می‌شود. جمینی گوگل ۱.۵ پروی بروزرسانی‌شده همچنین درک بهتر تصویر و ویدیو را به ارمغان می‌آورد، که شامل قابلیت پردازش مستقیم ورودی‌های صوتی با استفاده از درک بومی صدا می‌شود. علاوه بر ارتقاء مدل‌های اصلی، گوگل در ماه مه ویژگی‌های جدیدی را برای رابط کاربری جمینی معرفی کرد. این ویژگی‌ها عبارتند از:

  • استخراج فریم ویدیو: کاربران می‌توانند با آپلود ویدیو، محتوای جدید تولید کنند.
  • تماس تابع موازی: کاربران می‌توانند به طور همزمان چندین فراخوانی تابع داشته باشند.

ارائه‌دهنده‌ی این ابزار قصد دارد در ماه ژوئن قابلیت “کشینگ زمینه” را اضافه کند تا کاربران مجبور نباشند بخش‌هایی از یک دستورالعمل را چندین بار برای مدل ارسال کنند.

سخن پایانی 

در این بررسی جامع، شاهد قدرت و پتانسیل بی‌نظیر هوش مصنوعی گوگل جمینی بودیم. جمینی فراتر از یک پیشرفت تکنولوژی ساده، گامی بلند به سوی آینده‌ای است که در آن انسان و هوش مصنوعی در تعاملی نزدیک، برای حل پیچیده‌ترین مسائل با یکدیگر همکاری می‌کنند. از قابلیت‌های تحلیلی پیشرفته گرفته تا توانایی‌های یادگیری عمیق، جمینی نمونه‌ای درخشان از نوآوری و خلاقیت بشر است. اما داستان جمینای به اینجا ختم نمی‌شود.

 

مطالب پیشنهادی
دردسرهای دنیای دیجیتال 4 مشکلی که تکنولوژی هنوز چاره‌ای برایشان ندارد

دردسرهای دنیای دیجیتال 4 مشکلی که تکنولوژی هنوز چاره‌ای برایشان ندارد

20/تیر/1403
همه چیز در مورد نرم افزار شبیه ساز سرور زمپ XAMPP

همه چیز در مورد نرم افزار شبیه ساز سرور زمپ XAMPP

20/تیر/1403
رپورتاژ آگهی

نحوه نوشتن رپورتاژ آگهی و تاثیر آن بر سئو

19/تیر/1403
همه چیز در مورد نرم افزار Laragon

همه چیز در مورد نرم افزار شبیه ساز سرور لاراگون Laragon

13/تیر/1403

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Tes

مشاوره طراحی سایت سئو سایت اینستاگرام تولید محتوا رایگان

اگر نیازی به مشاوره برای راه اندازی کسب کارت داری این فرم پر کن تا متخصص های ما باهات تماس بگیرن.