در دنیایی که هر روز شاهد نوآوریهای بیپایان در عرصهی هوش مصنوعی هستیم، گوگل با رونمایی از هوش مصنوعی جمینی، گامی فراتر از پیش برداشته و طلایهدار عصری نو در این حوزه شده است. هوش مصنوعی گوگل جمینی فراتر از یک پلتفرم هوش مصنوعی، یار و همراهای هوشمند است که با قدرت تحلیل، یادگیری و ارائه راهحلهای خلاقانه، در زمینههای مختلف یاریگر شما خواهد بود. از تجزیه و تحلیلهای پیچیده دادههای حجیم گرفته تا خلق محتواهای بدیع و جذاب، جمینی با اتکا به مدلهای متنوع خود، قدرتی بینظیر را در اختیار شما قرار میدهد که تاکنون تجربه نکردهاید. در این مقاله، سفری به ژرفای این ابزار شگفتانگیز خواهیم داشت و با نحوه کارکرد بهینه و هر آنچه که باید دربارهی جمینی بدانید آشنا خواهیم شد.
گوگل جمینی Gemini چیست؟
گوگل جمینی (Gemini)، که قبلاً با نام بارد (Bard) شناخته میشد، یک ابزار مبتنی بر هوش مصنوعی (AI) برای گفتگوی ماشینی است که توسط گوگل طراحی شده است. این ابزار با استفاده از پردازش زبان طبیعی (NLP) و یادگیری ماشین، مکالمات انسانی را شبیهسازی میکند. جمینی علاوه بر تکمیل نتایج جستجوی گوگل، میتواند در وبسایتها، پلتفرمهای پیامرسانی یا برنامههای کاربردی ادغام شود تا پاسخهای طبیعی و واقعگرایانه به سوالات کاربران ارائه دهد. جمینی گوگل یک مجموعه از مدلهای بزرگ زبان مصنوعی چندوجهی (Multimodal AI Large Language Models) است که توانایی درک زبان، صوت، کد و ویدیو را دارا می باشد، این قابلیت چندوجهی به جمینی توانایی استدلال چندوجهی (Cross-Modal Reasoning) میبخشد، به عبارت دیگر، جمینی میتواند بر اساس توالیای از انواع مختلف دادههای ورودی، از جمله صدا، تصاویر و متن، استدلال کند. برای مثال، جمینی قادر است برای حل مسائل پیچیده، یادداشتهای دستنویس، نمودارها و دیاگرامها را درک کند. معماری این ابزار از ورود مستقیم متن، تصاویر، شکل موجهای صوتی و فریمهای ویدیویی به صورت توالیهای درهمآمیخته پشتیبانی میکند.
نسخه ۱.۰ جمینی در تاریخ ۶ دسامبر ۲۰۲۳ معرفی شد و توسط واحد کسبوکار دیپمایندِ گوگل متعلق به شرکت آلفابت، که بر تحقیق و توسعه هوش مصنوعی پیشرفته تمرکز دارد، ساخته شده است. در کنار سایر کارکنان گوگل، سرگئی برین، همبنیانگذار گوگل، در توسعه مدلهای بزرگ زبان مصنوعی جمینی مشارکت داشته است. با زمان عرضه، جمینی به عنوان پیشرفتهترین مجموعهی مدلهای بزرگ زبان مصنوعی در گوگل شناخته شد. این مدل پیش از تغییر نام بارد، هستهی اصلی آن بود و مدل پیشین گوگل با نام «مدل زبان مسیرها» را کنار زد.
پرامپت های هوش مصنوعی گوگل
پرامپت بازنویسی محتوا با هوش مصنوعی گوگل Gemini
از این پرامپت میتوانید برای بازنویسی و بهبود مقالات استفاده کنید
عمل کنید به عنوان یک ویراستار حرفهای و متنی را که در اختیار دارید به بهترین شیوه بازنویسی کنید. لطفاً به گونهای عمل کنید که مفهوم اصلی متن حفظ شود، اما ساختار و واژگان به طور کامل تغییر کند تا هرگونه شباهتی به متن اصلی وجود نداشته باشد. به جزئیات و کیفیت نگارش توجه ویژهای داشته باشید تا نتیجه نهایی بسیار حرفهای و خواندنی باشد. : “متن مورد نظر”
پرامپت ترجمه و بازنویسی محتوا با هوش مصنوعی گوگل Gemini
عمل کنید به عنوان یک مترجم و ویرایشگر حرفهای. از شما میخواهم متنی را که در ادامه ارائه میشود، با لحن رسمی و حرفهای به زبان فارسی ترجمه و بازنویسی کنید. در این بازنویسی، به نکات گرامری و اصول سئو توجه ویژه داشته باشید. همچنین، تلاش کنید تا واژگان و جملات به گونهای انتخاب شوند که باعث جذب بیشتر مخاطب شود. : “متن مورد نظر”
جزئیات انواع مدلهای جمینی
در زمان رونمایی جمینی در تاریخ ۶ دسامبر ۲۰۲۳، اعلام شد که این مجموعه از چندین مدل با اندازههای مختلف تشکیل شده است که هر کدام برای مجموعهی خاصی از موارد استفاده و محیطهای استقرار طراحی شدهاند.
- مدل Gemini Nano
نسخه بسیار کوچکتری از مدلهای Gemini Pro و Ultra به حساب میرود که از خانواده جمینی برای کاربرد بر روی دستگاههای هوشمند طراحی شده است. این مدل در دو نسخهی «نانو-۱» با ۱.۸ میلیارد پارامتر و «نانو-۲» با ۳.۲۵ میلیارد پارامتر عرضه میشود. از جملهی دستگاههایی که مدل Nano در آن تعبیه شده، تلفن هوشمند گوگل پیکسل ۸ پرو است.
- مدل Gemini Pro
این مدل بر عملکرد و استقرار در مقیاس بالا تمرکز دارد. از تاریخ ۱۳ دسامبر ۲۰۲۳، گوگل امکان دسترسی به مدل Pro جمنای را از طریق سرویسهای Google Cloud Vertex AI و Google AI Studio فراهم کرده است. این نسخه رایگان قابل دسترس است و میتوان برای نوشتن گزارشها، ترجمه متون با حجم متوسط و تولید محتوای خلاقانه استفاده شود، همچنین، نسخهای از مدل Pro جمینی برای پشتیبانی از فناوری کدزنی هوش مصنوعی تولیدکننده (AlphaCode 2) به کار گرفته میشود.
- مدل Gemini Ultra
قدرتمندترین و تواناترین مدل جمینی است که برای انجام وظایف بسیار پیچیده با ترکیب دانش ۵۷ حوزه مختلف تحت عنوان ریاضیات، تاریخ، فیزیک، پزشکی، حقوق و اخلاق قادر به انجام آزمونهای دانش جهانی و حل مسائل پیچیده استطراحی شده است.
قابلیت و کاربرد جمینی گوگل
مدلهای جمینی گوگل به لطف ماهیت چندوجهی خود توانایی درک در طیف گستردهای از زمینهها کاربرد دارند. این قابلیت حتی امکان ترکیب انواع مختلف ورودی برای تولید خروجی را فراهم میکند. در اینجا به برخی از موارد استفادهی جمینی اشاره میکنیم:
چند رسانه ای بودن و استدلال
- تولید محتوا: جمینی میتواند در تولید انواع محتوا از جمله متن، کد، اسکریپت، ایمیل، نامه و گزارش به کار گرفته شود.
- ترجمه زبان: از قابلیتهای ترجمه چندزبانهی قدرتمندی برخوردار است و میتواند به ترجمه دقیق و روان بین زبانهای مختلف کمک کند.
- پاسخ به سوالات پیچیده: گوگل جمینی قادر است به پرسشهای پیچیده و چندوجهی در حوزههای مختلف پاسخ دهد.
- تحلیل داده: با استفاده از جمینی میتوان دادههای حجیم و پیچیده را در قالبهای مختلف از جمله متن، تصویر، صدا و ویدیو تجزیه و تحلیل کرد.
- خلاصه سازی اطلاعات: میتوان با کمک جمینی متون، ایمیلها و سایر اطلاعات حجیم را به خلاصههای مفید و قابل فهم تبدیل کند.
- ایجاد رابطهای کاربری تعاملی: جمینی در طراحی رابطهای کاربری صوتی و تصویری تعاملی کاربرد دارد.
- تولید کد: این ابزار به توسعهدهندگان کمک میکند تا به صورت خودکار کدهای کامپیوتری تولید کنند.
- آموزش و یادگیری: جمنای میتواند به عنوان یک ابزار آموزشی تعاملی برای دانشآموزان و دانشجویان در مقاطع مختلف به کار رود.
مورد استفاده برای کسبوکارها
مدلهای جمینی میتوانند در راستای بهبود فرآیندهای مختلف کسبوکار به کار گرفته شوند. در اینجا به برخی از این موارد استفاده اشاره میکنیم:
- خلاصهسازی متن: مدلهای جمینی قادرند محتوای استخراجشده از انواع مختلف دادهها را خلاصه کنند. این قابلیت برای سازماندهی ایمیلها، گزارشها و سایر اسناد متنی حجیم کاربرد دارد.
- تولید متن: جمینی میتواند بر اساس دستورات و راهنماییهای کاربران، انواع مختلف متن از جمله ایمیل، نامه، اسکریپت و گزارش را تولید کند. همچنین، امکان استفاده از این قابلیت در قالب یک رابط چتبات پرسش و پاسخ نیز وجود دارد.
- ترجمه زبان: قابلیتهای چندزبانهی قدرتمند جمینی امکان ترجمه دقیق و روان بین بیش از ۱۰۰ زبان را فراهم میکند. این قابلیت برای برقراری ارتباط با شرکای تجاری بینالمللی و ترجمه اسناد و محتوا به زبانهای مختلف بسیار مفید است.
- درک تصویر: این ابزار قادر است بدون نیاز به ابزار جانبی تشخیص شخصیت نوری، دادههای تصویری پیچیده مانند نمودارها، اشکال و دیاگرامها را تجزیه و تحلیل کند. این قابلیت در شرح تصاویر و پاسخ به سؤالات تصویری کاربرد دارد. برای مثال، یک وبسایت تجارت الکترونیک میتواند از جَمینی برای شرح خودکار تصاویر محصولات استفاده کند.
- پردازش صدا: جمنای از قابلیت تشخیص گفتار در بیش از ۱۰۰ زبان و همچنین امکان ترجمه صوتی پشتیبانی میکند. این قابلیت در مواردی مانند مراکز تماس بینالمللی، زیرنویس خودکار ویدیوها و رونوشتنویسی جلسات کاربرد دارد.
- درک ویدیو: جمنای میتواند فریمهای ویدیویی را پردازش و درک کند تا به سؤالات پاسخ دهد و توضیحات متنی تولید کند. این قابلیت در تحلیل ویدیوهای آموزشی، تحلیل رفتار مشتری و نظارت امنیتی کاربرد دارد.
- استدلال چندوجهی: یکی از نقاط قوت کلیدی جمینی، استدلال هوش مصنوعی چندوجهی (Multimodal Reasoning) است. در این شیوه، انواع مختلف دادهها مانند متن، تصویر، صدا و ویدیو را میتوان در یک دستورالعمل ترکیب کرد تا خروجی مورد نظر تولید شود. به عنوان مثال، یک شرکت رسانهای میتواند از جمینی برای ایجاد خودکار زیرنویس ویدیو بر اساس متن فیلمنامه و صدای گفتگو استفاده کند.
- تحلیل و تولید کد: میتوان کد نوشته شده به زبانهای برنامهنویسی رایج مانند پایتون، جاوا، ++C و Go را درک و توضیح دهد و همچنین کد جدید تولید کند. این قابلیت در خودکارسازی فرآیندهای توسعه نرمافزار، رفع باگهای کد و ایجاد اسناد فنی کاربرد دارد.
استفاده در محصولات و سرویسهای گوگل
گوگل جمینی را به عنوان یک مدل پایه توسعه داده است تا به طور گسترده در سرویسهای مختلف گوگل ادغام شود. همچنین، توسعهدهندگان میتوانند از آن برای ساخت برنامههای کاربردی خود استفاده کنند. در اینجا برخی از برنامههای کاربردی که از جَمینی بهره میبرند، آورده شده است:
- آلفاکد ۲ (AlphaCode 2): ابزار تولید کد آلفاکد ۲ که توسط واحد دیپمایندِ گوگل ساخته شده است، از نسخهی سفارشیشدهی جمینی پرو استفاده میکند.
- گوگل پیکسل (Google Pixel): گوشی هوشمند پیکسل ۸ پرو ساخت گوگل، اولین دستگاهی است که برای اجرای جمینی نانو طراحی شده است. جمینی قابلیتهای جدیدی را در برنامههای موجود گوگل، مانند خلاصهسازی در برنامهی ضبط صدا (Recorder) و پاسخ هوشمند (Smart Reply) در صفحهکلید Gboard برای برنامههای پیامرسان، به کار میاندازد.
- اندروید ۱۴ (Android 14): پیکسل ۸ پرو اولین گوشی هوشمند اندرویدی است که از مزایای جمینی بهرهمند میشود. توسعهدهندگان اندروید میتوانند از طریق قابلیت سیستم هوش مصنوعی هسته (AICore) با جمینی نانو برنامهنویسی کنند.
- استودیوی هوش مصنوعی گوگل (Google AI Studio): توسعهدهندگان میتوانند با استفاده از ابزار تحت وب استودیوی هوش مصنوعی گوگل، نمونههای اولیه و برنامههایی با جمینی بسازند.
- جستجو (Search): گوگل در تلاش است تا از جمینی در تجربهی تولید جستجو برای کاهش تأخیر و ارتقای کیفیت نتایج استفاده کند.
چگونگی عملکرد هوش مصنوعی جمینی گوگل
عملکرد جمینی گوگل بر اساس آموزش اولیه با حجم عظیمی از دادهها استوار است. پس از آموزش، این مدل از چندین تکنیک شبکههای عصبی برای درک محتوا، پاسخ به سؤالات، تولید متن و خروجی استفاده میکند. بهطور خاص، مدلهای بزرگ زبان مصنوعی جمینی از معماری شبکه عصبی مبتنی بر مدل ترانسفورماتور بهره میبرند. این معماری برای پردازش توالیهای طولانی با زمینههای مختلف در انواع گوناگون دادهها، از جمله متن، صدا و ویدیو، تقویت شده است. واحد دیپمایندِ گوگل با بهکارگیری سازوکارهای کارآمد توجه در دیکودرِ ترانسفورماتور، به مدلها در پردازش زمینههای طولانی و چندوجهی یاری میرساند.
چالشهای جمینی و رویکرد گوگل برای ایمنسازی
یکی از چالشهای کلیدی مدلهای بزرگ زبان مصنوعی (LLMs)، خطر جانبداری و محتوای بالقوهی سمی است. بر اساس گفتهی گوگل، جمینی برای کمک به تأمین امنیت LLM، تحت آزمایشهای ایمنی گسترده و اقدامات کاهشی در برابر خطراتی مانند جانبداری و سمیت قرار گرفته است.
برای اطمینان بیشتر از عملکرد صحیح جمینی، این مدلها با معیارهای دانشگاهی در حوزههای زبان، تصویر، صدا، ویدیو و کد مورد سنجش قرار گرفتند. گوگل به عموم مردم اطمینان داده است که به مجموعهای از اصول هوش مصنوعی پایبند است.
محدودیتهای جمینی گوگل
- بهرغم قابلیتهای فراوان، هوش مصنوعی جمینی همچنان با برخی محدودیتها مواجه است که میتواند برای کاربران بالقوه تردید ایجاد کند. این محدودیتها عبارتند از:
- دادههای آموزشی: همه چتباتهای هوش مصنوعی مانند جمینی، نیازمند یادگیری برای ارائه پاسخهای صحیح هستند. برای دستیابی به این هدف، مدلها باید بر اساس اطلاعات دقیق و بدون خطا آموزش ببینند. در عین حال، آنها باید توانایی شناسایی اطلاعات نادرست یا گمراهکننده را نیز داشته باشند.
- جانبداری و آسیب بالقوه: فرآیند آموزش هوش مصنوعی، به دلیل وجود اطلاعات جدید برای یادگیری، روندی بیپایان و نیازمند پردازش سنگین است. گوگل ادعا میکند که در توسعهی تمام مدلهای جمینی، از شیوههای مسئولانه پیروی کرده است. این شامل ارزیابیهای گسترده برای کمک به کاهش خطر جانبداری و آسیبهای بالقوهی ناشی از آن میشود.
- میزان اصالت و خلاقیت محتوایی: این محدودیت، به ویژه در نسخهی رایگان جمینی مشهود است. نسخهی رایگان در پردازش دستورات پیچیده که شامل مراحل و ظرافتهای متعدد هستند، با مشکل مواجه میشود و خروجی مناسبی ارائه نمیدهد. دلیل این امر آن است که نسخهی رایگان بر پایهی مدل LLM محدودتری به نام جمینی پرو بنا شده است؛ در مقابل، نسخههای پولی این پلتفرم، دسترسی به قابلیتهای پیشرفتهتری را ارائه میدهند.
مقاسه Gemini در مقابل GPT-3 و GPT-4
جمینی ساخت گوگل، رقیب مستقیم مدلهای GPT-3 و GPT-4 از OpenAI است. جدول زیر برخی ویژگیهای کلیدی جمینی گوگل و محصولات OpenAI را با هم مقایسه میکند:
ویژگی ها | جمینی Gemini | GPT-3 | GPT-4 |
سازنده | گوگل | OpenAI | OpenAI |
نسخه های موجود | Pro، Nano، Ultra | نسخههای مختلف با سطوح دسترسی متفاوت | نسخههای مختلف با سطوح دسترسی متفاوت |
حوزه های برتری | درک چندوجهی (متن، کد، تصویر، صدا)، خلاقیت در تولید محتوا | استدلال منطقی، کدزنی | استدلال منطقی، سرعت پردازش |
دسترسی پذیری زبان | بیش از ۴۵ زبان | چندین زبان | چندین زبان |
محدودیت ها | درک زمینه و بافت کلام، پتانسیل جانبداری | خلاقیت محدود، نیاز به منابع زیاد | خلاقیت محدود، نگرانیهای امنیتی |
درک زبان طبیعی | درک گسترده و عمیق زبان، به ویژه در تولید متنهای خلاقانه | ___ | عملکرد بهتر در استدلال عمومی و وظایف روزمره |
زبان های برنامه نویسی | عملکرد بهتر در تولید کد و تحلیل کد برنامهنویسی | ___ | قوی در تولیذ تحلیل کد |
هزینه استفاده | یک نسخهی رایگان به همراه نسخههای پولی با قابلیتهای بیشتر | دارای نسخههای رایگان و پولی | دارای نسخههای رایگان و پولی |
به طور کلی، انتخاب بین جمینی و GPT به نیازهای خاص شما بستگی دارد. اگر به دنبال یک چتبات چندزبانه با قابلیتهای چندوجهی و دسترسی به مدل رایگان هستید، جمینی ممکن است انتخاب بهتری باشد. اگر اولویت شما تولید محتوای خلاقانهی متنی است، GPT نیز گزینه مناسبی به شمار میرود.
نحوه ثبت نام و ساخت اکانت در گوگل جمینی
برای استفاده از این ابزار شگفتانگیز، اولین قدم ایجاد یک حساب کاربری رایگان است. فرآیندی که در نگاه اول ممکن است کمی پیچیده به نظر برسد، با طراحی ساده و کاربرپسند خود، تجربهای آسان و بیدغدغه را برای هر فردی، فارغ از سطح دانش فنی او، رقم میزند. تنها پیشنیاز برای ورود به جمینی، داشتن یک حساب جیمیل است. حسابی که به سادگی و در عرض چند دقیقه قابلساخت است و به شما امکان میدهد تا از تمامی خدمات و ویژگیهای حرفهای این هوش مصنوعی قدرتمند بهرهمند شوید.
قدم اول داشتن حساب جیمیل
کلید ورود به دنیای جمینی، داشتن یک حساب جیمیل است. جیمیل به عنوان یکی از محبوبترین سرویسهای ایمیل جهان، دروازهای به سوی گستره عظیمی از خدمات گوگل، از جمله هوش مصنوعی جمینی، به شمار میرود. اگر هنوز حساب جیمیل ندارید، نگران نباشید! ایجاد یک حساب جدید کاملاً رایگان و آسان است. کافیست مراحل زیر را دنبال کنید:
- بر روی دکمه «ایجاد حساب» کلیک نمایید.
- فرم ثبتنام را با اطلاعات دقیق و صحیح خود تکمیل کنید.
- پس از مطالعه و پذیرش شرایط استفاده، حساب کاربری جیمیل شما آماده استفاده خواهد بود.
قدم دوم دسترسی به اینترنت
برای اینکه بتوانید از تمام تواناییهای جمینی، هوش مصنوعی قدرتمند گوگل، بهره ببرید، به یک اتصال به اینترنت پایدار نیاز دارید. برای اینکه تجربهای بیدغدغه از جمینی داشته باشید، دو نکته کلیدی را در نظر داشته باشید:
- استفاده از VPN: اگر از شبکه خصوصی مجازی یا VPN استفاده میکنید، برای پایداری و بدون مشکل بودن اتصالتان، موقعیت مکانی خود را به ایالات متحده آمریکا تغییر دهید.
- بهروز بودن دستگاه و مرورگر: جمینی بر روی اکثر دستگاههای مدرن قابلدسترسی است. برای اطمینان از عملکرد روان و بدون مشکل، از بهروز بودن دستگاه و مرورگر وب خود اطمینان حاصل کنید.
قدم سوم ساخت حساب کاربری در جمینی
اکنون که با پیشنیازهای استفاده از جمینی آشنا شدید، وقت آن است که حساب کاربری خود را ساخته و به دنیای شگفتانگیز این هوش مصنوعی قدرتمند قدم بگذارید. فرآیند ساخت حساب کاربری جمینی بسیار ساده و سریع است و در عرض چند دقیقه میتوانید از امکانات بینظیر آن بهرهمند شوید. مراحل زیر را برای ساخت حساب کاربری هوش مصنوعی جمینی گوگل دنبال کنید:
- ورود به وبسایت جمینی
- ورود به حساب کاربری
- در صفحه اصلی، بر روی دکمه «ورود» یا «ثبتنام» کلیک کنید. (اگر از قبل حساب کاربری گوگل دارید، با استفاده از همان حساب میتوانید وارد جمینایی شوید. در غیر این صورت، باید ابتدا یک حساب جیمیل بسازید.)
- در صورت نیاز، اطلاعات ورود به حساب جیمیل خود را وارد کرده و مراحل تأیید هویت را تکمیل نمایید.
- پس از ورود به حساب کاربری، فرم ثبتنام جمینی را که به شما نمایش داده میشود، تکمیل کنید.
دسترسی به جمینی گوگل برای چه کسانی امکانپذیر است؟
دسترسی به جمینی گوگل در سطح گستردهای از جهان امکانپذیر است. در زمان نگارش این متن، نسخهی حرفهای جمینی در بیش از ۲۳۰ کشور و منطقه در دسترس قرار دارد و نسخهی پیشرفتهی آن در بیش از ۱۵۰ کشور قابل استفاده است. با این حال، برای رعایت قوانین و مقررات حاکم بر هوش مصنوعی، محدودیتهایی سنی برای استفاده از این سرویس وجود دارد.
آیا هوش مصنوعی جمینی گوگل توانایی تولید تصویر را دارد؟
جمینی قابلیت تولید تصویر دارد، البته با محدودیتهایی موقت، جمینی در حال حاضر از مدل هوش مصنوعی گوگل به نام (Imagen 2) برای تبدیل متن به تصویر استفاده میکند که به این ابزار قابلیت تولید تصویر میبخشد. با این حال، در اواخر فوریهی ۲۰۲۴، قابلیت تولید تصویر جمینی به دلیل نمایش تصاویر حاوی نادرستیهای واقعی، متوقف شد تا مورد بازنگری و اصلاح قرار گیرد. گوگل قصد دارد این قابلیت را بهبود بخشد تا جمینی بتواند در بلندمدت یک ابزار چندوجهی باقی بماند.
هزینه استفاده از جمینی گوگل
زمانی که بارد در دسترس عموم قرار گرفت، گوگل هیچ صحبتی در مورد پولی بودن این سرویس به میان نیاورد. همچنین، سابقهی گوگل نشان نمیداد که این شرکت برای خدمات خود، به جز موارد سازمانی در سرویس Google Cloud، هزینهای دریافت کند. بنابراین، فرض بر این بود که این چتبات در موتور جستجوی پایه گوگل ادغام شود و به صورت رایگان در دسترس باشد.
پس از تغییر نام بارد به جمینی در تاریخ ۸ فوریه ۲۰۲۴، گوگل علاوه بر وباپلیکیشن رایگان، نسخهی پولی را نیز معرفی کرد. در حال حاضر، استفاده از مدلهای Pro و Nano با ثبتنام رایگان امکانپذیر است. اما دسترسی به مدل Ultra تنها از طریق نسخهی پیشرفتهی جمینی با پرداخت ماهانه قابلحصول است. کاربران برای دریافت نسخهی پیشرفته، نیازمند اشتراک در Google One AI Premium هستند.
بروزرسانیهای اخیر جمینی گوگل
در ماه مه ۲۰۲۴، گوگل در کنفرانس Google I/O از پیشرفتهای بیشتر در مدل جمینی ۱.۵ پرو رونمایی کرد. این بروزرسانیها شامل بهبود عملکرد در بخش ترجمه، کدزنی و استدلال منطقی میشود. جمینی گوگل ۱.۵ پروی بروزرسانیشده همچنین درک بهتر تصویر و ویدیو را به ارمغان میآورد، که شامل قابلیت پردازش مستقیم ورودیهای صوتی با استفاده از درک بومی صدا میشود. علاوه بر ارتقاء مدلهای اصلی، گوگل در ماه مه ویژگیهای جدیدی را برای رابط کاربری جمینی معرفی کرد. این ویژگیها عبارتند از:
- استخراج فریم ویدیو: کاربران میتوانند با آپلود ویدیو، محتوای جدید تولید کنند.
- تماس تابع موازی: کاربران میتوانند به طور همزمان چندین فراخوانی تابع داشته باشند.
ارائهدهندهی این ابزار قصد دارد در ماه ژوئن قابلیت “کشینگ زمینه” را اضافه کند تا کاربران مجبور نباشند بخشهایی از یک دستورالعمل را چندین بار برای مدل ارسال کنند.
سخن پایانی
در این بررسی جامع، شاهد قدرت و پتانسیل بینظیر هوش مصنوعی گوگل جمینی بودیم. جمینی فراتر از یک پیشرفت تکنولوژی ساده، گامی بلند به سوی آیندهای است که در آن انسان و هوش مصنوعی در تعاملی نزدیک، برای حل پیچیدهترین مسائل با یکدیگر همکاری میکنند. از قابلیتهای تحلیلی پیشرفته گرفته تا تواناییهای یادگیری عمیق، جمینی نمونهای درخشان از نوآوری و خلاقیت بشر است. اما داستان جمینای به اینجا ختم نمیشود.