پیشرفت ۳ هوش مصنوعی بزرگ در تولید تصاویر

پیشرفت ۳ هوش مصنوعی بزرگ در تولید تصاویر لینک بخر دات کام: مدتی است که با تصاویر تولیدشده توسط هوش مصنوعی زندگی می نماییم، اما این هفته، تعدادی از بازیگران اصلی این حوزه، قدمهای بزرگی رو به جلو برداشته اند. به طور دقیقتر در اینجا در مورد بروزرسانی های مهم میدجرنی(Midjourney)، مدل جدید گوگل و گروک(Grok) صحبت می نماییم.


به گزارش لینک بخر دات کام به نقل از ایسنا، هر یک از شرکت ها نشان می دهند که فناوری با سرعت و در جهات مختلف درحال تکامل است و هر شرکت نشان داده است که پیشرفت ها تا کجا پیش رفته است.
به نقل از دیجیتال ترندز، با میدجرنی(Midjourney) شروع نماییم که بی سر و صدا یک ویرایشگر وب جدید را اواخر روز پنجشنبه منتشر نموده است که برخی از ابزارهای مفید دستکاری تصویر را در یک رابط کاربری جمع می کند.
پیش از این، عملکردهایی مانند قاب بندی مجدد، رنگ آمیزی مجدد گسترش مرزهای تصویر و تولید محتوا برای پر کردن آن و بزرگنمایی همگی احتیاج به ابزار خاص خود داشتند و در چندین لیست قرار گرفته بودند و از سازندگان خواسته می شد که دائما بین این لیست ها جابه جا شوند. این رابط کاربری جدید پروسه ویرایش منسجم تر و ساده تری را ارائه می دهد.
به قول دیوید هولز(David Holz)، مدیر عامل میدجرنی در دیسکورد، ویرایشگر وب جدید بگونه ای طراحی شده است که ویرایش تصاویر ساخته شده با هوش مصنوعی را آسان تر و بدون سخت تر می کند. او نوشت: ما فکر می نماییم که این کار ویرایش تصاویر را بسیار راحتتر از قبل می کند و گام بزرگی رو به جلو است.
این شرکت همینطور ابزار گزینش جدیدی را معرفی کرده است که مانند یک قلمو دیجیتال کار می کند و جایگزین ابزار انتخاب مربعی و بیضی می شود.
ویرایشگر جدید برای همه کاربران میدجرنی که پیش از این بالاتر از ۱۰ تصویر روی پلت فرم تولید کرده اند، در دسترس می باشد. واکنش های اولیه از طرف جامعه تا حد زیادی مثبت بوده است.
این ویرایشگر دو هفته بعد از انتشار میدجرنی ۶.۱ ارائه می شود که کیفیت و انسجام تصویر مانند تعداد صحیح انگشتان و همینطور زمان پردازش و درک دقت متن را بطور قابل توجهی بهبود بخشید.

گروک-۲(Grok-2) هیولا را آزاد می کند

بروزرسانی میدجرنی نیز تنها دو روز بعد از انتشار گروک-۲ توسط استارت آپ xAI ایلان ماسک ارائه می شود که اتفاق بزرگ بعدی این هفته است.
محبوبیت قابلیت های تولید تصویر گروک به علت کیفیت تصویر چشم گیر و قابلیت استفاده رایگان، به سرعت در حال افزایش می باشد.
بزرگترین بحث در مورد گروک-۲ فقط کیفیت آن نیست، بلکه دستورالعمل های ظاهرا تعریف نشده آن است. برخلاف خیلی از تولیدکننده های تصویر هوش مصنوعی، به نظر می آید گروک-۲ از نظر دستورالعمل های در ارتباط با مالکیت معنوی، خشونت و سایر محتواها چیز کمی برای گفتن دارد.
مردم پیش از این محدودیت های آنرا آزمایش کرده اند و انواع تصاویر وحشتناک و عجیب و غریب را بوجود آورده اند که روزهای اولیه تولید تصویر هوش مصنوعی را تداعی می کند. اما اگر به سخنان ماسک اعتقاد دارید، فقدان دستورالعمل های گروک-۲ هدفمند به نظر می آید و در نهایت می تواند به چگونگی تکامل این فناوری در آینده شکل دهد.

گوگل با ایمجن ۳(Imagen 3) خود وارد رقابت شد

در نهایت، گوگل مدل جدید هوش مصنوعی ایمجن ۳(3 Imagen) خودرا معرفی نمود که در روز پنجشنبه برای همه کاربران آمریکایی منتشر گردید. گوگل آنرا «با کیفیت ترین مدل تبدیل متن به تصویر» خود می نامد که حالا می تواند «جزئیات بهتر، نور غنی تر و مصنوعات کمتری نسبت به مدلهای قبلی» تولید نماید. گوگل همینطور می گوید که ایمجن ۳ در رندر کردن متن بهتر است و الان در نسخه های مختلفی ارائه می شود.


1403/05/28
10:35:22
5.0 / 5
225
تگهای خبر: بازی , دیجیتال , شركت , فناوری
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
نظر شما در مورد این مطلب
نام:
ایمیل:
نظر:
سوال:
= ۳ بعلاوه ۴