
هوش مصنوعی مولد گوگل Gemini Omni برای «خلق هر چیز» معرفی شد
گوگل یک خانواده بزرگ جدید از مدلهای هوش مصنوعی مولد را معرفی کرده که آن را Gemini Omni مینامد. نخستین مدل اومنی، یعنی Omni Flash، میتواند ویدئوهای هوش مصنوعی را با استفاده از مجموعهای متنوع از ورودیها از جمله متن، عکس، ویدئو و صدا تولید کند. اما در آینده، گوگل اومنی را بهعنوان چیزی تصور میکند که میتواند «هر چیزی را از هر ورودی خلق کند». بههمیندلیل نام Omni (بهمعنای «همه») انتخاب شده است. این مدل از امروز در اپلیکیشن Gemini، گوگل Flow و یوتوب شرتس در دسترس خواهد بود.
🔹هوش مصنوعی مولد Gemini Omni Flash میتواند ویدئوهای تا ۱۰ ثانیه با صدا و تصویر تولید کند و برخلاف Veo (مدل متن-به-ویدئوی گوگل)، میتواند از یک ویدئو بهعنوان پایه برای ساخت ویدئوی دیگر استفاده کند.
🔹این مدل بهلطف دادههای آموزشی جمینای از «دانش جهانی بسیار بیشتری» نسبتبه Veo برخوردار است، و میتواند کارکتری شبیه شما را در ویدئوها قرار دهد – قابلیتی که کاربران پیشتر با Nano Banana برای تصاویر انجام میدادند.
🔹گوگل درحال کار روی افزایش طول ویدئوهای قابل تولید است و Omni Flash را بهعنوان «نسخه ویدئویی Nano Banana» معرفی میکند که تاکنون بیش از ۵۰ میلیارد تصویر با آن تولید شده است.
🔹این مدل از امروز از طریق اپلیکیشن Gemini، Google Flow (پلتفرم جدید گوگل برای دسترسی به Gen AI) و YouTube Shorts در دسترس است.
گوگل از قبل یک مدل تولید ویدئو به نام Veo دارد، اما آن یک مدل متن-به-ویدئو است – درحالیکه Omni Flash میتواند از یک ویدئو بهعنوان پایه برای کمک به ساخت ویدئوی دیگر استفاده کند.
دومیترو ارهان (Dumitru Erhan)، مدیر ارشد تحقیقات در Google DeepMind، میگوید با Gemini Omni Flash میتوانید کلیپهایی با ویدئو و صدا تا ۱۰ ثانیه تولید کنید و این شرکت درحال کار روی طولانیتر کردن آن است.
کورای کاووکچوغلو (Koray Kavukcuoglu)، مدیر گوگل DeepMind و معمار ارشد هوش مصنوعی گوگل، میگوید Omni Flash همچنین «دانش جهانی بسیار بیشتری» نسبتبه Veo دارد، بهدلیل دادههای آموزشی جمینای.
این شرکت Omni Flash را بهعنوان نسخه ویدئویی چیزی مانند مدل تولید تصویر Nano Banana خود معرفی میکند که مردم از زمان معرفی آن در سال گذشته، بیش از ۵۰ میلیارد تصویر با آن تولید کردهاند.
برای مثال، میتوانید از Omni Flash بخواهید کارکتر شبیه شما را در ویدئوها قرار دهد. نیکول بریچتووا (Nicole Brichtova)، که تیم محصول کارکننده روی Omni را رهبری میکند، میگوید گوگل افراد زیادی را دیده که کارکتر شبیه خود را با Nano Banana در تصاویر قرار میدهند.
هوش مصنوعی مولد Gemini Omni Flash از امروز در اپلیکیشن Gemini، Google Flow (پلتفرم جدید گوگل برای دسترسی به هوش مصنوعی مولد) و YouTube Shorts در دسترس خواهد بود.
بهنظر شما آیا توانایی تولید ویدئو از ورودیهای چندگانه میتواند خلاقیت دیجیتال را متحول کند یا نگرانیهای مربوط به دیپفیک و سوءاستفاده مانع از پذیرش گسترده این فناوری خواهد شد؟