محققان متا به سرپرستی یان لیکان سیستمی به نام V-JEPA توسعه دادهاند که مانند انسان، از طریق مشاهده ویدئوها یاد میگیرد و به درک شهودی از قوانین فیزیکی میرسد.
محققان متا به سرپرستی یان لیکان سیستمی به نام V-JEPA توسعه دادهاند که بدون نیاز به دادههای متنی، تنها با مشاهده ویدئوها، به درک شهودی از قوانین فیزیکی میرسد.
این مدل، برخلاف روشهای رایج که بر پیشبینی پیکسلی تکیه دارند، اطلاعات را بهصورت انتزاعی پردازش میکند؛ مشابه روشی که مغز انسان یاد میگیرد.
آزمایشها نشان دادهاند که V-JEPA در تشخیص پایداری اشیا، تداوم حرکت و ثبات شکل، عملکرد بهتری نسبت به مدلهای زبانی بزرگی مانند Gemini 1.5 Pro دارد.
تاکنون مدلهای زبانی بزرگ مانند چتباتها، برای یادگیری و پردازش دادهها، به حجم عظیمی از متون متکی بودند. اما این روش جدید ثابت میکند که یادگیری از طریق مشاهده، بدون نیاز به دادههای متنی، ممکن است.
چنین پیشرفتی میتواند مسیر آینده هوش مصنوعی را تغییر دهد و منجر به ساخت سیستمهایی شود که جهان را به روشی طبیعیتر و شبیهتر به انسان درک کنند.
دیدگاه تان را بنویسید