آموزش هوش مصنوعی به منظور تولید انواع مختلفی از رنگ ها و اشیاء و حیوانات در عکس ها

بیشتر ماشین های آتش نشانی به رنگ قرمز دیده می شوند ، اما تصویر کردن یکی به رنگ آبی سخت نیست. کامپیوترها تقریباً خلاق نیستند.

درک آنها از جهان ، غالباً به معنای واقعی کلمه ، توسط داده هایی که درباره آنها آموزش دیده اند ، رنگ آمیزی می شود. اگر آنچه که تاکنون دیده اید ، عکس هایی از کامیون های آتش نشانی قرمز است ، در ترسیم هر چیز دیگری مشکل دارند.

محققان برای ارائه مدل های بینایی رایانه ای به جهان ، تصویری کامل تر و تخیل تر از جهان ، سعی در تغذیه تصاویر متنوع تر از آنها کرده اند. برخی سعی در شلیک اشیاء از زوایای عجیب و غریب و در موقعیت های غیرمعمول داشته اند تا پیچیدگی در دنیای واقعی خود را بهتر نشان دهند. برخی دیگر از این مدلها خواسته اند با استفاده از شکلی از هوش مصنوعی به نام GAN یا شبکه های مخالف مولد ، تصاویر خود را تولید کنند. در هر دو مورد ، هدف این است که شکاف های مجموعه داده های تصویر را پر کنید تا بهتر جهان سه بعدی را منعکس کند و مدل های تشخیص چهره و شی را مغرضانه تر جلوه دهد.

در یک مطالعه جدید در کنفرانس بین المللی نمایندگی های یادگیری ، محققان MIT نوعی تست خلاقیت را پیشنهاد می کنند تا ببینند که GAN ها تا چه اندازه می توانند با تکیه بر روی یک تصویر مشخص حرکت کنند. آنها این مدل را به سوژه عکس "هدایت" می کنند و از آن می خواهند که اشیاء و حیوانات را از نزدیک ، در نور روشن ، چرخش در فضا یا با رنگهای مختلف بکشاند.

خلاقیت مدل به روشهای ظریف و گاه غافلگیرکننده متفاوت است. به نظر می رسد ، این تغییرات ، از نزدیک مشاهده می کنند که چگونه عکاسان خلاق انسان در قاب صحنه جلوی لنز خود ، قاب بندی می کردند. این تعصبات داخل مجموعه داده اصلی پخته می شوند ، و روش فرمان ارائه شده در مطالعه برای ایجاد این محدودیت ها است.

علی جهانانی ، نویسنده تحقیق MIT ، می گوید: "فضای نهفته جایی است که DNA یک تصویر در آن نهفته است." "ما نشان می دهیم که شما می توانید به این فضای انتزاعی بگردید و کنترل کنید چه ویژگی هایی را که می خواهید GAN بیان کند — تا یک نقطه است. ما می یابیم که خلاقیت GAN به تنوع تصاویری که از آن یاد می گیرد محدود است." جهانیان با همکاری لوسی چای ، دکترا ، در این مطالعه پیوست. دانشجو در MIT ، و نویسنده ارشد فیلیپ ایسولا ، بانی و مارتی (1964) Tenenbaum CD دستیار استاد مهندسی برق و علوم کامپیوتر.

محققان روش خود را برای GAN هایی که قبلاً در 14 میلیون عکس ImageNet آموزش دیده بودند ، به کار بردند. آنها سپس اندازه گیری کردند که مدل ها تا چه اندازه می توانند در تغییر طبقه های مختلف حیوانات ، اشیاء و صحنه ها حرکت کنند. آنها دریافتند که سطح ریسک هنری ، با توجه به نوع موضوعی که GAN در تلاش برای دستکاری آن است ، متفاوت است.

به عنوان مثال ، یک بالون هوای گرم در حال افزایش باعث ایجاد نکات برجسته تر از مثلاً پیتزا چرخشی می شود. همین امر برای بزرگنمایی روی یک گربه فارسی به جای یک رابین نیز صدق می کند ، با گربه در تکه ای از خز که دورتر از بیننده خود مشاهده می کند ذوب می شود در حالی که پرنده تقریباً بدون تغییر باقی می ماند. آنها پیدا کردند که خوشبختانه یک اتومبیل را به رنگ آبی و قرمز چتر دریایی تبدیل کرده است ، اما از ترسیم نقره طلایی یا مشروب فروشی به جز رنگ های استاندارد آنها خودداری کرد.

GAN ها به طرز حیرت انگیزی برخی از مناظر را به طرز حیرت انگیزی به نظر می رساندند. هنگامی که محققان میزان روشنایی مجموعه عکسهای کوهستانی را بالا گرفتند ، این مدل به طرز غریبانه فوران آتشین را به آتشفشان اضافه کرد ، اما نسبی خسته از نظر زمین شناسی و خنک در آلپ نبود. به نظر می رسد که GAN ها با روشن شدن روز به سمت شب ، تغییر نور می یابند ، اما به نظر می رسید که فقط آتشفشان ها در شب روشن تر می شوند.

محققان می گویند ، این مطالعه یادآوری این است که تا چه اندازه نتایج مدل های یادگیری عمیق بر ورودی داده های آنها متکی است. GAN ها به دلیل توانایی خود در برون یابی از داده ها ، و تجسم جهان به روش های جدید و مبتکرانه ، توجه محققان اطلاعاتی را به خود جلب کرده اند.

آنها می توانند یک عکس اصلی بگیرند و آن را به یک پرتره به سبک رنسانس یا مشهور محبوب تبدیل کنند. اما گرچه GAN ها قادر به یادگیری جزئیات تعجب آور به خودی خود هستند ، مانند نحوه تقسیم یک منظره به ابرها و درختان ، یا تولید تصاویری که در ذهن افراد بچسبد ، اما هنوز هم اکثراً برده دیتا هستند. آفرینش های آنها منعکس کننده تعصبات هزاران عکاس است ، چه در انتخاب عکسبرداری و چه در چارچوب سوژه خود.

Jaako Lehtinen ، استاد دانشگاه Aalto فنلاند و یک دانشمند تحقیقاتی در NVIDIA که درگیر این کار نیست ، می گوید: "آنچه من در مورد این کار دوست دارم این است که در نماینده هایی که GAN آموخته است ، تردید کرده و آن را فاش می کند که چرا این تصمیم را گرفته است." مطالعه. "GAN ها باورنکردنی هستند و می توانند انواع و اقسام چیزهایی راجع به دنیای جسمی بیاموزند ، اما آنها هنوز هم نمی توانند تصاویر را به روش های معنادار از نظر جسمی نشان دهند."

۹۹/۰۲/۱۹

ارمان تلاشگر

وکیوم لند

وکیوم لند

در این وبلاک بهترین مطالب ترجمه شده را ارئه خواهیم داد.

آموزش هوش مصنوعی به منظور تولید انواع مختلفی از رنگ ها و اشیاء و حیوانات در عکس ها

نظرات (۰)

ارسال نظر