مترجم: رضا محمدي
دادههاي گرفته شده توسط دوربينهاي ديجيتال امروزي اغلب به عنوان مواد خام يك تصوير نهايي محسوب ميشوند. قبل از بارگذاري تصاوير در سايتهاي شبكههاي اجتماعي، حتي عكاسان غيرحرفهاي كه با تلفن همراه عكاسي ميكنند، ممكن است يك يا دو دقيقهاي را صرف متعادل كردن رنگ و تنظيم كنتراست توسط يكي از برنامههاي فراوان و محبوب پردازش تصوير كه در حال حاضر در دسترس است، كنند.
محققان يك سيستم جديد را ارائه ميكنند كه ميتواند به طور خودكار تصاوير را به سبك يك عكاس حرفهاي روتوش كند. بهرهوري اين سيستم از نظر انرژي آنقدر بالا است كه ميتواند روي يك تلفن همراه اجرا شود و آنقدر سريع است كه ميتواند عكسهاي روتوش شده را در زمان واقعي نمايش دهد، به طوري كه عكاس ميتواند نسخه نهايي تصوير را در حالي كه هنوز عكس را در فريم تنظيم ميكند، ببيند.
همان سيستم همچنين ميتواند الگوريتمهاي پردازش تصوير موجود را سريعتر كند. در آزمايشاتي كه شامل يك الگوريتم جديد گوگل براي توليد تصاوير با دامنه ديناميك بالا بود، مشخص شد اين الگوريتم قادر است ظرافت رنگي كه در تصاوير استاندارد ديجيتال از دست ميروند را ثبت كند؛ سيستم جديد در زماني حدود يك دهم زمان آن الگوريتم، نتايجي را توليد كرد كه از لحاظ بصري از نتايج الگوريتم تقريباً غيرقابل تشخيص بودند، آنقدر سريع كه بتوان براي نمايش در زمان واقعي استفاده كرد.
اين سيستم يك سيستم يادگيري ماشين است، به اين معني كه ياد ميگيرد با تجزيه و تحليل دادههاي آموزشي كارها را انجام دهد؛ در اين مورد، براي هر كار جديدي كه سيستم ياد گرفت، از روي هزاران جفت تصوير خام و روتوش شده آموزش ديد.
برشهاي كوتاه
در كار جديد، بخش عمده پردازش تصوير روي يك تصوير با وضوح پايين انجام ميشود كه به شدت زمان و مصرف انرژي را كاهش ميدهد. اما اين مسئله مشكل جديدي را ايجاد ميكند، زيرا مقادير رنگ هر پيكسل در تصوير با وضوح بالا، بايد از خروجي بسيار زمخت سيستم يادگيري ماشين تعريف شود. در گذشته، محققان تلاش كردهاند تا با استفاده از يادگيري ماشين، چگونگي «نمونهافزايي» از يك تصوير با وضوح پايين يا افزايش وضوح آن را با حدس زدن مقادير پيكسلهاي حذف شده بياموزند. در طول آموزش، ورودي سيستم يك تصوير با وضوح پايين است و خروجي يك تصوير با وضوح بالا است. اما در عمل اين كار به خوبي انجام نميشود؛ تصوير با وضوح كم اطلاعات زيادي را از دست ميدهد. محققان اين مشكل را با دو ترفند هوشمندانه حل ميكنند. اول اين كه خروجي سيستم يادگيري ماشين خود يك تصوير نيست بلكه مجموعهاي از فرمولهاي ساده براي اصلاح رنگ پيكسلهاي تصوير است. در طول آموزش، عملكرد سيستم با توجه به اينكه فرمول خروجي، هنگامي كه به تصوير اصلي اعمال ميشود، چگونه نسخه روتوش شده را تقريب ميزند سنجيده ميشود. ترفند دوم تكنيكي براي تعيين نحوه اعمال آن فرمولها به پيكسلهاي مجزا در تصوير با وضوح بالا است. خروجي سيستم محققين، يك شبكه سه بعدي 16 در16 در 8 است. وجه 16 در 16 شبكه مربوط به مكانهاي پيكسل در تصوير منبع است؛ هشت لايهاي كه در بالاي آنها قرار دارد مربوط به شدتهاي مختلف پيكسل است. هر سلول شبكه حاوي فرمولي است كه اصلاحات مقادير رنگ تصاوير منبع را تعيين ميكند.
محققان سيستم خود را روي يك مجموعه داده ايجاد شده سازندگان فتوشاپ، آموزش دادند. مجموعه داده شامل 5 هزار عكس است كه هر يك، توسط پنج عكاس متفاوت روتوش شده است. آنها همچنين سيستم خود را با هزاران جفت تصاوير توليد شده توسط استفاده از الگوريتمهاي خاص پردازش تصوير، مانند الگوريتم ايجاد تصاوير با دامنه بالاي ديناميكي (HDR)، آموزش دادند. نرمافزار براي انجام هر اصلاح، فضايي به اندازه يك عكس ديجيتالي در حافظه اشغال ميكند، بنابراين در اصل، يك تلفن همراه ميتواند براي پردازش تصاوير در طيف وسيعي از سبكها تجهيز شود.
محققان معتقدند«اين تكنولوژي پتانسيل اين را دارد كه براي بهبود تصوير زمان واقعي در سيستم عاملهاي تلفن همراه بسيار مفيد باشد». استفاده از يادگيري ماشين براي عكاسي محاسباتي، چشماندازي هيجانانگيز است اما به واسطه محدوديت محاسبات و قدرت سختافزاري گوشيهاي تلفن همراه محدود ميگردد. اين مقاله ممكن است براي ما راههاي گريز از اين مشكلات را فراهم كند و تجربه عكاسي زمان واقعي، متقاعد كننده و جديدي را بدون تخليه باتري يا دادن يك منظره يابي همراه با تأخير ايجاد نمايد.
منبع: ساينس ديلي