راهکار تازه برای تولید داده های مصنوعی و آموزش یک مدل یادگیری ماشین به گزارش دیجیتالر، محققان دانشگاه های تهران و قم روشی برای تولید داده های مصنوعی عرضه کرده اند که می تواند تحولی در یادگیری ماشین، امنیت سایبری و جرم شناسی دیجیتال ایجاد نماید. به گزارش دیجیتالر به نقل از دانشگاه تهران، در پژوهشی که به سرپرستی دکتر مهدی تیموری، دانشیار دانشکده سامانه های هوشمند دانشکدگان علوم و فناوری های میان رشته ای دانشگاه تهران و محقق هایی از دانشگاه قم انجام شده است، راهکار جدیدی برای تولید داده های مصنوعی و آموزش یک مدل یادگیری ماشین با استفاده از این داده ها پیشنهاد شده است. دکتر مهدی تیموری، سرپرست این تیم تحقیقاتی در رابطه با اهمیت این پژوهش اظهار داشت: «یکی از چالش های اساسی در کاربردهای عملی یادگیری ماشین، مساله ی تعمیم پذیری است؛ یعنی این که یک مدل آموزش دیده چقدر می تواند در شرایط و داده های متفاوت، از داده های آموزشی، عملکرد مطلوبی عرضه نماید. این مشکل بخصوص در حوزه هایی مانند امنیت شبکه که داده های برچسب خورده کمیاب و اغلب محرمانه هستند، اهمیت بیشتری پیدا می کند. پژوهش اخیر برای پاسخ به همین چالش طراحی شده است.» وی اضافه کرد: «در این پژوهش، با تمرکز بر پروتکلهای جغرافیایی مانند NMEA و KLV، روشی مبتنی بر مهندسی خصوصیت ها و مدل سازی آماری-تحلیلی توزیع خصوصیت ها معرفی و با استفاده از آن، مجموعه داده ای مصنوعی ساخته شده است. سپس، یک مدل یادگیری ماشین تنها با همین داده های مصنوعی آموزش داده شده و عملکرد آن با داده های واقعی مورد ارزیابی قرار گرفته است. نتایج نشان داده است که مدل آموزش دیده، حتی زمانیکه داده ها دارای نویز هستند، دقت بالایی در شناسایی پروتکل ها دارد.» عضو هیأت علمی دانشکدگان علوم و تکنولوژی های جدید دانشگاه تهران اظهار داشت: «از خصوصیت های برجسته ی این پژوهش، قابلیت تعمیم روش پیشنهادی به سایر حوزه های مبتنی بر یادگیری ماشین است. باآنکه مطالعه ی حاضر بطور دقیق تر بر شناسایی پروتکلهای جغرافیایی تمرکز دارد، اما رویکرد عرضه شده در تولید داده های مصنوعی می تواند در حوزه هایی مانند تشخیص نفوذ، تحلیل رفتار کاربران، تصویربرداری پزشکی، یا حتی در صنایع هوشمند مانند کشاورزی، لجستیک و حمل و نقل هم کاربرد داشته باشد؛ بخصوص در مواردی که داده های واقعی به علت محدودیت های حریم خصوصی، امنیتی یا هزینه بر بودن، در دسترس نیستند.» وی با اشاره به اینکه یکی از مهم ترین دستاوردهای این پژوهش، کاهش وابستگی به داده های واقعی برچسب خورده است، عنوان کرد: «این مزیت نه تنها از نظر صرفه جویی در منابع و زمان اهمیت دارد، بلکه از نظر یافتن چاره ای عملی برای حفظ حریم خصوصی کاربران و شناسایی پروتکلهای نادر یا جدید مهم می باشد.» یافته های این پژوهش اخیرا از جانب الزویر در نشریه Forensic Science International: Digital Investigation انتشار یافته و از راه این لینک در دسترس می باشد. منبع: دیجیتالر 1404/02/15 08:18:44 5.0 / 5 11 تگهای خبر: آموزش , تكنولوژی , تولید , دیجیتال این مطلب دیجیتالر را می پسندید؟ (1) (0) X تازه ترین مطالب مرتبط هوش مصنوعی استدلالی جدید مایکروسافت قادر به رقابت با سیستم های بزرگتر بیانیه رسمی سامانه شاد درباره ی حمله فیشینگ به دانش آموزان و والدین شروع بررسی پیشنویس سند نظام اقتصاد دیجیتال در مرکز ملی فضای مجازی روسیه تا ۲۰۳۰ به جمع تراشه سازان جهان می پیوندد کامنت بینندگان دیجیتالر در مورد این مطلب کامنت شما در مورد این مطلب نام: ایمیل: کامنت: سوال: = ۹ بعلاوه ۲