نتیجه‌ای یافت نشد.

مسیریابی بهتر هوش مصنوعی با اضافه‌شدن داده‌های صوتی

شناسه خبر: 174015 سرویس: توسعه ، فناوری ، گوناگون دوشنبه ۳۰ ارديبهشت ۱۳۹۸, ۰۱ : ۲۱ : ۰۰
مسیریابی بهتر هوش مصنوعی با اضافه‌شدن داده‌های صوتی
دانشمندان با اضافه‌کردن اطلاعات صوتی به اطلاعات تصویری توانستند موفقیت هوش مصنوعی را در مسیرهای پیچ‌وخم سه‌بعدی افزایش دهند.
۵۵آنلاین :

محققان از ترکیب داده‌های صوتی با داده‌های تصویری برای عملکرد بهتر هوش مصنوعی در حوزه‌ی مسیریابی خبر داده‌اند. حس بینایی یکی از مهم‌ترین حس‌هایی است که انسان برای مسیریابی جهان پیرامونش از آن استفاده می‌کند. البته، صدا نیز به‌همان اندازه مهم است. انسان‌ها می‌توانند با دنبال‌کردن نشانه‌هایی چون بلندی صدا و جهت و سرعت سیگنال‌های صوتی، مسیرها را ردیابی کنند. دانشمندان دانشگاه فنلاند شرقی اخیرا پیش‌مقاله‌ای با این عنوان منتشر کردند: «آیا عاملان هوش مصنوعی به داده‌های صوتی مجهز می‌شوند؟» آن‌ها قصد دارند اطلاعات ردیابی مسیر در سیستم هوش مصنوعی را علاوه‌بر داده‌های تصویری با اطلاعات صوتی کامل‌تر کنند. نتایج اولیه نشان می‌دهد این رویکرد جدید توانایی عاملان را در تکمیل اهداف مسیرهای پیچ‌و‌خم سه‌بعدی بهبود می‌بخشد.

یادگیری فقط با استفاده از اطلاعات بصری برای هوش مصنوعی آسان نیست. برای مثال، رسیدن به هدف تنها با اطلاعات بصری برای هوش مصنوعی بسیار دشوار است. در محیط شبیه‌سازی‌شده، هدف معمولا در دید عامل در مسیر مستقیم وجود ندارد. سناریویی را در نظر بگیرید که اتاق‌های متعددی وجود دارد و سوژه در یکی از همین اتاق‌ها است. بنابراین، با اضافه‌کردن ویژگی‎های صوتی می‌توان به اطلاعات ارزشمندی دست یافت که بتواند به حل چنین مشکلاتی کمک کند.

پژوهشگران هوش مصنوعی از مدلی انعطاف‌پذیر برای انواع داده‌ها (پیکسل‌های صوتی و تصویری) به‌نام Q-network عمیق استفاده کردند. استفاده از این مدل در بازی‌های آتاری موفقیت آمیز بود. آن‌ها عامل را در محیط تحقیقاتی دیجیتال ساخته‌شده‌ی VizDoom در بازی تیراندازی اول شخص Doom با دو ویژگی مختلف زیر و بمی صدا و نمونه‌های خام اولیه صوتی آموزش دادند.

تیم تحقیقاتی توضیح داد اطلاعات محیط (فاصله از هدف) به‌صورت نمونه‌ی زیر و بمی صدا کدگذاری شد. سپس، این نمونه به عامل هوش مصنوعی همراه‌با تصویر ارائه شد. ازآنجاکه فاصله تا هدف به‌صورت کم‌و‌زیادشدن صدا کدگذاری شده بود، این ویژگی به‌راحتی می‌توانست اطلاعات مفیدی به عامل انتقال دهد. هرچه صدا بلندتر می‌شد، به این معنا بود که عامل به هدف نزدیک‌تر شده است. این ویژگی‌ها به‌عنوان بررسی منطقی برای دراختیارگذاشتن اطلاعات مفید ارائه‌شده درباره‌ی فاصله از هدف برای عامل تعیین شدند.

هوش مصنوعی / ai

در آزمایشی، سناریو VizDoom سفارشی روی کامپیوتر اجرا ‌‌شد. دانشمندان به عامل هوش مصنوعی تکلیفی برای حرکت در مسیر پیچ‌وخم سه‌بعدی شکل دادند. این حرکت به‌صورت چرخیدن به راست‌وچپ یا جلووعقب یا رفتن به اتاق‌های مختلف بود. در ابتدا، عامل اقدامات کاملا تصادفی انجام می‌داد؛ اما به‌مرورزمان و با دریافت پاداش هنگام رسیدن به هدف (روشی در روان‌شناسی با نام یادگیری تقویت‌کننده) عملکرد عامل بهبود پیدا کرد.

دو نوع متفاوت از آزمایش‌ها بررسی شدند. در مدل اول، عامل به‌صورت تصادفی در یک اتاق قرار می‌گرفت و در مدل دوم، عامل‌ها در یکی از پنج اتاق ظاهر می‌شدند. در مدل اول، اطلاعات تصویری همراه‌با زیر و بمی صدا و داده‌های خام اولیه صوتی کدگذاری شدند. زمانی‌که اطلاعات همراه‌با ویژگی‌های صوتی کدگذاری شده بودند، به‌طورمتوسط عامل‌ها پاداش بهتری در هر آزمون به‌دست آوردند تا اینکه فقط اطلاعات تصویری به‌تنهایی ارائه می‌شدند. در مدل بعدی، ویژگی‌های صوتی‌وتصویری باهم باعث شدند تا عامل موفق شود در بیشتر موارد به هدف برسد.

طبق آزمایش‌ها، دانشمندان به این نتیجه رسیدند زمانی‌که تنها از داده‌های تصویری استفاده می‌کنند، میزان موفقیت در عملکرد عامل هوش مصنوعی ۴۳ درصد است. این در حالی است که وقتی به اطلاعات تصویری اطلاعات خام اولیه‌ی صوتی و زیر و بمی صدا اضافه می‌شود، میزان موفقیت عامل به‌طورمیانگین به‌ترتیب تا ۸۷ و ۸۶ درصد افزایش می‌یاید. به‌طورمتوسط تعداد مراحل موردنیاز برای رسیدن به هدف هنگام استفاده صرف از اطلاعات تصویری ۱,۴۲۰ مرحله است. این تعداد زمانی‌که اطلاعات خام اولیه‌ی صوتی و زیر و بمی صدا اضافه شدند، به‌ترتیب ۷۵۱ و ۶۱۴ مرحله است.

این تیم تحقیقاتی به‌غیر از فعالیت در حوزه بازی‌های ویدئویی، مشغول آزمایش‌ها متفاوت در محیط‌های آزمایشی مختلف است.


منبع : زومیت
اشتراک گذاری

نظرات

دیدگاه‌های شما پس از تایید ناظر منتشر می‌شود.
متون غیرفارسی و پیام‌های حاوی توهین، تهمت یا افترا تایید نخواهد شد.

انصراف

دیدگاه 55

بیشتر

سیاستگذاری به روش آزمون و خطا چه بلایی سر اقتصاد آورده است؟

قصه تلخ جهش های نرخ ارزی با تکرار سیاست های پیمان سپاری ارزی، پیش فروش سکه و بعد تنظیم بازار به زور و ارعاب یا اصرار بر نرخ ارز غیر تعادلی تنها مصادیقی از تکرار تجربه نامطلوب سیاستگذاری اقتصادی هستند. از منظر رأی دهنده عام و اقتصاددان خبره سیاستگذاران به وقت معزولی شبلی و بایزیدند و به وقت صدارت و زعامت به دنبال تکرار خطای تقبيح شده گذشتگان می روند.

اقتصاد و جامعه چگونه از آدم های خوب هیولا می سازد؟

با بی پولی همه می تونن کنار بیان، چیزی که باید یاد بگیری پول درآوردنه!

اخبار ویدئویی

بیشتر

ویدیو: ورود مسوولین با خودرو به میدان نقش جهان اصفهان

ورود مسوولین با خودرو به میدان نقش جهان اصفهان برای حفاظت از این محوطه تاریخی، ورود خودروها ممنوع است

ویدیو: کشتن بیرحمانه توله خرس ۲ساله در سوادکوه

هشدار - دارای صحنه دلخراش کشتن بیرحمانه توله خرس ۲ساله در سوادکوه شنبه ۲۵خرداد یک توله خرس ۲ساله در منطقه دراسله سوادکوه استان مازندران؛ هنگامی که همراه مادر خود در حرکت بود از یک تپه به پایین سقوط کرده و از مادرش فاصله گرفت. اهالی روستا به طرز بی رحمانه ای با ضربات متعدد سنگ و چوب توله خرس را زخمی کردند. هرچند کوهنوردان عابر به محیط بان ها اطلاع دادند و آن ها به کمک توله خرس شتافتند

خبرها

بیشتر

خبرهای دیگر