تراشه ای که ۲ میلیارد تصویر در ثانیه پردازش می کند


بر اساس گزارشات جام جم آنلاینهوش مصنوعی (AI) نقش مهمی در بسیاری از سیستم‌ها، از پیش‌بینی متن در گوشی‌های هوشمند گرفته تا تشخیص‌های پزشکی دارد.

بسیاری از سیستم های هوش مصنوعی از مغز انسان الهام گرفته و بر اساس شبکه های عصبی مصنوعی ساخته شده اند.

شبکه‌های عصبی مصنوعی معادل‌های الکتریکی نورون‌های بیولوژیکی به هم پیوسته هستند که با مجموعه‌ای از داده‌های شناخته‌شده مانند تصاویر آموزش داده می‌شوند و سپس برای شناسایی یا طبقه‌بندی داده‌های جدید استفاده می‌شوند.

در شبکه‌های عصبی سنتی که در تشخیص تصویر استفاده می‌شوند، تصویر شی ابتدا روی یک حسگر تصویر مانند دوربین دیجیتال گوشی هوشمند شکل می‌گیرد. سپس حسگر تصویر نور را به سیگنال های الکتریکی و در نهایت به داده های باینری تبدیل می کند که می تواند با استفاده از تراشه های کامپیوتری پردازش، تجزیه و تحلیل، ذخیره و طبقه بندی شود. تسریع این قابلیت‌ها برای بهبود طیف گسترده‌ای از برنامه‌ها، مانند تشخیص چهره، تشخیص خودکار متن در تصاویر، یا کمک به دستگاه‌های روباتیک در تشخیص موانع، حیاتی است.

در حالی که یک تراشه مجهز به آخرین فناوری طبقه‌بندی تصویر می‌تواند میلیاردها محاسبه را در ثانیه انجام دهد و برای اکثر برنامه‌ها به اندازه کافی سریع است، طبقه‌بندی تصویر پیچیده‌تر مانند تشخیص اجسام متحرک، تشخیص اجسام سه بعدی یا طبقه‌بندی سلول‌های میکروسکوپی در بدن دارای قابلیت‌ها و محدودیت‌هایی است. : محاسبات حتی قوی ترین فناوری ها را تحت فشار قرار می دهد.

برای دور زدن این محدودیت، مهندسان دانشگاه پنسیلوانیا اولین تراشه مقیاس پذیر را توسعه داده اند که می تواند تقریباً بلافاصله تصاویر را طبقه بندی و شناسایی کند.

فیروز پلاتونی، دانشیار مهندسی برق و سیستم ها، به همراه فرشید آشتیانی، دانشجوی فوق دکتری و دانشجوی کارشناسی ارشد الکساندر جی. اینها شامل تبدیل سیگنال های نوری به الکتریکی، نیاز به تبدیل داده های ورودی به فرمت باینری، یک واحد حافظه بزرگ و محاسبات وابسته به زمان بود.

آنها با دستکاری مستقیم نور دریافتی از بدن با استفاده از یک شبکه عصبی نوری عمیق اعمال شده بر روی یک تراشه مربع ۹.۳ میلی متری به این امر دست یافتند.

این مطالعه که در Nature منتشر شده است، تعداد سلول‌های عصبی بینایی نای را توضیح می‌دهد که با استفاده از سیم‌های نوری یا موجبرها به هم متصل شده‌اند تا شبکه‌های عمیقی از لایه‌های بسیاری از نورون‌ها را تشکیل دهند که شبیه به مغز انسان هستند. اطلاعات از لایه های شبکه عبور می کند و هر مرحله به طبقه بندی تصویر ورودی در یکی از کلاس های آموخته شده کمک می کند. در مطالعه محققان، تصاویری که اسلاید به آنها امتیاز داد، تصاویری از کاراکترهایی بود که با دست طراحی شده بودند که شبیه حروف بودند.

درست مانند شبکه عصبی در مغز ما، این شبکه عمیق طوری طراحی شده است که امکان پردازش سریع اطلاعات را فراهم می کند. محققان نشان دادند که تراشه های آنها می تواند طبقه بندی کامل تصاویر را در نیم نانوثانیه انجام دهد. این معادل زمانی است که تراشه های کامپیوتر دیجیتال سنتی یک مرحله محاسباتی را انجام می دهند.

افلاطون می‌گوید: «تراشه‌های ما اطلاعات را از طریق آنچه محاسبات با انتشار می‌نامیم پردازش می‌کنند، به این معنی که بر خلاف سیستم‌های وابسته به زمان، محاسبات با ارسال نور از طریق تراشه انجام می‌شود. ما همچنین از مرحله تبدیل سیگنال‌های نوری به سیگنال‌های الکتریکی می‌گذریم، زیرا تراشه‌های ما می‌توانند مستقیماً سیگنال‌های نوری را بخوانند و پردازش کنند، و هر دوی این تغییرات فناوری ما را بسیار سریع‌تر می‌کنند.

توانایی تراشه برای پردازش مستقیم سیگنال های نوری، مزایای آن را افزایش می دهد.

آشتیانی می‌گوید: «وقتی تراشه‌های رایانه‌ای فعلی سیگنال‌های الکتریکی را پردازش می‌کنند، اغلب آنها را از طریق واحد پردازش گرافیکی یا GPU تغذیه می‌کنند که فضا و انرژی را اشغال می‌کند.» تراشه ما نیاز به ذخیره سازی داده ها را از بین می برد و نیاز به یک ماژول حافظه بزرگ را بی نیاز می کند.

پلاتو می گوید: با حذف ماژول حافظه ای که تصاویر را ذخیره می کند، امنیت داده ها را نیز افزایش می دهیم. تراشه هایی که مستقیماً داده های تصویر را می خوانند نیازی به ذخیره سازی تصویر ندارند و منجر به نشت داده نمی شوند.

تراشه ای که اطلاعات را با سرعت نور می خواند و امنیت سایبری بالاتری را فراهم می کند، بدون شک در بسیاری از زمینه ها استفاده خواهد شد. این یکی از دلایلی است که جستجو برای این فناوری در چند سال گذشته افزایش یافته است.

Geers می‌گوید: «ما اولین کسی نبودیم که فناوری را معرفی کردیم که سیگنال‌های نوری را مستقیماً می‌خواند، اما اولین کسی هستیم که یک سیستم کامل را بر روی تراشه‌ای ساختیم که با فناوری‌های موجود سازگار باشد و برای داده‌های پیچیده‌تر مقیاس‌پذیر باشد.

این تراشه با طراحی شبکه عمیق خود نیاز به آموزش برای یادگیری و طبقه بندی مجموعه داده های جدید دارد، مشابه روشی که انسان ها یاد می گیرند. هنگامی که یک مجموعه داده خاص ارائه می شود، شبکه عمیق اطلاعات را دریافت می کند و آنها را به دسته هایی که قبلاً آموخته است طبقه بندی می کند.

مهندسان می‌توانند با افزودن لایه‌های عصبی بیشتر، اندازه را افزایش دهند و به تراشه اجازه می‌دهند تصاویر پیچیده‌تری را با وضوح بالاتر اسکن کنند.

افلاطون می‌گوید: «نکته واقعاً هیجان‌انگیز در مورد این فناوری این است که می‌تواند بسیار بیشتر از طبقه‌بندی تصاویر انجام دهد. ما می دانیم که چگونه انواع داده ها را به میدان های الکتریکی تبدیل کنیم. تصاویر، صدا، گفتار و بسیاری از انواع دیگر داده ها. اکنون، ما می‌توانیم انواع مختلف داده‌ها را به یک دامنه نوری تبدیل کنیم که تقریباً بلافاصله با استفاده از این فناوری پردازش می‌شوند.

او می‌گوید: «یک نرخ فریم معمولی را برای فیلم‌ها تصور کنید تا بفهمید یک تراشه با چه سرعتی می‌تواند اطلاعات را پردازش کند. فیلم با سرعت ۲۴ تا ۱۲۰ فریم در ثانیه پخش می شود. در حالی که این تراشه می تواند نزدیک به دو میلیارد فریم در ثانیه پردازش کند! ما اکنون راه حلی برای مواردی داریم که به محاسبات بسیار سریع نیاز دارند و بسیاری از کاربردهای آنها ممکن است در حال حاضر قابل درک نباشد.

منبع: ایسنا