اپلیکیشن کیبورد محبوب گوگل موسوم به Gboard اکنون به سطحی از هوش مصنوعی رسیده که قادر است دستخطهای نامفهومی مثل دستخط پزشکان را هم تشخیص دهد.
بر اساس گزارش تشریحی جدید گوگل، توسعهدهندگان بخش یادگیری ماشینی اپلیکیشن Gboard مدل جدیدی از این فناوری تولید کردهاند که میتواند حتی بدترین دستخطها را تشخیص دهد.
حالت مبتنی بر هوش مصنوعی این کیبورد از زمان عرضه این برنامه پیشرفتهای زیادی داشته اما مهمترین چالش آن احتمالا هنوز فرا نرسیده است. اصلاحات جدیدی که با کمک پیشرفتهای هوش مصنوعی در سیستم یادگیری ماشینی این اپلیکیشن حاصل شده و امکان تشخیص دستخطها را فراهم میکند، حالا منجر به شکل گیری معماریها و روشهای آموزشی جدیدی شده که میتواند دقت این نرمافزار را ۲۰ تا ۴۰ درصد نسبت به نسخه قبلی افزایش دهد.
جدیدترین روشی که توسط مهندسان این شرکت به کار رفته در مقالهای به طور کامل توضیح داده شده و ممکن است در نگاه اول بیش از حد پیچیده به نظر برسد، اما عملا سازوکار جذاب و خلاقانهای دارد. این سیستم بر اساس شناسایی نقاط لمس، منحنیهای بزیه و شبکههای عصبی بازگشتی (RNN)، به طور خاص شبکههای عصبی شبه-بازگشتی (QRNN)، کار میکند.
این یعنی نرمافزار گوگل دیگر به طور کامل بر «شاخصههای اکتشافیِ طراحی شده با دست» که ضربهها را به کاراکترهای جداگانه تقسیم میکند وابسته نیست. این سیستم ابتدا نقاط تاچی را پیدا میکند که نقطه آغازین ضربه را نشان میدهند. این نقاط نشان میدهد که هر نشانه قرار بوده جزوی از کدام کاراکتر باشد اما در عین حال نرمافزار این نقاط را به زبان قابل خواندن کامپیوتر که همان منحنیهای بزیه باشد ترجمه میکند.
روش QRNN با جابجا شدن میان لایههای تابیده و بازگشتی، پیش از رمزگشایی دستنوشتهها به متن دیجیتال، این خمیدگیها و نقاط لمس را میخواند.
به طور خلاصه، هوش منصوعی هر کاراکتر را به همان صورتی میخواند که انسانها هنگام نوشته شدن آنها را مشاهده میکنند. این سازوکار به نرمافزار گوگل اجازه میدهد تا بر اساس مجموعهای طبیعیتر از پارامترهایی که به راحتی توسط سیستم شناسایی میشوند، حدس بهتری داشته باشند. در اینجا هر خمیدگی با مجموعهای از دادهها مقایسه میشود تا احتمالات حاصله، خروجی پیشفرض و پیشنهادات ممکن تولید شود.
سرعت و سبکی
سوای از پیشرفتهای مربوط به دقت حالت دستخط در Gboard، توسعهدهندگان این اپلیکیشن اطمینان یافتهاند که این برنامه برای موبایل همچنان سبک بماند. آنها برای حفظ دقت و افزایش سرعت پروسهها، پیش از انتقال همه چیز به مدلهای TensorFlow Lite، هوش مصنوعی خود را در TensorFlow آموزش دادهاند. این کار باعث کاهش حجم کلی ابزار مربوطه شده و در عین حال حجم این ماژول آموزشی را در مقیاس «بایت به ازای وزن» تا ۷۵ درصد کاهش داده است.
این نکته اهمیت بسیار زیادی دارد چرا که یک کیبورد در وهله اول ابزاری برای ورود متن و برقراری ارتباط است. وقتی از این برنامه برای پیامرسانی یا یادداشتبرداری استفاده میشود، حالت دستخط باید با حداکثر سرعت بتواند پاسخگوی نیاز کاربر باشد.
این قابلیت در حال حاضر فقط برای زبانهای مبتنی بر حروف لاتین مثل انگلیسی و زبانهایی که مشابه آن هستند در دسترس است، اما به زودی میتوانیم منتظر پشتیبانی از سایر زبانها هم باشیم. اگرچه تاکنون تاریخی برای توسعه این قابلیت اعلام نشده، اما گوگل میگوید تیم آنها مشغول کار است تا قابلیت مذکور را در اختیار بیش از ۱۰۰ زبانی قرار دهد که در حال حاضر در بخش زبانهای دستخط این اپلیکیشن پشتیبانی میشوند.
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.