به گزارش مهر، بهروز مینایی با اشاره به فعالیتهای پژوهشی کارگروه خط و زبان فارسی در محیط رایانه شورای عالی اطلاع رسانی به وضعیت فعلی کارگروههای دادگان ملی، فونت، تبدیل متن به گفتار، تبدیل گفتار به متن، نویسه خوانی نوری (OCR) و خطایاب املایی اشاره کرد و گفت: نرم افزار خطایاب که پیش نویس اولیه آن به اتمام رسیده به کاربران امکان خطایابی خودکار املایی و ویرایش زبان فارسی را در محیط رایانه ای می دهد.
انتشار پژوهشنامه نویسه خوانی نوری
وی با اشاره به اتمام پژوهشنامه نویسه خوانی نوری (OCR) گفت: این پژوهشنامه حدود یک ماه است که منتشر شده و در صورت استفاده بخش خصوصی از آن برای اجرا آماده خواهد شد.
مینایی افزود: در این طرح بازیابی خودکار نوشتار فارسی با استفاده از متون اسکن شده و تبدیل به متن قابل ویرایش است. همچنین در انتشار پژوهشنامه نویسه خوان نوری فراهم آوردن امکان ذخیره و بازیابی اطلاعات به خط و زبان فارسی و بهینهسازی آن از اولویت فراوان برخوردار است.
به گفته معاون دبیرخانه شورایعالی اطلاع رسانی، نویسهخوان نوری به عنوان تنها ابزار بازیابی اطلاعات متنی از تصویر، یکی از مهمترین ابزارهای تبدیل اطلاعات موجود به صورت قابل استفاده و پردازش در رایانهها و در نتیجه یکی از ارکان مهم تحقق محیط رایانهای فارسی به شمار میآید.
مینایی اضافه کرد: بررسی مسائل نویسهخوانی نوری فارسی، یافتن جایگاه کنونی نویسهخوانی نوری فارسی، نگاه به مباحث مطرح در این حوزه از زوایای گوناگون فنی، کاربردی و نیز بسترسازی و تعریف کردن پروژههای زیرساختی مرتبط با نویسهخوانی نوری فارسی برای کاهش فاصله تا وضعیت مطلوب از اهداف اصلی این پژوهشنامه است.
تبدیل متن به گفتار و تبدیل گفتار به متن
معاون فنی دبیرخانه شورایعالی اطلاع رسانی در مورد وضعیت فعلی پژوهشنامه تبدیل متن به گفتار(TTS) نیز گفت: این پژوهشنامه با همکاری اساتید دانشگاه امیرکبیر پیگیری شده و هم اکنون در مرحله چاپ قرار دارد.
وی ادامه داد: پژوهشنامه تبدیل گفتار به متن (SR) نیز با همکاری اساتید دانشگاه تهران در حال انجام است اما باید توجه داشت که این پژوهشنامهها هر یک شامل حدود 15 پیش نویس است که باید از طریق فراخوان اجرا در اختیار بخش خصوصی گذاشته شود تا به صورت نرم افزار درآید.
به گفته مینایی تبدیل گفتار به متن (SR) و متن به گفتار (TTS) کاربردهای مختلفی از جمله تسهیل کار با رایانه برای نابینایان دارد.
وی افزود: شورای عالی اطلاع رسانی در حال خرید دادگان ملی ( بالغ بر 11 میلیون کلمه) است که میتواند مبنای کار بسیاری از پژوهشها و فعالیتهای مرتبط با پردازش گفتار طبیعی فارسی باشد.
تهیه فونت دوم نستعلیق فارسی
معاون فنی دبیرخانه شورایعالی اطلاع رسانی با اشاره به خدمات شورای پژوهشی فونت از جمله دستهبندی قلمها، فونتها و انواع نگارشهای موجود و به خصوص بررسی استاندارد در این حوزه و طراحی فونت فارسی به شکل یونیکد از اتمام پژوهشنامه فونت نستعلیق فارسی 2 خبر داد و گفت: پس از پایان مراحل بازنگری، این پژوهشنامه برای استفاده عرضه خواهد شد.
وی افزود: طرح تولید خط نستعلیق زبان فارسی انجام شده و در فاز دوم این طرح پروژه اضافه کردن اعراب در زمینه خط نستعلیق فارسی قابل انجام است.
انتشار طرح جامع کاربری زبان فارسی در محیط رایانه
مینایی همچنین از تدوین و انتشار پژوهشنامه طرح جامع کاربری خط و زبان فارسی در محیط رایانهای خبر داد و گفت: این طرح که حاصل تلاش و تحقیقات چندین ساله دبیرخانه شورایعالی اطلاع رسانی است بزودی انتشار مییابد.
وی گفت: پیش نویس این طرح به صورت سند جامع برای استفاده پژوهشگران و محققان چاپ و منتشر شده و به موسسات دولتی و دانشگاهها ارائه میشود.
ارائه پیشنهاد برای تشکیل خانه زبان فارسی
معاون فنی دبیرخانه شورایعالی اطلاع رسانی با اشاره به برخی معادل سازی کلمات در محیط رایانه که از سوی فرهنگستان زبان و ادب فارسی انجام میشود گفت: برخی انتقادات به دستورالعمل املای خط و زبان فارسی در محیط رایانه وارد بود که در این زمینه جلساتی با فرهنگستان زبان و ادب فارسی داشتیم و مباحثی نیز مطرح شد.
مینایی با بیان اینکه فرهنگستان تا اندازهای نسبت به جایگزینی کلمات فارسی به جای کلماتی که از دیگر زبانها در محیط رایانه به عاریت گرفته شدهاند، عقب است افزود: نیاز جامعه برای استفاده از این واژگان زبان فارسی در محیط وب به دلیل محدویت در بودجه و نیروی انسانی پاسخ داده نشده است.
وی در عین حال از ارائه پیشنهاد برای تشکیل خانه زبان فارسی در محیط وب با همکاری فرهنگستان زبان و ادب فارسی، دانشگاه تهران و همکاری تمامی نهادهای ذی ربط خبر داد و گفت: هنوز پاسخی درباره این پیشنهاد دریافت نکرده ایم.