ساخت دیباگر فارسی در آزمایشگاه واژه پرداز دانشگاه تهران
مدیر آزمایشگاه هوشمند پردازش متن و زبان طبیعی دانشکده مهندسی برق و کامپیوتر دانشگاه تهران از ایجاد دستگاه خطایاب فارسی به عنوان دستاورد آزمایشگاه پردازش متن و زبان طبیعی از دانشگاه تهران خبر داد.
هشام فیلی در گفت وگو با ای بی اس نیوز. وی با بیان اینکه امروزه حجم زیادی از محتوای رسمی فارسی در قالب اخبار، مقالات، پایان نامه ها و نامه های اداری به صورت الکترونیکی تولید و منتشر می شود، گفت: از این نظر صحت و کیفیت این متون اهمیت زیادی پیدا می کند.
وی افزود: در این راستا محققان آزمایشگاه پردازش متن و زبان های طبیعی دانشگاه تهران موفق به تولید محصولی موثر و دقیق برای حفاظت از خط و زبان فارسی در فضای مجازی شدند.
مدیر گروه نرمافزار دانشکده مهندسی برق و کامپیوتر خاطرنشان کرد: این نرمافزار که با عنوان ردیاب خطاهای املایی و معنایی ویرایشگر نامیده میشود، به عنوان یک افزونه بر روی ویرایشگرهای پرکاربرد مانند Microsoft Word و CKEditor نصب میشود. وب) و قابلیت استانداردسازی، خطایابی و اصلاحات هوشمند را دارد. کاربران این ناشران را ارائه می دهد.
دکتر فیلی خاطرنشان کرد: بنابراین تولیدکنندگان محتوا می توانند از این ابزار برای ویرایش محتوای الکترونیکی خود استفاده کنند و اخبار، مقالات و پایان نامه ها را به صورت استاندارد و بدون غلط املایی و تایپی تولید کنند.
وی بیان کرد: یکی از ویژگی های مهم «ویراستار» تصحیح خودکار است که می تواند بسیاری از اشتباهات اعم از غلط های املایی، نقطه گذاری، فاصله بین کلمات و برخی از اشتباهات معنایی را به صورت تمام اتوماتیک اصلاح کند.
استاد معمولی گروه هوش ماشینی و رباتیک دانشکده برق و کامپیوتر دانشگاه تهران گفت: یکی دیگر از نقاط قوت این دستاورد نسبت به محصولات مشابه، سازگاری آن با نیازهای کاربر و به عبارتی «ویرایشگر» مانند یک انسان است. سعی می کند پیشنهادات خود را با نوشته ها و اصلاحات ارائه دهد، با کاربران سازگار است و در نتیجه کیفیت بالاتری نسبت به ابزارهای مشابه دارد.
دکتر فیلی تصحیح خط بر اساس سیستم نگارش فارسی و استانداردسازی نگارش، استانداردسازی و فارسی سازی اعداد و املای غلط با دقت بسیار بالا را از جمله ویژگی های مهم «ویراستار» برشمرد و افزود: از دیگر ویژگی های این نرم افزار می باشد. پیشنهاد واژه های صحیح برای خطاها، شناسایی و تصحیح خطاهای رایج و مکرر، ارائه پیشنهاداتی از فرهنگستان زبان و ادبیات فارسی و شناسایی خطاهای معنایی امکان پذیر است.
وی یادآور شد: تصحیح خودکار (بدون دخالت کاربر) در موارد با اطمینان بالا، امکان افزودن کلمات جدید به فرهنگ لغت خطایاب، امکان اعمال تصحیح توسط کاربر برای تمامی خطاهای مشابه در یک متن در یک زمان و یادگیری خودکار از متن هایی که تاکنون ویرایش شده اند. برای متون جدید، یکی از ویژگی های دیگر خطایاب فارسی «ویراستار» است.
مدیر آزمایشگاه هوشمند پردازش متن و زبان طبیعی دانشکده مهندسی برق و کامپیوتر دانشگاه تهران افزود: علاقه مندان به این سامانه می توانند افزونه «ویراستمان» را برای استفاده دانلود و نصب کنند کارکنان رایگان از طریق سایت virastman.ir . علاوه بر این، سازندگان سیستمهای سازمانی مانند پورتالها و اتوماسیون اداری میتوانند از طریق «تماس با ما» در سایت بالا درخواست استفاده از نسخه سرور «Editorman» یا API آن را داشته باشند.
بر اساس این گزارش، آزمایشگاه پردازش هوشمند متن و زبان طبیعی به مدیریت دکتر هشام فیلی، استاد تمام دانشکده مهندسی برق و کامپیوتر دانشگاه تهران، در زمینه توسعه ابزارهای مرتبط با خوشنویسی و زبان فارسی در محیط فناوری اطلاعات بیش از یک دهه است. از فعالیت های قبلی این آزمایشگاه می توان به توسعه مترجم هوشمند متون انگلیسی به فارسی اشاره کرد که با نام مترجم هوشمند فرازین معرفی شد.
انتهای پیام