ر پردازش رسم الخط زبان فارسی، با توجه به قرابتی که با رسم الخط عربی دارد، همواره در تعدادی از حرف¬ها مشکل وجود دارد که از جمله آن¬ها می¬توان به حروف “ک”، “ی”، همزه و … اشاره نمود. در اولین گام باید مشکلات مربوط به این حروف را برطرف ساخت. علاوه بر این، اصلاح و یکسان سازی نویسهی نیمفاصله و فاصله در کاربردهای مختلف آن و همچنین حذف نویسه¬ی «ـ» که برای کشش نویسه¬های چسبان مورد استفاده قرار می¬گیرد و مواردی مشابه برای یکسان¬سازی متون، از اقدامات لازم قبل از شروع فازهای مختلف می¬باشد. در این فاز مطابق با یک سری قاعده دقیق و مشخص، فاصله¬ ها و نیم¬فاصله¬ های موجود در متن برای علاماتی نظیر “ها” و “ی” غیرچسبان در انتهای لغات و همچنین پیشوندها و پسوندهای فعل¬ساز نظیر “می”، “ام”، “ایم”، “اید” و موارد مشابه جهت استفاده در فازهای بعدی، اصلاح می¬گردند .
متن خود را در کادر ذیل وارد نمایید .