حتما همه میدانید که این روزها مردم غزه در محاصره شدید صهیونیستها قرار دارند و از اولین امکانات حیات محرومند. جامعهی جهانی هم که خاک دو جهان بر سرشان باد مثل سگ از اسرائیل در هراسند و زبان در کام فروبردهاند. اعراب سوسمارخور هم که جای خود دارند. در این میان ویلاگنویسان ارزشی ایران عزیز، دست به کاری زده اند که غصه سرآید. بگذارید لااقل وقتی دیگران "غزه" یا "Gaza" را جستجوی می کنند اولین جایی که بازدید می شود متعلق به سازمان سیا نباشد. بگذارید به سایتی برسند که واقعیتها را بیان کرده است. کاش افرادی که این سایت را راه اندازی کرده اند، زبان عربی را هم می افزودند تا این اعراب بی غیرت هم تکانی به خودشان بدهند. ضمن اینکه لوگوهای تولیدی آنها هم هیچکدام، متن جایگزین که کمک میکند موتورهای جستجو زودتر آنها را ایندکس کنند ندارد و من خودم گذاشتم.
مست از خانه برون تاخته ای یعنی چه
زلف در دست صبا گوش به فرمان رقیب
این چنین با همه درساخته ای یعنی چه
شاه خوبانی و منظور گدایان شده ای
قدر این مرتبه نشناخته ای یعنی چه
نه سر زلف خود اول تو به دستم دادی
بازم از پای درانداخته ای یعنی چه
سخنت رمز دهان گفت و کمر سر میان
و از میان تیغ به ما آخته ای یعنی چه
هر کس از مهره مهر تو به نقشی مشغول
عاقبت با همه کج باخته ای یعنی چه
حافظا در دل تنگت چو فرود آمد یار
خانه از غیر نپرداخته ای یعنی چه
در پی مهاجرت صاحب این بلاگ از تهران، این وبلاگ نیز به مناطق زیر تبعید شده است:
امیدوارم این پردهای که ناگهان برانداخته شده، مایهی خیر برای من و دیگران باشد!

- یک تپل بامزه
منبع اندیشه بر خط

اینها آثاری است که به نظر من برای آیندگان باستانی خواهد شد!

بنابراين تصميم گرفتند استاد خود را پيدا کنند و علت جا ماندن از امتحان را براي او توضيح دهند.
بنابر اين آنها براي توجيه غيبت در امتحانشان فكري كردند ! آنها به استاد گفتند : ما به شهر ديگري رفته بوديم که در راه برگشت لاستيک خودرومان پنچر شد و از آنجايي که زاپاس نداشتيم تا مدت زمان طولاني نتوانستيم کسي را گير بياوريم و از او کمک بگيريم، به همين دليل دوشنبه دير وقت به خانه رسيديم. استاد فکري کرد و پذيرفت که آنها روز بعد بيايند و امتحان بدهند.
چهار دانشجو روز بعد به دانشگاه رفتند و استاد آنها را به چهار اتاق جداگانه فرستاد و به هر يک ورقه امتحاني را داد و از آنها خواست که شروع کنند. آنها به اولين مسأله نگاه کردند که 5 نمره داشت. سؤال خيلي آسان بود و به راحتي به آن پاسخ دادند. سپس ورقه را برگرداندند تا به سوال 95 امتيازي پشت ورقه پاسخ بدهند که سؤال اين بود:
کدام لاستيک پنچر شده بود...؟!!
فرخنده میلاد بانوی بزرگ اسلام، حضرت فاطمة زهرا (س) بر همگان، خاصه مادران و نومادران و همة زنان مسلمان مبارک باد.
یک تبریک ویژه هم باید به همسر عزیز و مهربانم بگویم که مدتی است سختیهای اولیة مادر شدن را تحمل میکند.
کلی از نرمافزار آراکس صحبت کردیم، ولی از اصل موضوع که OCR۱ باشه، غافل موندیم. امروز یکی از دوستان عالم به علوم فلسفی و رایانه و ... که خبر تولد آراکس را برایش فرستاده بودم، به من میل زد و گفت: اگر منظورتان نرمافزاریست که صحبت فارسی را تبدیل به متن تایپ شده میکند که خوب "نویسا" قبلا وجود داشته! و من متوجه شدم که OCR را باید بیشتر توضیح داد.
به تصویر زیر دقت کنید، ببیند کلمة «بازسازی» در آن وجود دارد یا نه؟ با کمی دقت متوجه میشوید که در خط ماقبل آخر، این کلمه وجود دارد... خوب حالا ببینید توی این کتاب 160 صفحهای چند بار در مورد «موفقیت» بحث شده است؟... مسلما کار سختی است و احتمالا حدود یکی دو ساعت طول میکشد تا متوجه شوید 40 بار از «موفقیت» صحبت شده است... حالا لطفا با استفاده از مطالب این کتاب یک گزارش چند صفحهای در مورد عوامل اصلی موفقیت بنویسید!.. خوب دیگر، باید به صفحهکلید متوسل شده و مطالب مورد نظر را یکی یکی با انگشتان مبارک تایپ بفرمایید.

تا حالا از این جور اتفاقات برایتان افتاده؟ مثلا بخواهید از مطالب یک کتاب، یک نامة اداری، یک مقالة جذاب و یا یک مطلب مجله در جایی مثل وبلاگ، پایان نامه، مقاله و یا آرشیو شخصی استفاده کنید. در چنین مواردی اگر به جای اصل کتاب، فایل متنی، PDF و یا WORD کتاب را در اختیار داشتید، بهتر نبود؟ مثلا جستجوی کلمة موفقیت در تمام کتاب 160 صفحهای چقدر طول میکشید؟ به اندازة یک کلیک ماوس!. مشکل اینجاست که غالب اسناد، مجلات و کتابهایی که داریم، به صورت کاغذیاند و فایل متنی آنها در دسترس نیست.
یک راه حل: چطور است اسنادی که متن آنها را لازم داریم، به تایپیست داده و فایل متنی آنها را تحویل بگیریم. صفحهای 260 تومان، 10 روزه هم آماده است!... اگر پول و زمان کافی داشته باشید، پیشنهاد خوبیه، ولی تحمل کنید، شاید راههای بهتری هم باشد.
خوشبختانه این موضوع، فقط مشکل من و شما نبوده و انسانهای زیادی در سالیان متمادی درگیر این مشکل بودهاند. بالاخره یک دانشمند روسی به نام تيورين در سال 1900 میلادی بحث خواندن خودکار متن را مطرح کرد و وسیلهای برای این منظور ساخت. بعدها تلاشهایی برای گسترش این وسیله که به ماشین نویسهخوان نوری، OCR، مشهور شد انجام گرفت. اولين ماشين OCR براي خواندن كدهاي پستي دستنويس در سال 1968 در ژاپن ساخته شد و بعدها به ترتیب کشورهای آلمان (1978)، آمریکا (1980) و انگلیس (1982) از ماشینهای OCR برای خواندن کدهای پستی تایپی استفاده کردند.
یک راه حل بهتر: در حال حاضر نرمافزارهای OCR جای ماشینهای مذکور را گرفتهاند و بهرهبرداری از این سیستمها برای همگان آسان شده است. کار این نرمافزارها این است که تصویر سند را به عنوان ورودی گرفته و با تحلیل ساختار آن و پردازش حروف و علائم موجود در آن، متن معادل سند را تولید کرده و به صورت یک فایل متنی، PDF و یا WORD در اختیار قرار میدهند. در واقع این نرمافزارها، نوعی تایپیست بسیار سریع هستند... این راهحل بهتر از راه حل قبلی نیست؟!
--------------------------------------------------------------------------------
۱. Optical Character Reader/Recognition
هر چند یه خورده دیر شده، اما خدا رو شکر سوز نشده هنوز!. اگر دنبال کرده باشید چندین بار اینترنت رو با این خبر به روز کردیم که تا دو سه روز دیگر آراکس متولد میشود! لیکن علی رغم تولد فنی آراکس، از نظر محصول تجاری اتفاقی نیفتاد... بالاخره به لطف خدا دیروز اینترنت دوباره با تلاشهای متخصصین داخلی! بهروز شد و اینبار آراکس در دنیای وب متولد شد. یک پاسخ مناسب برای یک نیاز واجب، نیازی بزرگ برای زبانی کهن.
سالهاست که نرمافزارهای متعدد OCR برای زبانهای مختلف دنیا به وجود آمده و میآید ولی هموطنان و همزبانان ما حسرت یک OCR فارسی بر دلشان مونده. شرکتها و افراد متعددی تلاشهایی کردند ولی آنچنان که انتظار میرفت به جایی نرسیدند تا اینکه دیدیم یک شرکت عربی، OCR دست و پاشکستهای نوشته و آن را برای زبان فارسی هم توسعه داده و به قیمت خون اجدادش به سازمانهای ایرانی میفروشد و ما به غیرتمان برخورد!. تصمیم گرفتیم تا پروندههای فارسی را با یک سامانة نویسهخوان ایرانی بازخوانی کنیم! یک نویسهخوان که دقیق بخونه، سریع باشه و امکانات نرمافزارهای OCR روز دنیا را داشته باشه. از روزی که این تصمیم گرفته شد بیش از دو سال میگذرد و اکنون آراکس با دقتی بسیار برتر از نرمافزارهایی مثل صخر و ReadIris، آمادة بهره برداری شده است.
ویرایش حرفهای آراکس که هماکنون عرضه شده است، قابلیتهای متنوعی دارد که نیازهای افراد، دفاتر خدمات رایانهای و سازمانهای کوچک و متوسط را به خوبی برآورده میکند. پشتیبانی از 10 قلم مرسوم فارسی، پشتیبانی از زبان انگلیسی، دقت متوسط 97% در سطح کلمه و 99% در سطح حروف، ویرایشگر داخلی قدرتمند، تولید خروجیهای متنی، MS Word و PDF و ماژول بهبود تصویر از جمله ویژگیهای کلیدی آراکس است. برای آشنایی بیشتر با مشخصات فنی و ظاهری آراکس به سایت تجاری آراکس مراجعه فرمایید.

در اینجا لازم میدانم از مدیریت شرکت معظم هدی سیستم جناب مهندس نوریان تشکر کنم که ریسک تعریف این پروژه که مسلما در شروع کار هیچ بازدهی مالی نداشت رو پذیرفتند. (امیدوارم از این پس بازدهی داشته باشه!)
از استاد گرانقدرم، جناب دکتر احساناله کبیر از بابت راهنماییها و همراهیشان تشکر میکنم.
از مدیر بخش تحقیقات، مهندس مظلوم متشکرم که ایدههای متعددی برای بهبود آراکس ارائه دادند و البته گیرهای زیادی هم دادند!.
از دوست عزیزم آقای حمیدرضا محمدی تشکر میکنم که زحمت برنامهنویسی رابط کاربری اعم از ماژولهای دریافت ورودی، ذخیرهسازی خروجی، مدیریت دستهها، غلطیابی، تنظیمات، بخشی از ویرایشگر، راهنمای کاربران و .... را به عهده داشتند.
از خانمها نصیری و نیاستی تشکر میکنم که زحمت طراحی و پیادهسازی بخشی از ویرایشگر داخلی و ذخیرهسازی خروجی به فرمت MS Word را برعهده داشتند.
از دوست گرانسنگ! جناب بهروز ودادیان متشکرم که این اواخر تشریف آوردند و زحمت قفل گذاری امن را بر دوش گرفتند.
از خانم حاجی حسنی متشکریم که در چند ماه ابتدای پروژه بخشی از ماژول پیش پردازش تصاویر رو نوشتند.
از منشیها و آقای مرتضی بخشی متشکرم که معمولا زحمت چاپ و اسکن اسناد مختلف برای تولید نمونههای آموزش را بر عهده داشتند.
دوباره از مهندسان مظلوم و سایر دوستانی که سایتهای هدی سیستم را به روز و سایتهای آراکس را آماده کردند متشکریم.
از همة دوستانی که نظرات فرمودند متشکریم.
از خودم هم متشکرم که اسم نرمافزار رو انتخاب کردم! و هستة پردازشی سیستم OCR رو طراحی و پیادهسازی کردم.
البته کلا قصد تشکرنویسی نداشتم، ولی به لحاظ تاریخی بهتر دیدم که اینکار رو بکنم!!
خوب دیگه از همه دوستان پولدار تقاضا میشود هر چه زودتر نویسهخوان آراکس را بخرند که ما خوشحال شیم و پولدار! حالا اگرم نمیخواین بخرین لااقل تبلیغشو که بکنین دیگه، دوستی به درد همین روزا میخوره. یک لینکی به سایت آراکس بدین هم کافیه!
AraxPage Automatic Reading of Any teXt Page


