مـدير پروژه مـلي مـوتور جستوجـوگـر پارسي جو از شناسايـي 100 ميـليون واژه منحصر به فرد فـارسي تـوسط اين جستوجـوگـر بـومي خبر داد.
به گزارش روابط عمومي پروژه ملي موتور جستوجوگر پارسي جو، علي محمد زارع بيدكي با اعلام اين خبر افزود: برنامه نويسان و محققان نخبه كشورمان در بخش تحقيق و توسعه پردازش زبان موفق شدند، ظرفيت و توانايي اين جستوجوگر بومي را براي پردازش زباني به 100 ميليون كلمه يكتا (اعم از درست يا نادرست) در صفحات فارسي ارتقا دهند كه البته اين فرايند همچنان در حال توسعه است. وي با اشاره به اينكه كمتر از 10 درصد اين كلمات داراي ارزش اطلاعاتي و پردازشي هستند، گفت: از مجموع 100 ميليون واژه شناسايي شده حدود 10 ميليون كلمه از لحاظ املايي و مفهومي صحيح است كه البته پردازشگر زبان پارسي جو ميتواند حتي عبارتهاي نادرست را شناسايي و آن را به شكل صحيح جستوجو كند. وي خاطر نشان كرد: ماشيني كردن فرايند درك و برداشت مفاهيم از يك زبان طبيعي بزرگترين چالش در جستوجوگرهاي بومي محسوب ميشود كه البته دانشمندان و نخبگان كشورمان در حوزه فناوري اطلاعات موفق شدند اين مانع بزرگ را در موتور جستوجوگر پارسي جو به قابليتي خاص مبدل سازند، به طوري كه هم اكنون زبان فارسي در اين موتور جستوجوگر به طور كامل ماشيني شده و ميتواند مفاهيم عبارات كاربر را درك و پس از پردازش آن را جستوجو كند. وي در ادامه ابراز كرد: با قدرت گرفتن موتورهاي بومي در ايران، اين فرصت وجود دارد تا اين جستوجوگرها در كشورهاي فارسي زبان نيز مورد استفاده قرار گيرد و بدينوسيله از منافع اقتصادي بازار بزرگ و بكر موتور جستوجو در اين كشورها بهره مند شد.