کد خبر: ۵۶۷۵
تاریخ انتشار: ۰۶ مهر ۱۳۹۴ - ۱۰:۵۳
ارسال به دوستان
ذخیره
از مجموع یکصد میلیون واژه شناسایی شده حدود 10 میلیون کلمه از لحاظ املائی و مفهومی صحیح است که البته پردازشگر زبان پارسی جو می تواند حتی عبارت های نادرست را شناسایی و آن را به شکل صحیح جستجو کند.
مدیر پروژه ملی موتور جستجوگر پارسی جو از شناسایی و پردازش زبانی 100 میلیون واژه منحصر به فرد فارسی توسط این جستجوگر بومی خبر داد.

به گزارش خبرآنلاین، علی محمد زارع بیدکی با اعلام این خبر افزود: برنامه نویسان و محققان نخبه کشورمان در بخش تحقیق و توسعه پردازش زبان موفق شدند، ظرفیت و توانایی این جستجوگر بومی را برای پردازش زبانی به یکصد میلیون کلمه یکتا (اعم از درست یا نادرست) در صفحات فارسی ارتقا دهند که البته این فرایند همچنان در حال توسعه است.

وی با اشاره به اینکه کمتر از 10 درصد این کلمات دارای ارزش اطلاعاتی و پردازشی هستند گفت: از مجموع یکصد میلیون واژه شناسایی شده حدود 10 میلیون کلمه از لحاظ املائی و مفهومی صحیح است که البته پردازشگر زبان پارسی جو می تواند حتی عبارت های نادرست را شناسایی و آن را به شکل صحیح جستجو کند.

زارع بیدکی به یکی دیگر از قابلیت های ویژه این موتور جستجوگر ایرانی پرداخت و ادامه داد: بخش پردازش زبان پارسی جو توانایی استخراج دوازده هزار جفت کلمه مترادف از محتوای وب را دارد که قابلیت مذکور این امکان را به کاربر خواهد داد تا کلمات، واژه ها و حتی عبارات هم معنی فارسی را به طور یکجا جستجو کند.

مدیر پروژه موتور جستجوگر پارسی جو تشخیص افعال صرفی در این حوزه را یکی دیگر از ویژگی های بی بدیل این جستجوگر ایرانی برشمرد و اضافه کرد: پارسی جو قادر است بیش از 9 هزار شکل صرفی از افعال را تشخیص و آنها را به یکدیگر تبدیل کند، امکانی که باعث می شود کاربران فارسی زبان، نه تنها یک عبارت و جمله بلکه اشکال مختلف صرفی (انشایی) یک جمله را به طور همزمان جستجو کنند.

وی خاطر نشان کرد: ماشینی کردن فرایند درک و برداشت مفاهیم از یک زبان طبیعی بزرگترین چالش در جستجوگرهای بومی محسوب می شود که البته دانشمندان و نخبگان کشورمان در حوزه فناوری اطلاعات موفق شدند این مانع بزرگ را در موتور جستجوگر پارسی جو به قابلیتی خاص مبدل سازد، به طوری که هم اکنون زبان فارسی در این موتور جستجوگر به طور کامل ماشینی شده و می تواند مفاهیم عبارات کاربر را درک و پس از پردازش آن را جستجو کند.

زارع بیدکی بزرگترین دلیل موفقیت موتورهای بومی را موضوع زبان دانست و افزود: با نگاهی دقیق به موتورهای جستجو در دنیا به این نکته پی می بریم که مرز ایجاد موتورهای جستجو و استفاده کاربران از آنها جغرافیایی نبوده است بلکه زبان یک عامل تعیین کننده در استفاده از این ابزار نوین است به گونه ای که موتور جستجوی "یاندکس" روسیه علت موفقیت خود را فهم و پردازش بهتر زبان روسي می داند، به طوری که کاربران روسی زبان کشورهای اوکراین، قزاقستان، آذربایجان و بلاروس را نیز جذب کرده و از این طریق درآمدزایی هنگفتی می کند.

وی در ادامه تاکید کرد :با قدرت گرفتن موتورهای بومی در ایران، این فرصت وجود دارد تا این جستجوگرها در کشورهای فارسی زبان نیز مورد استفاده قرار گیرد و بدینوسیله از منافع اقتصادی بازار بزرگ و بکر موتور جستجو در این کشورها بهره مند شد.

مدیر پروژه موتور جستجوگر پارسی جو در پایان افزود: به طور کلی قابلیت ویژه موتورهای بومی شناخت صحیح زبان مادری یک کشور و بهره مندی از ابزارهای پردازش زبان بومی و دسترسی به زبان شناسان آن کشور است که البته همین امر باعث خواهد شد تا موتورهای جستجوگر داخلی بتوانند به نیازهای ایرانیان خارج از کشور مانند دریافت اطلاعات و اخبار روزانه و یا خدمات رسانی در مراودات متنوع پاسخ دهند.

برچسب ها: موتور جستجوگر
نظر شما
نام:
ایمیل:
* نظر:
آخرین اخبار

توقیف اتوبوس حامل 11 هزار لیتر گازوئیل قاچاق در ریگان

قیمت طلا، سکه و ارز پنجشنبه ۱۳ اردیبهشت‌ماه ۱۴۰۳

مهم‌ترین قدمی که می‌توان برای سلامتی کبد برداشت

اعمال قانون و اعزام به پارکینگ در انتظار خودروهای تک پلاک

سیل و طوفان بیش از هزار میلیارد به کشاورزی جنوب کرمان خسارت وارد کرد

پیش‌بینی هواشناسی از وضعیت هوای کرمان طی امروز

تشکیل کمیته امنیت روانی جهت برخورد با شایعه سازان و نشردهندگان اکاذیب در فضای مجازی

استاندار کرمان: بازگشت حقوق معادن به قانون نیاز دارد / بانک‌های خصوصی هیچ کمکی به استان نمی‌کنند

زلزله ۴.۷ ریشتری فاریاب کرمان را لرزاند

آبگیری بخشی از تالاب جازموریان در پی بارندگی‌های اخیر

پربازدید ها

استاندار کرمان: بازگشت حقوق معادن به قانون نیاز دارد / بانک‌های خصوصی هیچ کمکی به استان نمی‌کنند

قیمت طلا و سکه کاهشی شد

کارمندان دولت حق دریافت هدیه را ندارند

سیل و طوفان بیش از هزار میلیارد به کشاورزی جنوب کرمان خسارت وارد کرد

صعود قیمت خودروهای داخلی و خارجی در بازار

قیمت طلا، سکه و ارز پنجشنبه ۱۳ اردیبهشت‌ماه ۱۴۰۳

پر بحث

10 روستای استان کرمان به عنوان روستای هدف گردشگری انتخاب شدند   (۲۴ نظر)

عیدوک بامری که بود و چه رابطه‌ای با حاج قاسم داشت/ احمد یوسف زاده توضیح داد   (۶ نظر)

مشکل تامین زمین در کرمان برای ساخت واحدهای نهضت ملی مسکن  وجود ندارد   (۴ نظر)

پیش بینی وضعیت آب و هوای کرمان   (۲ نظر)

ببینید| فیلم کامل سخنان سید حسین مرعشی در شبکه افق   (۲ نظر)

ببینید| گزارش تصویری گفتارنو از مراسم عزاداری منزل حاج ماشاءالله خدادادپور در کرمان   (۲ نظر)

امام جمعه سابق راور درگذشت   (۲ نظر)

صدور هشدار زرد هواشناسی؛ ورود سامانه بارشی نسبتا قوی به کرمان   (۱ نظر)

دو روستا و یک شهر استان کرمان به اینترنت پرسرعت متصل شدند   (۱ نظر)

بشنوید| نوحه خون گلوی حسین با صدای مداح کرمانی   (۱ نظر)