دادگان معنایی

تعداد بازدید:۶۶۳
دریافت دادگان معنایی (آموزش) دریافت دادگان معنایی (آزمون)

 

معرفی: 

دادگان معنایی فارسی دادگانی است که معنای تعداد 20 واژه هم‌نام و هم‌نویسه هدف در سطح جمله برچسب‌گذاری شده‌است. این مجموعه داده شامل 2000 جملهٔ برچسب‌خورده است. ازجمله ویژگی‌های این مجموعه داده این است که می‌تواند برای ابهام‌زدایی خودکار معنایی و همچنین استنتاج استقرایی خودکار معنایی به‌کار رود. این دادگان در قالب ساختار SemEval2010 تهیه شده‌است. جدول معنایی به‌کاررفته برای تعیین معنای واژه‌ها در بافت زبانی در این مقاله قابل دسترس است.

اطلاعات ارجاع

  • قیومی، مسعود (1399) استنتاج استقرایی معنای واژه از پیکرۀ زبانی با کمک روش‌های یادگیری ماشین، گزارش فنی، پژوهشکده زبان‌شناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایران.
  • قیومی، مسعود (1399) تشابه یابی خودکار معنای واژه از پیکره موازی، گزارش فنی، پژوهشکده زبان‌شناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایران.

سایر مستندات: 

  • قیومی مسعود (1398) «معرفی داده استاندارد طلایی در سطح معنا برای هم‎نگاره‎های فارسی،» در مجموعه مقالات سومین همایش ملی زبانشناسی پیکره‌ای، ویراستار: آزاده میرزایی، تهران: نشر نویسه پارسی، صص: 181-207.
  • قیومی مسعود (1398) «تعیین خودکار معنای واژه های فارسی با استفاده از تعبیه معنایی واژه،» فصلنامه پژوهشنامه پردازش و مدیریت اطلاعات، 35: 25-50.
  • Ghayoomi, Masood (2020)‎ "Density measure in context clustering for distributional semantics of word sense induction," Journal of Information Systems and Telecommunication, 8(1):15-24.
  • Ghayoomi Masood (2021) "Word sense induction in Persian and English: A comparative study," Journal of Information Systems and Telecommunication, 9(4): 263-274.

 

اطلاعات انتشار داده:

تهیه کننده

مسعود قیومی

مجوز GNU Lesser General Public License For Linguistic Resources
اجازه انتشار کاربر این داده حق تغییر و انتشار را ندارد و فقط مجاز به استفاده از داده با اهداف پژوهشی غیرتجاری و غیرنظامی است.
تاریخ ثبت 1400-08-03
تاریخ تغییر 1400-12-25
آخرین ویرایش۲۷ تیر ۱۴۰۲