دادگان معنایی
دریافت دادگان معنایی (آموزش) | دریافت دادگان معنایی (آزمون) |
معرفی:
دادگان معنایی فارسی دادگانی است که معنای تعداد 20 واژه همنام و همنویسه هدف در سطح جمله برچسبگذاری شدهاست. این مجموعه داده شامل 2000 جملهٔ برچسبخورده است. ازجمله ویژگیهای این مجموعه داده این است که میتواند برای ابهامزدایی خودکار معنایی و همچنین استنتاج استقرایی خودکار معنایی بهکار رود. این دادگان در قالب ساختار SemEval2010 تهیه شدهاست. جدول معنایی بهکاررفته برای تعیین معنای واژهها در بافت زبانی در این مقاله قابل دسترس است.
اطلاعات ارجاع:
- قیومی، مسعود (1399) استنتاج استقرایی معنای واژه از پیکرۀ زبانی با کمک روشهای یادگیری ماشین، گزارش فنی، پژوهشکده زبانشناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایران.
- قیومی، مسعود (1399) تشابه یابی خودکار معنای واژه از پیکره موازی، گزارش فنی، پژوهشکده زبانشناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایران.
سایر مستندات:
- قیومی مسعود (1398) «معرفی داده استاندارد طلایی در سطح معنا برای همنگارههای فارسی،» در مجموعه مقالات سومین همایش ملی زبانشناسی پیکرهای، ویراستار: آزاده میرزایی، تهران: نشر نویسه پارسی، صص: 181-207.
- قیومی مسعود (1398) «تعیین خودکار معنای واژه های فارسی با استفاده از تعبیه معنایی واژه،» فصلنامه پژوهشنامه پردازش و مدیریت اطلاعات، 35: 25-50.
- Ghayoomi, Masood (2020) "Density measure in context clustering for distributional semantics of word sense induction," Journal of Information Systems and Telecommunication, 8(1):15-24.
- Ghayoomi Masood (2021) "Word sense induction in Persian and English: A comparative study," Journal of Information Systems and Telecommunication, 9(4): 263-274.
اطلاعات انتشار داده:
تهیه کننده | |
---|---|
مجوز | GNU Lesser General Public License For Linguistic Resources |
اجازه انتشار | کاربر این داده حق تغییر و انتشار را ندارد و فقط مجاز به استفاده از داده با اهداف پژوهشی غیرتجاری و غیرنظامی است. |
تاریخ ثبت | 1400-08-03 |
تاریخ تغییر | 1400-12-25 |