دادگان درختی سازهای
معرفی:
دادگان درختی سازهای فارسی دادگانی است که در چارچوب دستور ساخت سازهای هستهبنیان (HPSG) تهیه شدهاست این مجموعه داده شامل بیش از ۱۰۰۰ جملهٔ برچسبخورده بههمراه اطلاعات نحوی و برچسب رابطه سازهای مشخص وابسته به هسته است. ازجمله ویژگیهای دستور ساخت سازهای هستهبنیان این است که علاوه بر ارائهٔ توصیف ساختاری سلسله مراتبی سازهها، دانش واژگانی مورد استفاده قرار گرفته و روابط بین واژههای در یک سازه به طور واضح و صریح مشخص میگردد. این دادگان در قالب ساختار XML تهیه شدهاست.
اطلاعات ارجاع:
- Ghayoomi, M. (2014) From HPSG-based Treebanking to Parsing: Machine Learning for Data Annotation, Department of Mathematics and Computer Science, Freie Universität Berlin, Berlin, Germany.
سایر مستندات:
- قیومی، م. (۱۳۹۲). معرفی دادگان درختی و تجزیهگر خودکار فارسی. ارائه شده در هشتمین همایش زبانشناسی ایران، تهران، دانشگاه علامهطباطبایی.
- Ghayoomi, M., (2012). Bootstrapping the Development of an HPSG-based Treebank for Persian. In Linguistic Issues in Language Technology, 7 (1), 1-13.
- Ghayoomi, M. (2012). From Grammar Rule Extraction to Treebanking: A Bootstrapping Approach. In Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12), 1912-1919, Istanbul, Turkey.
- Ghayoomi, M. (2012). Word clustering for Persian statistical parsing. In Advances in Natural Language Processing, 126-137.
- Ghayoomi, M., and Moradiannasab, O. (2012). The effect of treebank annotation granularity on parsing: A comparative study. In Proceedings of the 11th International Workshop on Treebanks and Linguistic Theories ,109-114, Lisbon, Portugal.
اطلاعات انتشار داده:
تهیه کننده | |
---|---|
مجوز | |
اجازه انتشار | کاربر این داده حق تغییر و انتشار را ندارد و فقط مجاز به استفاده از داده با اهداف پژوهشی غیرتجاری و غیرنظامی است. |
تاریخ ثبت | 1400-08-03 |
آخرین تغییر | 1400-12-25 |