بردار معنایی واژه‌ها

تعداد بازدید:۳۹۰
دریافت بردار واژه‌های فارسی حاصل از الگوریتم BilBOWA دریافت بردار واژه‌های انگلیسی حاصل از الگوریتم BilBOWA
دریافت بردار واژه‌های فارسی حاصل از الگوریتم VecMap دریافت بردار واژه‌های انگلیسی حاصل از الگوریتم VecMap
دریافت بردار واژه‌های فارسی حاصل از الگوریتم MUSE دریافت بردار واژه‌های انگلیسی حاصل از الگوریتم MUSE

 

معرفی: 

جبر خطّی شاخه‌ای از ریاضیات است که به بررسی و مطالعه ماتریس‌ها، بردارها و فضاهای برداری (فضاهای خطّی) می‌پردازد و در فیزیک، مهندسی، علوم طبیعی و علوم اجتماعی کاربردهای فراوانی دارد. فضای برداری مجموعه‌ای از بردارهاست که مقیاس‌پذیر بوده و قابلیت جمع یا ضرب شدن با هم را دارد. در ریاضیات، فیزیک و مهندسی، بردار اقلیدسی به شیئی هندسی اطلاق می‌گردد که دارای اندازه و جهت باشد. این نوع بردارها عموماً با پاره‌خطی که طول آن متناسب با اندازه بردار است و پیکانی که جهت بردار را نشان می‌دهد نمایش داده می‌شود. در فضای برداری، یک فضای n بُعدی وجود دارد. بنابراین این بردارهای اقلیدسی با طولی مشخص در فضای برداری نمایش می‌یابد. ویژگی این نوع نمایش آن است که امکان جمع و ضرب کردن بردارها در هم وجود دارد. در چارچوب معناشناسی توزیعی می‌توان با بازنمایی معانی در قالب بردار، به‌صورت محاسباتی به تحلیل معنایی زبان طبیعی پرداخت.

«بررسی اثرگذاری متغیرهای مؤثر بر بردار معنایی واژه‌ها در بازنمایی معنایی مبتنی‌بر فضای برداری» عنوان طرحی است که توسط دکتر مسعود قیومی در فاصله زمانی 1400 تا 1402 در پژوهشکده زبان‌شناسی پژوهشگاه علوم انسانی و مطالعات فرهنگی انجام پذیرفته است. در چارچوب این طرح، بازنمایی برداری بین‌زبانی واژه‌های فارسی و انگلیسی از دو پیکره تک‌زبانه مجزا، یک پیکره دوزبانه و فرهنگ لغت دوزبانه با به‌کارگیری سه الگوریتم بردارسازی BilBOWA، VecMap و MUSE به‌دست آمده‌است.

اطلاعات ارجاع

  • قیومی، م. (1402). بررسی اثرگذاری متغیرهای مؤثر بر بردار معنایی واژه‌ها در بازنمایی معنایی مبتنی‌بر فضای برداری، گزارش فنی، پژوهشکده زبان‌شناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایران.

سایر مستندات:

  • Ghayoomi, M. (2023). Training vs post-training cross-lingual word embedding approaches: A comparative study. International Journal of Information Science and Management, 21(1): 163-182. https://doi.org/10.22034/ijism.2022.1977779.0

 

اطلاعات انتشار داده:

تهیه کننده

مسعود قیومی

مجوز

GNU Lesser General Public License For Linguistic Resources

اجازه انتشار کاربر این داده حق تغییر و انتشار را ندارد و فقط مجاز به استفاده از داده با اهداف پژوهشی غیرتجاری و غیرنظامی است.
تاریخ ثبت 1402-04-27
آخرین تغییر 1402-04-27
آخرین ویرایش۲۳ مهر ۱۴۰۲