گزارش چهارمین همایش ملی زبان‌شناسی پیکره‌ای

۱۴ آبان ۱۴۰۲ | ۱۱:۵۸ کد : ۲۴۴۷۳ آخرین عناوین گزارش نشست‌ها

تعداد بازدید:۷۰۵

گزارش چهارمین همایش ملی زبان‌شناسی پیکره‌ای

چهارمین همایش ملی زبان‌شناسی پیکره‌ای، 20 مهرماه 1402 به همت انجمن زبان‌شناسی ایران و با همکاری پژوهشگاه علوم انسانی و مطالعات فرهنگی، گروه پژوهشی محاسبات نوین دانشگاه علامه طباطبائی در تالار حکمتِ پژوهشگاه علوم انسانی و مطالعات فرهنگی برگزار شد.
به‌یاد استاد فقید، کورش صفوی
سخنرانی‌های این همایش در چهار نشست صبح و عصر ارائه شد. در ابتدا، دکتر آزیتا افراشی، رئیس انجمن زبان‌شناسی ایران، ضمن خیرمقدم به حاضران و گرامی‌داشت یاد استاد فقید، مرحوم دکتر کورش صفوی، از حاضران دعوت کردند در فراخوان میراث دکتر صفوی حضور مؤثری داشته باشند. وی هم‌چنین، ضمن تشکر از استقبال دانشجویان، پژوهشگران و استادان از برگزاری این همایش، حاضران را به حمایت مادی و معنوی از انجمن زبان‌شناسی ایران از طریق ثبت‌نام و پرداخت حق عضویت و نیز شرکت در رویدادهای علمی انجمن زبان‌شناسی دعوت کرد. وی همچنین از دبیر علمی، دکتر آزاده میرزائی و دبیر اجرایی همایش، آقای محمد سعید میری، قدردانی به‌عمل آورد.
سپس، دبیر علمی همایش، دکتر آزاده میرزائی، ضمن گرامی‌داشت یاد و خاطرۀ مرحوم دکتر کورش صفوی و حمایت ایشان در برگزاری نخستین همایش زبان‌شناسی پیکره‌ای و هم‌چنین، مرحوم دکتر سلیمه زمانی، یار دیرین انجمن از حمایت برگزارکنندگان این همایش، نویسندگان و شرکت‌کنندگان برای حضور پربار در این رویداد قدردانی کرد. در کنار حضور فیزیکی شرکت‌کنندگان، امکان پیوستن علاقه‌مندان از طریق پیوند مجازی(برخط) نیز فراهم شد.
بررسی نقش واژه‌های دستوری و محتوایی در سبک‌سنجی رایانشی نثر داستانی معاصر
ریاست نشست اول برعهده دکتر ویدا شقاقی، استاد بازنشسته دانشگاه علامه طباطبائی بود. محمد بحرانی، عضو هیأت علمی دانشگاه علامه طباطبائی، اولین سخنران این نشست مقاله‌ای با عنوان «بررسی نقش واژه‌های دستوری و محتوایی در سبک‌سنجی رایانشی نثر داستانی معاصر» که کاری مشترک بود، ارائۀ داد. هدف نگارندگان در این پژوهش، بررسی و مقایسۀ کارایی واژه‌های دستوری و محتوایی در تعیین سبک داستانی معاصر بود. نتایج ارزیابی کارایی واژه‌های دستوری و محتوایی با استفاده از سامانۀ خودکار شبکه‌های عصبی، برتری واژه‌های دستوری را بر واژه‌های محتوایی نشان داد. افعال کمکی و ضمایر، به‌ویژه ضمایر شخصی بیشترین میزان کارایی را در میان انواع واژه‌های دستوری در تعیین سبک نویسنده داشتند. سخنران دوم، توسط مریم رمضانخانی، دانشجوی دکتری زبان‌شناسی دانشگاه علامه طباطبائی، پژوهشی بود با عنوان «کاربرد افزوده در فارسی گفتاری معیار: پژوهشی پیکره‌بنیاد» که ارائه شد. هدف نگارنده بررسی کاربرد افزوده در بندهای بی‌نشان فارسی گفتاری با بهره‌گیری از داده‌های طبیعی بود. نتایج این پژوهش نشان داد که میزان کاربرد افزوده از دیگر سازه‌های بند نظیر فاعل و موضوع‌های درونی فعل بیشتر است و این سازه‌ها در همۀ جایگاه‌های بند به‌کار می‌روند که این رفتار با توجه به ماهیت و کاربرد افزوده‌ها منطقی بوده است.
براساس داده‌های این پژوهش، افزوده‌ها به پنج نوع توصیفی، زمان، مکان، حالت و مقدار تقسیم شدند و جایگاه آن‌ها در بند تعیین شد. افزایش حجم پیکره‌های فارسی گفتاری معیار به‌منظور تعیین جایگاه افزوده‌های مکان، زمان و حالت پیشنهاد شد.
استخراج مجموع دادگان گویش شیرازی برمبنای مفهوم مقوله‌بندی شناختی»
نشست دوم به ریاست دکتر آزیتا افراشی با چهار سخنرانی آغاز شد. نخست مریم نورنمایی، دانشجوی دکتری دانشگاه الزهرا مقاله‌ای با عنوان «استخراج مجموع دادگان گویش شیرازی برمبنای مفهوم مقوله‌بندی شناختی» ارائه کرد. در این پژوهش بر استفاده از رویکرد مقوله‌بندی شناختی در مرحلۀ آغازین فرهنگ‌نویسی به منظور دستیابی به نظم شناختی بین مفاهیم پایه تأکید شد. منابع پیکرۀ این پژوهش از طریق نقد یک فرهنگ گویش شیرازی به‌منظور دستیابی به نظم شناختی بین مدخل‌های آن و بررسی روابط معنایی بین آن‌ها و در مرحلۀ دوم از طریق بسط فهرست واژه‌ها از طریق مصاحبه با چند گویشور شیرازی به‌دست آمد. مقوله‌بندی شناختی در دو سطح اولیه و میانی صورت گرفت. هم‌چنین، مقوله‌های شناختی اصلی فیزیکی و انتزاعی به تفکیک مقوله‌های واژگانی تعیین شدند. در نهایت 1320 واژۀ پایه برای گویش شیرازی به‌دست آمد. در ادامه دکتر افراشی نیز بهره‌مندی از این رویکرد را برای انجام پژوهش‌های مشابه در گویش‌های دیگر کارآمد دانست.
سخنران دوم این نشست، محمدسعید میری، دانشجوی دکتری زبان‌شناسی دانشگاه علامه طباطبائی، بود که مقالهای با عنوان «Reliability in Filmic Metaphor Identification: Building a Metaphor Corpus for Films (FilMet) Using Filmic Metaphor Identification Procedure (FILMIP)» ارائه کرد. روال تشخیص استعارۀ فیلمی یکی از روش‌های تشخیص استعاره در فیلم‌هاست. پژوهش ارائه‌شده به ارزیابی این روش در تشخیص استعاره‌های فیلمی به‌منظور تدوین پیکره‌ای از این استعاره‌ها پرداخته است. 20 فیلم تبلیغات تلویزیونی فارسی در بازۀ زمانی 1394-1401 برچسب‌گذاری شدند.
عملکرد این روش با انجام سه آزمون ارزیابی شد و نتایج نشان داد که روال تشخیص استعارۀ فیلمی ابزاری کارآمد برای تشخیص و تحلیل استعاره‌های فیلمی است. استفاده از این روش معتبر در تدوین پیکرۀ فیلمی به درک بهتر استعاره‌ها در حالت‌های بصری کمک می‌کند.
ملاحظاتی در باب ارتقاء کیفیت فرهنگ‌های یک‌زبانۀ زبان‌آموز انگلیسی
در ادامه دکتر مهران برزوفرد ریاست نشست سوم را برعهده گرفت. عنوان سومین سخنرانی «ملاحظاتی در باب ارتقاء کیفیت فرهنگ‌های یک‌زبانۀ زبان‌آموز انگلیسی: رویکردی پیکره‌بنیاد» بود که توسط ابوالفضل علمدار، دانشجوی دکتری علامه طباطبائی ارائه شد.. در این پژوهش، چهار فرهنگ معتبر یک‌زبانۀ زبان‌آموز انگلیسی (فرهنگ انگلیسی معاصر لانگمن، فرهنگ پیشرفتۀ زبان‌آموز اکسفورد، فرهنگ پیشرفتۀ زبان‌آموز کمبریج و فرهنگ همایندهای آکسفورد) از نظر شیوۀ عرضۀ اطلاعات براساس معیار سوم مالکیل بررسی شدند. مدخل‌های موجود در این فرهنگ‌ها با داده‌های موجود در پیکرۀ انگلیسی آمریکایی معاصر مقایسه شد. ایرادات مشاهده‌شده به هفت دسته تقسیم و به‌علت بروز آن‌ها نیز اشاره شد. درنهایت، نقش زبان‌شناسی پیکره‌ای در ارتقای فرهنگ‌ها و کاهش خطاهای فرهنگ‌نویسی مورد تأکید قرار گرفت.
معرفی و برچسب‌گذاری پیکره زبانی حاصل از محتوای کتاب‌های درسی
در ادامه دکتر مسعود قیومی، عضو هیأت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی مقاله‌ای با عنوان «معرفی و برچسب‌گذاری پیکره زبانی حاصل از محتوای کتاب‌های درسی» که پژوهشی مشترک بود، ارائه کرد. وی در ابتدا یادآور شد، توصیف ویژگی‌های محتوای زبانی کتاب‌های درسی دانش‌آموزان می‌تواند در بحث سیاست‌گذاری‌های مربوط به زبان فارسی در راستای ارتقاء زبان فارسی در مقام زبان علم موردتوجه قرار گیرد. تمام جمله‌های متون درسی (فارسی، علوم، مطالعات اجتماعی و هدیه‌های آسمانی) کلاس‌های اول تا ششم ابتدایی حدوداً حاوی 208 هزار واژه به تفکیک پایه و درس تهیه شدند و پس از هنجارسازی در فرایند پیش پردازش، در دو سطح بن‌واژه‌سازی و مقوله‌های دستوری برچسب‌گذاری شدند. نتایج این پژوهش به شناخت بیشتر محتوای کتاب‌های درسی انجامید.
شناسایی و استخراج همایندهای زبان فارسی بااستفاده از روش‌های رایانشی
نشست سوم به ریاست دکتر مسعود قیومی آغاز شد. اولین سخنرانی نشست توسط محمدسعید میری به نمایندگی از گروه نویسندگان ارائه شد. عنوان پژوهش «شناسایی و استخراج همایندهای زبان فارسی بااستفاده از روش‌های رایانشی» بود. پیکرۀ این پژوهش پایگاه دادۀ زبان فارسی بوده است. هم‌چنین، مجموعه داده‌ای از همایندهای زبان فارسی براساس کتاب فرهنگ زبان‌آموز پیشرفتۀ فارسی ساخته شد. آموزش بردارهای تعبیۀ fasttext مدل زبانی با شبکۀ حافظۀ کوتاه‌مدت ماندگار صورت گرفت و بررسی همایندها با چند روش انجام شد. فراخوانی این مدل زبانی از طریق تنظیم دقیق پارس‌برت با استفاده از فهرست‌های هزارتایی همایندها و غیرهمایندها محاسبه شد و بررسی مقابله‌ای همایند هزار ترجمۀ جملۀ فارسی به انگلیسی در موتور جستجوی گوگل صورت گرفت. نتایج نشان دادند که هر دو مدل زبانی و پارس‌برت می‌توانند همایندها را پیش‌بینی کنند و پارس‌برت به عنوان مدل قوی‌تر برای بررسی همایند در زبان فارسی معرفی شد. موتور جستجوی گوگل در ترجمۀ همایندها به سه طریق عمل کرد: 1. ترجمه درست؛ 2. ترجمۀ واژه به واژه و 3. نادیده‌گیری ترجمۀ همایندها.
طراحی و تهیۀ دادگان برچسب‌خوردۀ فارسی از اخبار مرتبط با همه‌گیری کوید-19
سخنرانی بعدی با حضور خانم فروغ زاهد، دانشجوی کارشناسی‌ارشد علوم رایانۀ دانشگاه علامه طباطبائی ادامه یافت. ایشان به ارائۀ پژوهشی مشترک با عنوان «طراحی و تهیۀ دادگان برچسب‌خوردۀ فارسی از اخبار مرتبط با همه‌گیری کوید-19 به منظور تشخیص اخبار جعلی» پرداخت که با همکاری دکتر محمد بحرانی، استادیار گروه رایانۀ دانشگاه علامه طباطبائی و دکتر علیرضا منصوری، استادیار پژوهشگاه ارتباطات و فناوری اطلاعات تهران صورت گرفت. پیکرۀ این پژوهش را 5000 پست مربوط به اخبار همه‌گیری کوید-19 از پیام‌رسان تلگرام استخراج و برچسب‌گذاری شد. این اخبار از لحاظ هفت وظیفه: 1. صحیح یا جعلی بودن؛ 2. سیاسی بودن؛ 3. افزایش سطح آگاهی عمومی، توصیه و روحیه‌دهی به خواننده؛ 4. مطالب مربوط به دارو، درمان یا مراقبت‌های بهداشتی؛ 5. آمار مرگ و میر؛ 6. محتوای خبر حاوی یا فاقد مطالب تنفرآمیز، سرزنش، عیب‌جویی، منفی‌بافی و غیره و 7. ارزش خبر در بررسی واقعیت بررسی شدند و برچسب درست، نادرست یا خنثی گرفتند. دستاورد این پژوهش ایجاد شیوه‌نامۀ مناسب برچسب‌گذاری بود که در نهایت در اختیار دو برچسب‌زن خبره برای بررسی وضعیت جعلی بودن، صحیح یا خنثی بودن خبر قرار گرفت و در صورت عدم‌توافق، نظرخواهی از برچسب‌زن سوم پیشنهاد شد. در نهایت، دسته‌های متوازنی در وظیفۀ جعلی یا صحیح بودن اخبار به‌دست آمد.
بررسی نحوۀ تأثیرگذاری بیماری کوید-19 بر نگرش افراد و بر زبان مطبوعات
آخرین نشست همایش به ریاست دکتر علی رضاقلی فامیان برگزار شد. عبدالنور خالقی مقاله خود را با عنوان «A Corpus-Based Study of Attitudes toward COVID-19» ارائه کرد.
در این پژوهش، نگارندگان به بررسی نحوۀ تأثیرگذاری بیماری کوید-19 بر نگرش افراد و بر زبان مطبوعات در رسانه‌های برخط و چاپی پرداختند. داده‌های این پیکره از پیکرۀ ویروس کرونا استخراج شد که شامل بیش از یک میلیارد واژه از متون در بارۀ زمانی مارس تا نوامبر 2020 بود. از نرم‌افزار تحلیل دادۀ Sketch Engine برای تشخیص و ارزیابی همایندهای کوید-19 و بسامد آن‌ها در دو بازۀ زمانی استفاده شد. نتایج این بررسی نشان داد که همایندهای کوید-19 را می‌توان در چند قاب معنایی مانند علمی، اجتماعی، کنشی، اقتصادی و سیاسی طبقه‌بندی کرد.
این همایندها با گذر زمان تغییر می‌کنند و بازتاب نگرش‌ها و دیدگاه‌های متفاوتی دربارۀ این همه‌گیری هستند. بدین ترتیب، کوید-19 به شدت بر نگرش مردم و بر زبان مطبوعات در رسانه‌های برخط و چاپی تأثیرگذار بوده است. نگرش مردم به کوید-19 بیشتر نشان‌دهندۀ مسئولیت‌پذیری اجتماعی آن‌ها بوده است تا اینکه بازتاب تمایلات سیاسی و اقتصادی آن‌ها در هنگام رعایت شیوه‌نامه‌ها و واکسیناسیون باشد.
بررسی پیکره‌بنیاد واژه «مرگ» در اشعار فارسی با تکیه بر نظریۀ استعارۀ مفهومی
ارائه آخرین سخنرانی همایش توسط مریم رمضان‌خانی به نمایندگی از سوی جلال تباشیر، دانشجوی دکتری زبان‌شناسی پژوهشگاه علوم انسانی و مطالعات فرهنگی انجام شد. این پژوهش به «بررسی پیکره‌بنیاد واژه «مرگ» در اشعار فارسی با تکیه بر نظریۀ استعارۀ مفهومی» اختصاص داشت. نگارنده در دو اثر مثنوی مولانا و شاهنامۀ فردوسی به بررسی نحوۀ عینی‌سازی مفهوم انتزاعی مرگ در حوزه‌های مبدأ و دستیابی به شباهت‌ها و تفاوت‌ها در نگرش این دو شاعر به پدیدۀ مرگ پرداخته بود. تحلیل داده‌ها با استفاده از نرم‌افزار واژه‌نمای AntConc صورت گرفت. نتایج نشان داد که مولانا از 24 مبدأ و فردوسی از 19 مبدأ برای عینی‌سازی مفهوم مرگ استفاده کرده‌اند. نُه حوزه در آثار ذکرشده مشترک بوده است و تحلیل‌ها نشان دادند که در نگاه فردوسی، مرگ موجودی ترسناک و ویران‌گر است و فضایی از نیستی و نابودی و ویرانی را به تصویر می‌کشد. آمار مرگ در اشعار مولانا، گاه خوشایند و گاهی ناخوشایند است و از یک‌سو، فضایی پر درد و رنج و از سوی دیگر، فضای رهایی، حکمت و رشد را تداعی می‌کند. در نتیجه، موضوع و محتوای اشعار بررسی‌شده در تصویرسازی مفاهیم و نوع نگرش شاعر به آن‌ها تأثیرگذار بوده است. نویسنده که به‌صورت برخط در جلسه حضور داشت، به پرسش‌های شرکت‌کنندگان پاسخ داد.
در اختتامیۀ همایش، دکتر آزادۀ میرزائی ضمن قدردانی از نویسندگان و مخاطبان نشست به بازخوردهای حاضران در همایش پرداخت و به کیفیت و نحوۀ ارائۀ سخنرانی‌ها و رضایت خاطر حاضران اشاره کرد. دبیر علمی همایش در ادامه اعلام کرد که در آیندۀ نزدیک شاهد برگزاری کارگاه‌ها و برنامه‌هایی با محوریت زبان‌شناسی پیکره‌ای خواهیم بود. در نهایت، همایش با قدردانی دبیر علمی از دست‌اندرکاران برگزاری این همایش، به‌علاوه از دبیر اجرایی و مجری برنامه، محمدسعید میری و کمیتۀ اجرایی همایش، زهرا ابراهیم بانکی، دکتر محمدحسن ترابی، مریم رمضان‌خانی، مریم نورنمائی و گرفتن عکس یادگاری دسته‌جمعی خاتمه یافت./پایان

گزارش چهارمین همایش ملی زبان‌شناسی پیکره‌ای

نظر شما :