گزارش پنل رونمایی از وبسایتهای پژوهشکدهی زبانشناسی
گزارش پنل رونمایی از وبسایتهای پژوهشکدهی زبانشناسی در هفنهی پژوهش
به مناسبت هفتهی پژوهش، پنل «رونمایی از وبسایتهای پژوهشکدهی زبانشناسی» روز 23 آذر 1399، برگزار شد. در این پنل از دو وبسایت در پژوهشکدهی زبانشناسی رونمایی شد که عبارتست از:
• رونمایی از پایگاه دادگان پارسیک (متون فارسی میانه زرتشتی) توسط دکتر گشتاسب و دکتر حاجیپور
• رونمایی از سامانهی ارزیابی برخط مهارت زبانی درک مطلب توسط دکتر قیومی
در ادامه توضیحات مربوط به رونمایی از این دو پایگاه از نظرتان میگذرد:
پایگاه دادگان پارسیک
فرزانه گشتاسب نادیا حاجیپور
پژوهشکدهی زبانشناسی
پژوهشگاه علوم انسانی و مطالعات فرهنگی
پیکرهی پایگاه دادگان پارسیک را متون فارسی میانه زردشتی تشکیل میدهد. دورهی میانهی زبانهای ایرانی، شامل دورهای نسبتاً طولانی (حدود 1200 سال) از پایان حکومت هخامنشیان تا قرن سوم هجری است. از این دوره، اسنادی مکتوب از شش زبانِ فارسی میانه (= پهلوی ساسانی)، پهلوی اشکانی، سغدی، بلخی، ختنی و خوارزمی به دست ما رسیدهاست. زبان فارسی میانه یکی از مهمترینِ این زبانها است. بیشترین متون مربوط به زند یعنی ترجمه و تفسیر اوستا به زبان پهلوی است و همچنین متونی که بر اساس زند و ترجمههای اوستا نوشته شدهاست، مانند «دینکرد» و جز آن. دیگر موضوعات کتابهای پهلوی عبارت است از: فلسفی و کلامی، کشف و شهود و پیشگویی، اخلاقیات و اندرزنامهها، مناظره و مفاخره، تاریخ و جغرافیا، حماسه، فقه و حقوق، رسالات کوچک تعلیمی، فرهنگها و واژهنامهها، مانند «فرهنگ پهلوی» و «فرهنگ اویم ایوک».
پیشینهی پژوهش
تاکنون بسیاری از متون فارسی میانه آوانویسی و به زبانهای گوناگون ترجمه شدهاست و برای برخی از آنها واژهنامه نیز تهیه شدهاست، مانند «گزیدههای زادسپرم» از راشدمحصل (۱۳۸۵) که دارای املای پهلوی واژه، آوانویسی آن، معنای فارسی، واژهنامه و ارجاع به متن در واژهنامه است. برخی دارای ترجمه فارسی و تعلیقات و گاه آوانویسی و فاقد واژهنامه هستند، مانند: «شایستناشایست» از مزداپور (۱۳۶۹). برخی فقط واژهنامه هستند چون «گزیدههای زادسپرم» (بهار، 1351)، «شایست نشایست» (طاووسی، 1365) و «بندهش» (بهار، 1345). برای زبان پهلوی فرهنگ جامع واژگان و واژهنامهای که شامل واژههای تمامی متون پهلوی با ارجاع به متن باشد، نداریم. واژهنامههای نوشته شده محدود هستند مانند «فرهنگ زبان پهلوی»، «فرهنگ کوچک پهلوی»، «دستنامه پهلوی» و «واژهنامهی فارسی میانه مانوی» و «پارتی مانوی». برای بخش زیادی از متون فارسی میانه، همین پژوهشها نیز انجام نشدهاست و هنوز آوانویسی و ترجمهی آنها فراهم نیامدهاست که مهمترینِ آنها، متون زند اوستا و بخشهایی از دینکرد است. همهی پژوهشهایی تاکنون انجام شده، فقط به صورت کتاب منتشر شدهاست و اقدامی برای جمعآوری دادههای زبانی آنها در یک پایگاه اطلاعاتی واحد انجام نشدهاست؛ حتی به دلیل حجم زیاد دادهها، واژهنامهای جامع به صورت کتاب نیز برای متون فارسی میانه تهیه نشدهاست.
پیشینهی پیکرههایی که به صورت برخط تهیه شده است: نخست: میتوان «پهلواژ» (فرهنگ جامع فارسی میانه- فارسی نو) را نام برد که نخستین واژهنامهی برخط موجود است. در آن اطلاعات واژههای نُه متن فارسی میانه مشتمل بر واژه به پهلوی، آوانویسی، معنای فارسی و ارجاع به دستنویس پهلوی ثبت شدهاست. پیکرة این فرهنگ عبارت است از: «زند بهمنیسن»، «روایت پهلوی»، «گزیدههای زادسپرم»، «ماتیکان یوشت فریان»، «ارداویرافنامه»، «شایست ناشایست»، «کارنامهٴ اردشیر بابکان»، «متنهای پهلوی» و «مینوی خرد». پایگاه دیگری که تعدادی از متون پهلوی را به صورت برخط در اختیار پژوهشگران قرار میدهد، سایت «تزاروس زبانهای هندواروپایی و مواد متنی» (تیتوس) است. در این پایگاه متون بسیاری از زبانهای زنده و مردهی دنیا بارگذاری شدهاست. در بخش زبانهای ایرانیِ پایگاه تیتوس، متونی از زبانهای اوستایی، فارسی باستان، ختنی، بلخی، سغدی، پهلوی اشکانی، فارسی میانه (پهلوی)، فارسی نو و آسی در دسترس قرار گرفتهاست. در بخش پهلوی، بجز متنهای فارسی میانه مانوی، متون «ارداویرافنامه»، «اندرز اوشنر دانا»، «بندهش»، «دینکرد هفتم»، «کارنامه اردشیر بابکان»، «مینوی خرد»، «مادیان هزار دادستان»، «شایست نشایست»، «گزیدههای زادسپرم»، «زند بهمن یسن» و «متون پهلوی» در دسترس قرار دارد. از کارهای دیگر میتوان به وبگاه دانشگاه تگزاس و وبگاه «Wikisource» اشاره کرد. در سایت دانشگاه تگزاس در بخش آموزش آنلاین زبانهای هندیاروپایی، درسنامههایی شامل گرامر و نمونه متن و واژهنامهی تحلیلی برای آموزش زبانهای مختلف هندواروپایی تدوین شدهاست. از زبانهای ایرانی، درسنامههایی برای زبان فارسی باستان و اوستا تهیه شده و همراه با واژهنامه و تحلیل زبانشناختی کلمات متون مورد نظر بر روی سایت بارگذاری شدهاست. در وبگاه «Wikisource»، تنها، متن آوانویسیشده تمام اوستا بجز خردهاوستا (شامل وندیداد، یشتها، یسنا و ویسپرد) و ستون اول کتیبه بیستون به خط میخی فارسی باستان بارگذاری شدهاست. هیچ تحلیل زبانشناختی از واژههای این متون در این سایت ارائه نشدهاست. «پهلویکا» جدیدترین فرهنگ برخطی است که برای زبانهای ایرانی راهاندازی شدهاست. این وبگاه که در اواخر سال 2019 در دسترس پژوهشگران قرار گرفت، شامل واژههای پهلوی با حرفنویسی، آوانویسی، معنای انگلیسی و فارسی و نیز ریشهشناسی واژهها است. همچنین نمونههای کاربرد واژهها در متون بهصورت مثال ذیل هر مدخل در حال بارگذاری و تکمیل است.
قبل از بارگذاری متون کارهایی که صورت میگیرد به شرح زیر است:
الف- ابتدا اطلاعات کامل متن مورد نظر در محیط word وارد میشود که به شرح زیر است: 1- حروفچینی آوانویسی متن فارسی میانه بر اساس یکی از نسخههای موجود؛ 2- حروفچینی برگردان فارسی متن، بر اساس ترجمهی موجود؛ 3- تمام ارجاعات مربوط دستنویس و برگردان فارسی برای تمام بندهای هر فصل ذکر میشود 4- در مرحلهی بعد برگردان فارسی با نسخه مورد نظر مطابقت داده میشود؛ 5- بررسی برگردان فارسی و دادن یادداشت در صورت لزوم؛ پس از پایان این مرحله اطلاعات با اعضای گروه به اشتراک گذاشته میشود و کار نهایی میگردد تا در مرحلهی بعد اطلاعات وارد Excel شود: این مرحله نیز شامل 6- حروفچینی آوانویسی متن فارسی میانه ؛ 7- وارد کردن املای واژه به صورت حرفنویسی؛ 8- حروفچینی برگردان فارسی متن؛ 9- ذکر هزوارش یا غیر هزوارش بودن واژه؛ 10- وارد کردن تمام ارجاعات صفحه و سطر و فصل و بند؛ 11- وارد کردن بن واژه؛ 12- وارد کردن پرچسب دستوری واژه. پس از بازبینی و بررسی و نهایی شدن اطلاعات، در سایت بارگذاری میشود.
این سامانه ازطریق آدرس زیر قابل دسترسی است:
https://www.parsigdatabase.com/
رونمایی از سامانهی ارزیابی برخط مهارت زبانی درک مطلب
مسعود قیومی
پژوهشگاه علوم انسانی و مطالعات فرهنگی
هدف اصلی این طرح، طراحی و پیادهسازی نرمافزار ارزیابی توانایی درک مطلب فارسیآموز بهصورت پویا و تعاملی است. این مهارت جزء مهارت خواندن زبانآموز است. ویژگی منحصربهفرد این نرمافزار این است که زبانآموز و نرمافزار در تعامل با یکدیگر هستند؛ بنابراین، امکان ارزیابی سطح زبانی زبانآموز از درک مطلب توسط نرمافزار و بررسی نوع خطای کاربر و بررسی دانش زبانی وی وجود دارد.
مشکل اکثر نرمافزارهای تهیهشده برای آموزش و ارزیابی مهارتهای زبانیِ زبان فارسی این است که محتوای زبانی ثابت است و بین زبانآموز و نرمافزار هیچ رابطه تعاملی وجود ندارد. بهدلیل ثابتبودن سؤالات، پساز مدتی استفاده از این ابزارها و منابع آموزشی، امکان بررسی دقیق دانش زبانی و پیشرفت یادگیری زبانآموز و بررسی نوع خطای وی فراهم نمیگردد؛ چراکه این احتمال وجود دارد که کاربر برای پاسخ به سؤالات، از حافظه خود براساس آزمونهای پیشین و نه دانش زبانی استفاده کند.
باتوجهبه این که سطح زبانی زبانآموزان متفاوت است نیاز به تهیه آزمونهای ارزیابی متنوع است. برای انجام این کار میتوان در چارچوب «علوم انسانی دیجیتال»، از فناوری اطلاعات و روشهای محاسباتی در پردازش زبان طبیعی برای تولید خودکار سؤال درک مطلب برای سطوح مختلف زبانی، از سطح مقدماتی تا پیشرفته، استفاده نمود. ذخیرهسازی عملکرد کاربر در آزمونها و استخراج اطلاعات از عملکرد موجب میشود بتوان دانش زبانی و پیشرفت یادگیری زبانآموز را رصد کرد و ضمن ترسیم نمودار آموزشی از پیشرفت وی، نقاط ضعف زبانآموز را مشخص کرد و درنهایت بر کاهش و رفع مشکلات وی متمرکز نمود.
در این سامانه دو دسته سؤال تعریف شدهاست که پساز تعیین سطح اولیه و ارائه به زبانآموز، پاسخهای دادهشده به سؤالات توسط سامانه تصحیح و ارزیابی میشود: الف) سؤالات جاخالی ؛ ب) سؤالات چهارگزینهای. این سؤالات براساس اشکالات زبانآموز یا اشکالات مشترک با سایر زبانآموزان به وی ارائه میشود. در این سامانه امکان نمایش نمودار پیشرفت زبانی برای این دو دسته سؤال و دسترسی به بایگانی آزمونهای هر کاربر وجود دارد.
این سامانه ازطریق آدرس زیر در دسترس میباشد:
http://coling.ihcs.ac.ir
نظر شما :