گزارش پنل رونمایی از وب‌سایت‎های پژوهشکده‌ی زبان‌شناسی

۲۴ آذر ۱۳۹۹ | ۱۲:۰۷ کد : ۲۰۱۰۴ آخرین عناوین هفته پژوهش ۱۳۹۹

تعداد بازدید:۲۱۹۶

گزارش پنل رونمایی از وب‌سایت‎های پژوهشکده‌ی زبان‌شناسی در هفنه‌ی پژوهش

به مناسبت هفته‌ی پژوهش، پنل «رونمایی از وب‌سایت‎های پژوهشکده‌ی زبان‌شناسی» روز 23 آذر 1399، برگزار شد. در این پنل از دو وب‌سایت در پژوهشکده‌ی زبان‌شناسی رونمایی شد که عبارتست از:
• رونمایی از پایگاه دادگان پارسیک (متون فارسی میانه زرتشتی) توسط دکتر گشتاسب و دکتر حاجی‌پور
• رونمایی از سامانه‌ی ارزیابی برخط مهارت زبانی درک مطلب توسط دکتر قیومی
در ادامه توضیحات مربوط به رونمایی از این دو پایگاه از نظرتان می‌گذرد:

پایگاه دادگان پارسیک
فرزانه گشتاسب نادیا حاجی‌پور
پژوهشکده‌ی زبان‌شناسی
پژوهشگاه علوم انسانی و مطالعات فرهنگی
پیکره‌ی پایگاه دادگان پارسیک را متون فارسی میانه زردشتی تشکیل میدهد. دوره‌ی میانه‌ی زبان‌های ایرانی، شامل دوره‌ای نسبتاً طولانی (حدود 1200 سال) از پایان حکومت هخامنشیان تا قرن سوم هجری است. از این دوره، اسنادی مکتوب از شش زبانِ فارسی میانه (= پهلوی ساسانی)، پهلوی اشکانی، سغدی، بلخی، ختنی و خوارزمی به دست ما رسیده‎است. زبان فارسی میانه یکی از مهم‌ترینِ این زبان‌ها است. بیشترین متون مربوط به زند یعنی ترجمه و تفسیر اوستا به زبان پهلوی است و همچنین متونی که بر اساس زند و ترجمه‌های اوستا نوشته شدهاست، مانند «دینکرد» و جز آن. دیگر موضوعات کتاب‌های پهلوی عبارت است از: فلسفی و کلامی، کشف و شهود و پیشگویی، اخلاقیات و اندرزنامه‌ها، مناظره و مفاخره، تاریخ و جغرافیا، حماسه، فقه و حقوق، رسالات کوچک تعلیمی، فرهنگ‌ها و واژه‌نامه‌ها، مانند «فرهنگ پهلوی» و «فرهنگ اویم ایوک».
پیشینه‌ی پژوهش
تاکنون بسیاری از متون فارسی میانه آوانویسی و به زبان‌های گوناگون ترجمه شده‌است و برای برخی از آنها واژه‌نامه نیز تهیه شده‎است، مانند «گزیده‌های زادسپرم» از راشدمحصل (۱۳۸۵) که دارای املای پهلوی واژه، آوانویسی آن، معنای فارسی، واژهنامه و ارجاع به متن در واژه‌نامه است. برخی دارای ترجمه فارسی و تعلیقات و گاه آوانویسی و فاقد واژه‌نامه هستند، مانند: «شایست‌ناشایست» از مزداپور (۱۳۶۹). برخی فقط واژه‌نامه هستند چون «گزیده‌های زادسپرم» (بهار، 1351)، «شایست نشایست» (طاووسی، 1365) و «بندهش» (بهار، 1345). برای زبان پهلوی فرهنگ جامع واژگان و واژه‌نامه‌ای که شامل واژه‌های تمامی متون پهلوی با ارجاع به متن باشد، نداریم. واژهنامههای نوشته شده محدود هستند مانند «فرهنگ زبان پهلوی»، «فرهنگ کوچک پهلوی»، «دست‌نامه پهلوی» و «واژه‌نامه‌ی فارسی میانه مانوی» و «پارتی مانوی». برای بخش زیادی از متون فارسی میانه، همین پژوهش‌ها نیز انجام نشده‎است و هنوز آوانویسی و ترجمه‌ی آنها فراهم نیامده‎است که مهم‌ترینِ آنها، متون زند اوستا و بخش‌هایی از دینکرد است. همه‌ی پژوهش‌هایی تاکنون انجام شده، فقط به صورت کتاب منتشر شده‌است و اقدامی برای جمع‌آوری داده‌های زبانی آنها در یک پایگاه اطلاعاتی واحد انجام نشده‌است؛ حتی به دلیل حجم زیاد داده‌ها، واژه‌نامه‌ای جامع به صورت کتاب نیز برای متون فارسی میانه تهیه نشده‌است.
پیشینه‌ی پیکرههایی که به صورت برخط تهیه شده است: نخست: میتوان «پهلواژ» (فرهنگ جامع فارسی میانه- فارسی نو) را نام برد که نخستین واژه‌نامه‌ی برخط موجود است. در آن اطلاعات واژه‌های نُه متن فارسی میانه مشتمل بر واژه به پهلوی، آوانویسی، معنای فارسی و ارجاع به دستنویس پهلوی ثبت شده‎است. پیکرة این فرهنگ عبارت است از: «زند بهمن‌یسن»، «روایت پهلوی»، ‌«گزیده‌های زادسپرم»، «ماتیکان یوشت‌ فریان»، «ارداویراف‌نامه»، «شایست ناشایست»، «کارنامهٴ اردشیر بابکان»، «متن‌های پهلوی» و «مینوی خرد». پایگاه دیگری که تعدادی از متون پهلوی را به صورت برخط در اختیار پژوهشگران قرار می‌دهد، سایت «تزاروس زبان‎های هندواروپایی و مواد متنی» (تیتوس) است. در این پایگاه متون بسیاری از زبان‌های زنده و مرده‌ی دنیا بارگذاری شده‎است. در بخش زبان‌های ایرانیِ پایگاه تیتوس، متونی از زبان‌های اوستایی، فارسی باستان، ختنی، بلخی، سغدی، پهلوی اشکانی، فارسی میانه (پهلوی)، فارسی نو و آسی در دسترس قرار گرفته‎است. در بخش پهلوی، بجز متن‌های فارسی میانه مانوی، متون «ارداویراف‌نامه»، «اندرز اوشنر دانا»، «بندهش»، «دینکرد هفتم»، «کارنامه اردشیر بابکان»، «مینوی خرد»، «مادیان هزار دادستان»، «شایست نشایست»، «گزیده‌های زادسپرم»، «زند بهمن یسن» و «متون پهلوی» در دسترس قرار دارد. از کارهای دیگر می‌توان به وبگاه دانشگاه تگزاس و وبگاه «Wikisource» اشاره کرد. در سایت دانشگاه تگزاس در بخش آموزش آنلاین زبان‌های هندی‌اروپایی، درس‌نامه‌هایی شامل گرامر و نمونه متن و واژه‌نامه‌ی تحلیلی برای آموزش زبان‌های مختلف هندواروپایی تدوین شده‎است. از زبان‌های ایرانی، درس‌نامه‌هایی برای زبان فارسی باستان و اوستا تهیه شده و همراه با واژه‌نامه و تحلیل زبان‌شناختی کلمات متون مورد نظر بر روی سایت بارگذاری شده‎است. در وبگاه «Wikisource»، تنها، متن آوانویسی‎شده تمام اوستا بجز خرده‌اوستا (شامل وندیداد، یشت‌ها، یسنا و ویسپرد) و ستون اول کتیبه بیستون به خط میخی فارسی باستان بارگذاری شده‎است. هیچ تحلیل زبان‌شناختی از واژه‌های این متون در این سایت ارائه نشده‎است. «پهلویکا» جدیدترین فرهنگ برخطی است که برای زبان‌های ایرانی راه‌اندازی شده‎است. این وبگاه که در اواخر سال 2019 در دسترس پژوهشگران قرار گرفت، شامل واژه‌های پهلوی با حرف‌نویسی، آوانویسی، معنای انگلیسی و فارسی و نیز ریشه‌شناسی واژه‌ها است. همچنین نمونه‌های کاربرد واژه‌ها در متون به‌صورت مثال ذیل هر مدخل در حال بارگذاری و تکمیل است.
قبل از بارگذاری متون کارهایی که صورت میگیرد به شرح زیر است:
الف- ابتدا اطلاعات کامل متن مورد نظر در محیط word وارد میشود که به شرح زیر است: 1- حروفچینی آوانویسی متن فارسی میانه بر اساس یکی از نسخههای موجود؛ 2- حروفچینی برگردان فارسی متن، بر اساس ترجمه‌ی موجود؛ 3- تمام ارجاعات مربوط دستنویس و برگردان فارسی برای تمام بندهای هر فصل ذکر میشود 4- در مرحله‌ی بعد برگردان فارسی با نسخه مورد نظر مطابقت داده میشود؛ 5- بررسی برگردان فارسی و دادن یادداشت در صورت لزوم؛ پس از پایان این مرحله اطلاعات با اعضای گروه به اشتراک گذاشته میشود و کار نهایی میگردد تا در مرحله‌ی بعد اطلاعات وارد Excel شود: این مرحله نیز شامل 6- حروفچینی آوانویسی متن فارسی میانه ؛ 7- وارد کردن املای واژه به صورت حرفنویسی؛ 8- حروفچینی برگردان فارسی متن؛ 9- ذکر هزوارش یا غیر هزوارش بودن واژه؛ 10- وارد کردن تمام ارجاعات صفحه و سطر و فصل و بند؛ 11- وارد کردن بن واژه؛ 12- وارد کردن پرچسب دستوری واژه. پس از بازبینی و بررسی و نهایی شدن اطلاعات، در سایت بارگذاری میشود.
این سامانه ازطریق آدرس زیر قابل دسترسی است:
https://www.parsigdatabase.com/

رونمایی از سامانه‌ی ارزیابی برخط مهارت زبانی درک مطلب
مسعود قیومی
پژوهشگاه علوم انسانی و مطالعات فرهنگی
هدف اصلی این طرح، طراحی و پیاده‌سازی نرم‌افزار ارزیابی توانایی درک مطلب فارسی‌آموز به‌صورت پویا و تعاملی است. این مهارت جزء مهارت خواندن زبان‌آموز است. ویژگی منحصربه‌فرد این نرم‌افزار این است که زبان‌آموز و نرم‌افزار در تعامل با یکدیگر هستند؛ بنابراین، امکان ارزیابی سطح زبانی زبان‌آموز از درک مطلب توسط نرم‌افزار و بررسی نوع خطای کاربر و بررسی دانش زبانی وی وجود دارد.
مشکل اکثر نرم‌افزارهای تهیه‌شده برای آموزش و ارزیابی مهارت‌های زبانیِ زبان فارسی این است که محتوای زبانی ثابت است و بین زبان‌آموز و نرم‌افزار هیچ رابطه تعاملی وجود ندارد. به‌دلیل ثابت‌بودن سؤالات، پس‌از مدتی استفاده از این ابزارها و منابع آموزشی، امکان بررسی دقیق دانش زبانی و پیشرفت یادگیری زبان‌آموز و بررسی نوع خطای وی فراهم نمی‌گردد؛ چراکه این احتمال وجود دارد که کاربر برای پاسخ به سؤالات، از حافظه خود براساس آزمون‌های پیشین و نه دانش زبانی استفاده کند.
باتوجه‌به این که سطح زبانی زبان‌آموزان متفاوت است نیاز به تهیه آزمون‌های ارزیابی متنوع است. برای انجام این کار می‌توان در چارچوب «علوم انسانی دیجیتال»، از فناوری اطلاعات و روش‌های محاسباتی در پردازش زبان طبیعی برای تولید خودکار سؤال درک مطلب برای سطوح مختلف زبانی، از سطح مقدماتی تا پیشرفته، استفاده نمود. ذخیره‌سازی عملکرد کاربر در آزمون‌ها و استخراج اطلاعات از عملکرد موجب می‌شود بتوان دانش زبانی و پیشرفت یادگیری زبان‌آموز را رصد کرد و ضمن ترسیم نمودار آموزشی از پیشرفت وی، نقاط ضعف زبان‌آموز را مشخص کرد و درنهایت بر کاهش و رفع مشکلات وی متمرکز نمود.
در این سامانه دو دسته سؤال تعریف شده‌است که پس‌از تعیین سطح اولیه و ارائه به زبان‌آموز، پاسخ‌های داده‌شده به سؤالات توسط سامانه تصحیح و ارزیابی می‌شود: الف) سؤالات جاخالی ؛ ب) سؤالات چهارگزینه‌ای. این سؤالات براساس اشکالات زبان‌آموز یا اشکالات مشترک با سایر زبان‌آموزان به وی ارائه می‌شود. در این سامانه امکان نمایش نمودار پیشرفت زبانی برای این دو دسته سؤال و دسترسی به بایگانی آزمون‌های هر کاربر وجود دارد.
این سامانه ازطریق آدرس زیر در دسترس می‌باشد:
http://coling.ihcs.ac.ir

گزارش پنل رونمایی از وب‌سایت‎های پژوهشکده‌ی زبان‌شناسی

نظر شما :