همشهری

مجموعه داده همشهری​​

مجموعهٔ همشهری (نسخه ۲) پیکره‌ای است حاوی ۳۱۸ هزار سند مربوط به اخبار سال‌های ۱۳۷۵ تا ۱۳۸۶ که با خزش (Crawl) وب‌سایت همشهری و ...

بی جن خان

مجموعه داده بیژن خان

پیکره بی‌جن‌خان یک پیکرهٔ برچسب‌گذاری‌شده است که برای تحقیق پردازش زبان طبیعی در زبان فارسی مناسب است. این مجموعه از اخبار و ...

محک

مجموعه داده محک

مجموعه محک وب دات‌آی‌آر توسط گروه تحقیقاتی پایگاه دادۀ دانشگاه تهران و با حمایت مرکز تحقیقات مخابرات ایران تهیه شده است و ...