多任务学习(Multi-task learning)是指通过同时学习多个任务(task)来提高模型在某一个特定任务或多个任务上的表现.
中文任务基准测评 (CLUE benchmark)是一个评估目前自然语言理解任务模型能力的benchmark. Benchmark通过评测模型在多个任务上的平均得分来衡量模型的表现.
目前最新的CLUE排行榜结果参见CLUE leaderboard.
建议? 修改? 请发邮件到chinesenlp.xyz@gmail.com