ChineseNLP

中文情感分析 (Sentiment Analysis)

背景

情感分析 (Sentiment Analysis) 从文本中识别提取文本的主观态度信息。

示例

输入:

总的感觉这台机器还不错,实用的有:阴阳历显示,时间与日期快速转换, 记事本等。

输出:

正向 (Positive)

标准评价指标

准确度 (Accuracy)

F1-score

SemEval-2016 Task 5.

SemEval-2016 Task 5 包含2个测试集,超过5000条数码相机和手机领域的评论。

Source 主题 (Genre) # Classes Size(sentences) Size(words)
SemEval 2016 Task 5 – CAM Test 电子相机评论(中文) 3 2256 ~25k
SemEval 2016 Task 5 – PHNS Test 手机评论(中文) 3 3191 ~34k

评价指标

结果

  Accuracy(PHNS Test) Accuracy(CAM Test)
SenHint 0.7958 0.8711

相关资源

Source 主题 (Genre) # Classes Size(sentences) Size(words)
SemEval 2016 Task 5 – CAM Train 电子相机评论(中文) 3 5784 ~61k
SemEval 2016 Task 5 – PHNS Train 手机评论(中文) 3 6330 ~62k

NLP&CC 2012.

NLP&CC 2012 Test: 中文微博情感分析评测数据。

Source 主题 (Genre) # Classes Size(sentences) Topics
NLP&CC 2012 Test 微博 2 1908 10

评价指标

结果

  F1 Accuracy
Chen, et al 2018 88.35
Wang, et al 2013 63.60 74.00

相关资源

Source 主题 (Genre) # Classes Size(sentences) Size(words)
NLP&CC 2012 Train 微博 2 1765 ~116k

ChnSentiCorp.

ChnSentiCorp 包含教育,电影和住房三个领域共计1021个文档。

Source 主题 (Genre) # Classes Size(sentences) Size(words)
ChnSentiCorp Test 酒店评论(中文) 2 1999 ~725k

评价指标

结果

  F1 Accuracy  
Chen et al., 2020: 3SiBert   0.967 https://www.aclweb.org/anthology/2020.lrec-1.293.pdf
ERNIE 2.0   0.958  
ERNIE   0.954  
BERT *   0.943  
fastText ** 0.9218 0.9218  
MCCNN 0.9208 0.9208  

**BERT 准确度(Accuracy) 结果引用自 ERNIE paper.

**fastText准确度 (Accuracy) 结果引用自 MCCNN paper.

相关资源

Source 主题 (Genre) # Classes Size(sentences) Size(words)
ChnSentiCorp Train 酒店评论(中文) 2 8000 ~2.9M

IT168TEST.

IT168TEST: 一个由Zagibalov and Carroll提供的产品评论领域的数据集。 该数据集包含超过20000条评论,其中78%评论被人工标记为正向 (positive), 22%被标记为负向(negative).

Source 主题 (Genre) # Classes Size(sentences)
IT168Test 产品评论 2 29531

评价指标

结果

  F1 Accuracy
fastText* 0.9261 0.9261
MCCNN 0.9302 0.9304
Zhang, P., & He, Z. (2013) 0.9402 0.9500

*准确度 (Accuracy) 结果引用自 MCCNN paper.

Dianping.

Dianping: 一个二分类的餐厅点评数据集,4星和5星评价被归为正向评价类,1-3星的评价被归为负向评价类。

Source 主题 (Genre) # Classes Size(sentences)
Dianping 饭店评价 2 500,000

评价指标

结果

  Accuracy
Sun, Baohua, et al 77.8
Zhang and Lecun 2017 77.7

相关资源

Source 主题 (Genre) # Classes Size(sentences)
Dianping 饭店评价 2 2,000,000

JD Full.

JD Full: 京东购物评分数据集,评价范围1-5星,每个类别样本数量相同。

Source 主题 (Genre) # Classes Size(sentences)
JD Full 购物评论 5 250,000

评价指标

结果

  Accuracy
Sun, Baohua, et al 54.1
Zhang and Lecun 2017 52.0

相关资源

Source 主题 (Genre) # Classes Size(sentences)
JD Full 购物评论 5 3,000,000

JD Binary.

Source 主题 (Genre) # Classes Size(sentences)
JD Binary 购物评论 2 360,000

评价指标

结果

  Accuracy
Sun, Baohua, et al 92.2
Zhang and Lecun 2017 91.3

相关资源

Source 主题 (Genre) # Classes Size(sentences)
JD Binary 购物评论 2 4,000,000

其他资源

Name Description Domain/ Source Size (positive/ negative where applicable) Accuracy F1 Link
Chinese Sarcasm Dataset Text manually labelled as sarcastic or not news 2500 / 90 000 0.7611 0.7368 Gong et al., 2020
CH-SIMS Individually labelled multi-modal (text, video, audio) movies, TV shows 2281 video segments - 0.827 Yu et al., 2020
FiTSA Aspect-based sentiment analysis for financial news news 8314 sentences, 647 000 characters - 0.798 Yuan et al., 2020
MPDD Emotion in multi-party dialogs TV shows 25 500 utterances 0.595 - Cheng et al., 2020
MIMN Multimodal (text, image) and aspect-based analysis zol.com (shopping site) 5200 reviews 0.616 0.605 github

建议? 修改? 请发邮件到 chinesenlp.xyz@gmail.com