# 模型评估结论
方法一准确率: 0.6158
方法二准确率: 0.5901
方法二+时间点赞特征准确率: 0.5881
方法二负面精确率: 0.5700，负面召回率: 0.7634
优化后负面精确率: 0.5700，负面召回率: 0.7634
负面预测局限: 负样本占比可能偏低，且吐槽语义常带反讽或上下文依赖，SnowNLP弱监督标签会传递噪声。