# 模型评估结论 方法一准确率: 0.6158 方法二准确率: 0.5901 方法二+时间点赞特征准确率: 0.5881 方法二负面精确率: 0.5700,负面召回率: 0.7634 优化后负面精确率: 0.5700,负面召回率: 0.7634 负面预测局限: 负样本占比可能偏低,且吐槽语义常带反讽或上下文依赖,SnowNLP弱监督标签会传递噪声。