1
2
3
4
5
6
7
8
9
10
#1.协变量偏移,比如说我们训练集是一组真实的猫狗图像,但是测试集却给出了动画猫狗图像。
#也就是说,假设在一个与测试集的特征有本质特征的数据集上进行训练,如果没有方法来适应新的领域,可能会有麻烦。

#2.标签偏移,label shift描述了与协变量偏移相反的问题。这里我们假设标签边缘概率P(y)可以改变,但是类别条件分布P(x|y)在不同的领域保持不变
#当我们认为y导致x时,标签偏移就是一个合理的假设。比如我们判断疾病时,可以根据症状来判断,即使疾病的相对流行旅随着时间而变化。也就是疾病就是
#标签,会发生一定变化,但是症状并不改变。

#概念偏移,比如标签的定义发生变化了,例如精神疾病的诊断标准,工作头衔等


4.9.2 distribution deviation examples

1
2
3
#比如自动驾驶汽车,我们想要通过机器学习开发自动驾驶。
#当我们需要学习路沿,开发路沿检测器,有人直接把游戏中的路沿数据拿来额外的训练数据,在测试的时候也会非常有效!虽然很快就学习到了这个渲染的特征
#但在真正的应用中就是灾难。

4.9.3 distribution deviation correction

1
#这里有很多我看不懂的方法,而且目前对学习下面内容影响不大,先跑到下面去咯。