考虑
- 学习概念类 ,即最多 个布尔文字的合取 。
- 布尔文字可以是变量 , ,或者是它的否定 。
- 对于 ,一个例子是合取: ,其中 表示布尔文字 .
- : 正
- : 负
- 一个正例 意味着目标概念
- 不能包含字面量 和 ,
- 也不能包含字面量 和 。
- 相比之下,负例的信息量不那么大,因为不知道它的 位中哪些是错误的。
因此,一个寻找一致假设的简单算法基于正例,并包括以下步骤: 对于每个正例 和 ,
- 如果 ,那么 被排除在概念类中的可能字面量之外,
- 如果 ,那么 被排除。 因此,所有未被排除的字面量的合取就是一个与目标一致假设。
^fig-2-4 展示了一个训练样本的示例以及对于情况 的一致假设。
图2.4
0 | 1 | ? | ? | I | 1 | |
---|---|---|---|---|---|---|
0 | 1 | 1 | 0 | 1 | 1 | + |
0 | 1 | 1 | 1 | 1 | 1 | + |
0 | 0 | 1 | 1 | 0 | 1 | - |
0 | 1 | 1 | 1 | 1 | 1 | + |
1 | 0 | 0 | 1 | 1 | 0 | - |
0 | 1 | 0 | 0 | 1 | 1 | + |
- 第一行在 列中包含 0(分别对应 1),如果所有正示例中的 项为 0(分别对应 1)。
- 如果某些正示例的 项中同时出现 0 和 1,则它包含 “?”。
- 其他六行代表六个训练示例及其标签,+ 或 -,在最后一列中指示。
因此,对于这个训练样本,文中描述的一致性算法返回的假设是 。
- 我们有 ,
- 因为每个字面量可以以肯定、否定或不包含的方式被包括。
- 将这个结果代入 一致假设的样本复杂度界限 (2.8), 得到对于任何 和 的以下样本复杂度界限: