楼主: albertwishedu
120 6

[学习笔记] 充实笔记【机器学习导论 2ndEd】2019-04-02 [推广有奖]

大师

3%

还不是VIP/贵宾

-

威望
1
论坛币
57638 个
学术水平
482 点
热心指数
620 点
信用等级
402 点
经验
276855 点
帖子
16324
精华
0
在线时间
1824 小时
注册时间
2014-7-8
最后登录
2019-4-25

楼主
albertwishedu 发表于 2019-4-2 13:47:16 |只看作者 |倒序
《机器学习导论》2nd Edition ---(土耳其)Ethem Alpaydin 著 范明 昝(zan)红英 牛常勇译 ----机械Press-2014.3


我们还需要第三个数据集:检验集(test set),有时也称为发布集(publication set),它包含在训练或验证阶段未使用过的数据。
(例如现实生活中,选修一门课程时,讲授课堂上的例题构成了训练集,考试题目是验证集,我们职业生涯中解决的问题就是检验集)

训练数据是一个随机样本。即对于相同的应用,如果多次收集数据,则将得到稍微不同的数据集,拟合的h稍微不同,且具有稍微不同的验证误差。
或者,我们把固定的数据集划分成训练、验证、检验集,则根据划分方式的不同,会有不同的误差。
这些微小的区别使得我们可以估计多大的差别可以看作显著的而非偶然的。
后面会学习到如何设计机器学习实验,如何分析实验结果,得到最少受随机性影响的、统计显著的结论。

2.8 监督机器学习算法的维

归纳前续要点。我们有样本:  花x={  x t, r t } t =1 到N   t是上标。
该样本是独立同分布的(Independent and identically distributed, iid)
次序并不重要,而所有的实例都取自相同的联合分布p(x, r)
t是实例中的一个, x t是任意维的输入,而r t是相关联的预期输出。
(还没描述完)。。。


回帖推荐

充实每一天 发表于4楼  查看完整内容

点赞

经管之家编辑部 发表于3楼  查看完整内容

为您点赞!

sulight 发表于6楼  查看完整内容

谢谢分享, 训练数据是一个随机样本。即对于相同的应用,如果多次收集数据,则将得到稍微不同的数据集,拟合的h稍微不同,且具有稍微不同的验证误差。 或者,我们把固定的数据集划分成训练、验证、检验集,则根据划分方式的不同,会有不同的误差。 这些微小的区别使得我们可以估计多大的差别可以看作显著的而非偶然的。 后面会学习到如何设计机器学习实验,如何分析实验结果,得到最少受随机性影响的、统计显著的结论。

珍惜点滴 发表于7楼  查看完整内容

向您学习,赞

HappyAndy_Lo 发表于2楼  查看完整内容

为兄点赞!
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
经管之家编辑部 + 100 + 3 + 3 + 3 精彩帖子

总评分: 论坛币 + 100  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

本帖被以下文库推荐

沙发
HappyAndy_Lo 发表于 2019-4-2 13:47:56 |只看作者

为兄点赞!
回复

使用道具 举报

藤椅
经管之家编辑部 在职认证  发表于 2019-4-2 15:14:26 |只看作者
为您点赞!
回复

使用道具 举报

板凳
充实每一天 发表于 2019-4-2 15:37:26 来自手机 |只看作者
点赞
回复

使用道具 举报

报纸
从1万到一亿 在职认证  发表于 2019-4-2 18:12:02 |只看作者
回复

使用道具 举报

地板
sulight 发表于 2019-4-2 20:21:55 |只看作者
谢谢分享,
训练数据是一个随机样本。即对于相同的应用,如果多次收集数据,则将得到稍微不同的数据集,拟合的h稍微不同,且具有稍微不同的验证误差。
或者,我们把固定的数据集划分成训练、验证、检验集,则根据划分方式的不同,会有不同的误差。
这些微小的区别使得我们可以估计多大的差别可以看作显著的而非偶然的。
后面会学习到如何设计机器学习实验,如何分析实验结果,得到最少受随机性影响的、统计显著的结论。
回复

使用道具 举报

7
珍惜点滴 学生认证  发表于 2019-4-2 21:10:44 |只看作者
向您学习,赞
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-4-25 18:03
欧冠投注