以文本方式查看主题 - W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWL (http://bbs.xml.org.cn/index.asp) -- 『 Web挖掘技术 』 (http://bbs.xml.org.cn/list.asp?boardid=69) ---- [求助]关于weka的回归树的输出(考试,急) (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=54847) |
-- 作者:allegory -- 发布时间:11/3/2007 8:00:00 PM -- [求助]关于weka的回归树的输出(考试,急) 下面是个weka回归树的输出,每个最终节点后有个百分比,LM1 (75/3.056%)谁知道是什么吗?我考试要用,谢谢了 MMAX <= 14000 : | CACH <= 8.5 : | | MMAX <= 6100 : LM1 (75/3.056%) | | MMAX > 6100 : | | | MYCT <= 83.5 : | | | | MMAX <= 10000 : LM2 (8/2.545%) | | | | MMAX > 10000 : LM3 (3/2.137%) | | | MYCT > 83.5 : LM4 (22/3.81%) | CACH > 8.5 : | | CHMIN <= 7 : | | | MYCT <= 95 : LM5 (7/7.521%) | | | MYCT > 95 : LM6 (18/5.501%) | | CHMIN > 7 : LM7 (8/25.484%) MMAX > 14000 : | MMAX <= 22485 : | | CACH <= 27 : | | | CHMIN <= 5 : LM8 (14/3.914%) | | | CHMIN > 5 : LM9 (5/7.243%) | | CACH > 27 : LM10 (18/14.185%) | MMAX > 22485 : | | CHMIN <= 10 : | | | MYCT <= 44 : LM11 (11/25.643%) | | | MYCT > 44 : LM12 (5/7.62%) | | CHMIN > 10 : | | | MMAX <= 48000 : LM13 (11/69.192%) | | | MMAX > 48000 : LM14 (4/113.733%) |
-- 作者:DMman -- 发布时间:11/4/2007 12:19:00 PM -- 决策树可以认为分为分类树和模型树。回归树是模型树的一种特例,在叶节点存储了能预测达到叶节点的实例类值的一个线性回归模型。您使用的是cpu.arff 共209条数据。建立的回归树共有14个叶子,代表建立了14个线性模型(LM = liner model)。 如 LM1 (75/3.056%)代表 线性模型1 共有75个实例,错误率为3.056% |
-- 作者:allegory -- 发布时间:11/4/2007 3:47:00 PM -- 不是呀,比如有超过100%的是什么呢?还有,回归树是用这个叶子的全部点的平均值作为值,那么,怎么算是错误呢? |
-- 作者:DMman -- 发布时间:11/4/2007 4:42:00 PM -- 提成"错误率"确实不恰当,称为 误差 或者 方差 可能还恰当点。回归树本质就是决策树,叶子上的若干点可以建立一个线性模型,模型用来分类,肯定是要有误差的。 对线性模型的一套理论我也不是很明了了。关于线性模型的误差的理论,应该有定义的计算公式的。就比如在2维空间有N个点,然后求一条直线的方程来拟合这N个点,每个点与直线的距离就可以认为是误差,如何衡量整体误差是有公式的。 您可以下载“数据挖掘:实用机器学习技术”好像在第6章有些详细的说明
|
-- 作者:allegory -- 发布时间:11/4/2007 5:20:00 PM -- 我已经看过了,真的没有,而且,误差怎么超过的100%呢?+我msn吧,pku_allegory@hotmail.com |
-- 作者:DMman -- 发布时间:11/4/2007 5:48:00 PM -- 误差函数的计算公式就在英文版 248 页。它的值域并非限定在0-1之间 |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
46.875ms |